머신러닝 (ML)은 우리가 사용하는 가장 중요한 기술 중 일부의 기반입니다. 자율 주행 차량에 이르기까지 말이죠 이 과정에서는 배웠습니다
문제를 해결하고 복잡한 질문에 답하며 있습니다. ML은 날씨를 예측하고, 이동 시간을 추정하고, 노래, 문장 자동 완성, 기사 요약, 새로운 이미지를 얻을 수 있습니다.
기본적으로 ML은 학습이라고 하는 소프트웨어를 model을 사용하여 예상 검색어를 사용하거나 데이터를 수집하는 데 사용됩니다
예를 들어 강우량을 예측하는 앱을 만든다고 가정해 보겠습니다. 이제 기존 접근 방식 또는 ML 접근 방식을 사용합니다. 기존 지구 대기를 물리학 기반으로 표현하여 엄청난 양의 유체역학 방정식을 계산하게 됩니다. 이것은 정말 어려웠죠.
ML 접근 방식을 사용하면 ML 모델에 막대한 양의 날씨 데이터를 제공할 것입니다. ML 모델이 결국에는 모델 사이의 수학적 관계를 학습할 때까지 다양한 양의 강우를 생성하는 날씨 패턴 그런 다음 현재 날씨 데이터를 모델링하고 강수량을 예측합니다.
이해도 확인
ML 시스템 유형
ML 시스템은 ML 모델 아키텍처의 작동 방식에 따라 예측을 하거나 콘텐츠를 생성하는 방법을 배우게 됩니다.
- 지도 학습
- 비지도 학습
- 강화 학습
- 생성형 AI
지도 학습
지도 학습 정답이 포함된 많은 데이터를 확인한 후 모델이 예측을 할 수 있습니다. 데이터에 포함된 요소들 간의 연결고리를 발견함으로써 정답을 확인할 수 있습니다. 그것은 마치 학생이 문제와 답이 모두 포함된 오래된 시험 공부하기 학생이 이전 시험을 충분히 숙지한 경우 학생이 새 시험에 응시할 준비가 잘 된 것입니다. 이러한 ML 시스템은 '지도' 학습 인간이 ML 시스템에 ML 모델을 데이터를 추출해야 합니다.
지도 학습의 가장 일반적인 사용 사례 두 가지는 회귀와 있습니다.
회귀
회귀 모델은 숫자 값입니다. 예를 들어, 강수량을 예측하는 날씨 모델은 인치 또는 밀리미터는 회귀 모델입니다.
회귀 모델의 추가 예는 아래 표를 참고하세요.
시나리오 | 가능한 입력 데이터 | 숫자 예측 |
---|---|---|
향후 주택 가격 | 면적, 우편번호, 침실 및 욕실 수, 부지 크기, 주택담보대출 금리, 재산세율, 건설 비용 및 지역 내 매매 주택 수 | 주택 가격입니다. |
향후 탑승 시간 | 과거 교통상황 (스마트폰, 센서, 차량 호출 및 기타 내비게이션 애플리케이션), 날씨 상태 정보를 볼 수 있습니다. | 목적지에 도착하는 데 걸리는 시간(분/초)입니다. |
분류
분류 모델은 어떤 것이 카테고리에 속할 가능성입니다. 회귀 모델과 달리 출력이 숫자인 경우 분류 모델은 어떤 것이 특정 카테고리에 속하는지 여부입니다. 예를 들어 이메일이 스팸인지 사진인지 예측하는 데 사용되는 분류 모델은 고양이를 포함합니다.
분류 모델은 이진 분류와
다중 클래스 분류입니다. 이진 분류 모델은
두 개의 값만 포함하는 클래스(예:
rain
또는 no rain
다중 클래스 분류 모델은
3개 이상의 값을 포함하는 클래스(예:
rain
, hail
, snow
또는 sleet
입니다.
이해도 확인
비지도 학습
비지도 학습 모델은 올바른 값을 포함하지 않는 데이터를 주어서 예측을 수행합니다 있습니다. 비지도 학습 모델의 목표는 의미 있는 알아낼 수 있습니다. 다시 말해 이 모델은 각 데이터를 분류하지만 대신 자체 규칙을 추론해야 합니다.
일반적으로 사용되는 비지도 학습 모델에서는 클러스터링을 참조하세요. 모델이 데이터 포인트를 찾습니다. 그룹화합니다.
그림 1. 유사한 데이터 포인트를 클러스터링하는 ML 모델
그림 2. 자연스러운 경계가 있는 클러스터 그룹
클러스터링은 분류와 다른데, 이는 범주가 다음에 의해 정의되지 않기 때문입니다. 있습니다. 예를 들어 비지도 모델은 현재 위치를 기반으로 날씨 데이터 세트를 계절을 정의하는 세분화를 밝혀냅니다. 그러면 데이터 세트에 대한 이해에 따라 클러스터 이름을 지정하려고 시도할 것입니다.
그림 3. 유사한 날씨 패턴을 클러스터링하는 ML 모델
그림 4. 눈, 진눈깨비, 비가 내리고 비가 내리지 않을 것입니다.
이해도 확인
강화 학습
강화 학습 모델은 보상을 받아서 환경 내에서 수행된 작업에 따라 페널티를 받을 수도 있습니다. 지원군 학습 시스템은 이를 지원하는 정책을 가장 많은 리워드를 받기 위한 최상의 전략을 정의합니다.
강화 학습은 로봇이 걷기와 같은 작업을 수행하도록 학습시키는 데 사용됩니다. 예를 들어 방 안에서 AlphaGo Go 게임을 플레이할 수 있습니다.
생성형 AI
생성형 AI는 일종의 모델입니다. 콘텐츠를 만드는 콘텐츠를 만들 수 있습니다 예를 들어 생성형 AI는 고유한 이미지, 음악작품, 농담 기사를 요약하고, 작업 수행 방법을 설명하거나 사진을 편집할 수 있습니다.
생성형 AI는 다양한 입력을 받아 다음과 같이 다양한 출력을 생성할 수 있습니다. 오디오, 동영상을 지원합니다 또한 데이터 레이크에서 있습니다. 예를 들어 모델은 이미지를 입력으로 받아 텍스트를 출력으로 사용하거나, 이미지와 텍스트를 입력으로 가져와서 동영상을 출력으로 만듭니다.
생성 모델은 일반적으로 작성되는 입력과 출력으로 논의할 수 있습니다. '입력 유형'-'출력 유형'으로 정의합니다. 예를 들어 다음은 생성 모델의 일부 입력 및 출력 목록입니다.
- 텍스트 간 변환
- 텍스트 이미지 변환
- 텍스트 동영상 변환
- Text-to-code
- TTS(text-to-speech)
- 이미지 및 텍스트 이미지 변환
다음 표에는 생성 모델의 예, 해당 입력, 가능한 출력의 예:
모델 | 입력 | 출력 예 |
---|---|---|
텍스트 간 변환 | 르망 레이스는 누가 발명했을까요? |
르망 24시는 우에스트 자동차 클럽(Automobile Club de l'Ouest)에서 창립했다.
ACO는 1906년에 설립된 자동차 관련 조직입니다. 첫 선거가 개최되었습니다.
1923년 5월 26일과 27일 사이에 13.426km의 사르트 회로에서
프랑스 르망 인근에 있는 (13.64km) 도로입니다.
이 레이스는 원래 ACO와
사르테 리전. 출처: Bard |
텍스트 이미지 변환 | 외계 문어가 신문을 읽는 포털을 통해 떠다닙니다. |
출처: Imagen |
텍스트 동영상 변환 | 실사형 테디베어가 샌프란시스코 바다에서 헤엄치고 있습니다. 테디베어가 물속에 빠집니다. 테디베어가 계속 헤엄치고 있습니다. 물고기들이 있습니다. 물속에서 헤엄치는 판다곰 |
출처: Phenaki |
Text-to-code | 숫자 목록을 반복하고 소수를 출력하는 Python 루프를 작성합니다. |
for number in numbers: # Check if the number is prime. is_prime = True for i in range(2, number): if number % i == 0: is_prime = False break # If the number is prime, print it. if is_prime: print(number) 출처: Bard |
이미지 텍스트 변환 |
플라밍고입니다. 카리브해에서 발견됩니다. <ph type="x-smartling-placeholder"></ph> 출처: Google DeepMind |
생성형 AI는 어떻게 작동하나요? 생성 모델은 대략적으로 새롭지만 유사한 데이터를 생성하는 것을 목표로 하는 데이터 패턴입니다. 생성형 모델은 다음과 같습니다.
- 타인의 행동을 관찰하여 타인을 모방하는 방법을 배우는 코미디언 말하기 스타일
- 다양한 기술을 공부하여 특정 스타일로 회화하는 방법을 배우는 예술가 회화 작품
- 음악을 들으며 특정 음악 그룹처럼 들리는 법을 배우는 커버 밴드 그 그룹의 음악이 많다는 점
고유하고 창의적인 출력을 생성하기 위해 생성 모델은 처음에는 비지도 접근 방식을 사용합니다. 이 접근 방식에서는 모델이 데이터를 모방하도록 학습합니다. Vertex AI Feature Store에서 제공되는 모델은 종종 지도 또는 모델이 수행될 수 있는 작업과 관련된 특정 데이터에 대한 강화 학습 기사를 요약하거나 사진을 편집하는 등의 작업을 하도록 요청할 수 있습니다.
생성형 AI는 빠르게 진화하는 기술이며 끊임없이 새로운 사용 사례가 발생함 있습니다. 예를 들어 생성형 모델은 기업이 방해가 되는 배경을 자동으로 삭제하여 전자상거래 제품 이미지 저해상도 이미지의 품질을 개선할 수 있습니다