O que é Machine Learning?

O machine learning (ML) é usado em algumas das tecnologias mais importantes que usamos, desde apps de tradução a veículos autônomos. Este curso explica os principais conceitos de ML.

O ML oferece uma nova maneira de resolver problemas, responder a perguntas complexas e criar conteúdo. o ML pode prever o clima, estimar os tempos de viagem, recomendar músicas, completar frases automaticamente, resumir artigos e gerar imagens inéditas.

Em termos básicos, ML é o processo treinar um software, chamado model, para tornar previsões ou gerar conteúdo com dados.

Por exemplo, suponha que queremos criar um aplicativo para prever chuvas. Nós poderíamos podem usar uma abordagem tradicional ou de ML. Com uma abordagem tradicional poderia criar uma representação física da atmosfera da Terra e superfície, calculando grandes quantidades de equações da dinâmica dos fluidos. Isso é incrivelmente difícil.

Usando uma abordagem de ML, forneceríamos a um modelo de ML grandes quantidades de dados meteorológicos até que o modelo de ML finalmente aprendeu a relação matemática entre padrões climáticos que produzem diferentes quantidades de chuva. Em seguida, daríamos modelar os dados meteorológicos atuais e prever a quantidade de chuva.

Teste seu conhecimento

O que é um "modelo" em machine learning?
Um modelo é uma relação matemática derivada de dados que um ML que o sistema usa para fazer previsões
Um modelo é um hardware de computador
Um modelo é uma representação menor do que você está estudando.

Tipos de sistemas de ML

Os sistemas de ML se enquadram em uma ou mais das seguintes categorias com base em como eles aprender a fazer previsões ou gerar conteúdo:

  • Aprendizado supervisionado
  • Aprendizado não supervisionado
  • Aprendizado por reforço
  • IA generativa

Aprendizado supervisionado

Aprendizado supervisionado os modelos podem fazer previsões depois de ver muitos dados com respostas corretas e, em seguida, descobrir as conexões entre os elementos nos dados que a produzir as respostas corretas. É como um aluno aprendendo um novo material, estudar exames antigos que contêm perguntas e respostas. Depois que o aluno com exames antigos suficientes, o aluno estará preparado para fazer um novo exame. Esses sistemas de ML são "supervisionados", no sentido de que uma pessoa dá ao sistema de ML dados com os resultados corretos conhecidos.

Dois dos casos de uso mais comuns do aprendizado supervisionado são regressão e classificação.

Regressão

Um modelo de regressão prevê um valor numérico. Por exemplo, um modelo meteorológico que prevê a quantidade de chuva em polegadas ou milímetros, é um modelo de regressão.

Consulte a tabela abaixo para mais exemplos de modelos de regressão:

Cenário Possíveis dados de entrada Previsão numérica
Preço da casa futura Metragem quadrada, CEP, número de quartos e banheiros, tamanho do terreno, taxa de juros hipotecários, taxa de imposto sobre propriedade, custos de construção e número de casas à venda na área. O preço da casa.
Hora do passeio futuro Histórico de condições de trânsito (coletado de smartphones, tráfego sensores, transporte por aplicativo e outros aplicativos de navegação), distância de seu destino e as condições climáticas. O tempo em minutos e segundos para chegar a um destino.

Classificação

Os modelos de classificação preveem a probabilidade de algo pertencer a uma categoria. Ao contrário dos modelos de regressão, cuja saída é um número, os modelos de classificação geram um valor se algo pertence ou não a uma categoria específica. Por exemplo: são usados para prever se um e-mail é spam ou se uma foto contém um gato.

Os modelos de classificação são divididos em dois grupos: classificação binária e classificação multiclasse. Os modelos de classificação binária produzem um valor de que contenha apenas dois valores, por exemplo, um modelo que gera rain ou no rain. Os modelos de classificação multiclasse geram um valor que contenha mais de dois valores, por exemplo, um modelo que pode gerar rain, hail, snow ou sleet.

Teste seu conhecimento

Se você quiser usar um modelo de ML para prever o uso de energia em construções, que tipo de modelo você usaria?
Regressão
O uso de energia é medido em quilowatts-hora (kWh), que é um número, Portanto, é melhor usar um modelo de regressão.
Classificação
Os modelos de classificação preveem se algo pertence ou não a uma categoria, enquanto os modelos de regressão preveem um número. Como o uso de energia é medido em quilowatt-hora (kWh), que é um número, você usaria um modelo de regressão.

Aprendizado não supervisionado

Aprendizado não supervisionado modelos fazem previsões recebendo dados que não contêm nenhuma respostas O objetivo de um modelo de aprendizado não supervisionado é identificar entre os dados. Em outras palavras, o modelo não tem dicas sobre como categorizar cada dado, mas, em vez disso, deve inferir suas próprias regras.

Um modelo de aprendizado não supervisionado muito usado emprega uma técnica chamada clustering. O modelo encontra pontos de dados que demarcam agrupamentos naturais.

Uma imagem mostrando pontos coloridos em agrupamentos.

Figura 1. Um modelo de ML agrupando pontos de dados semelhantes.

Uma imagem que mostra pontos coloridos em grupos cercados por uma forma e cercados por uma forma.

Figura 2. Grupos de clusters com demarcações naturais.

O clustering difere da classificação porque as categorias não são definidas por para você. Por exemplo, um modelo não supervisionado pode agrupar um conjunto de dados climáticos com base temperatura, revelando segmentações que definem as estações. Em seguida, é possível tente nomear esses clusters com base em sua compreensão do conjunto de dados.

Uma imagem que mostra pontos coloridos em grupos rotulados como neve, chuva, granizo e nenhuma chuva.

Figura 3. Um modelo de ML que agrupa padrões climáticos semelhantes.

Uma imagem que mostra pontos coloridos em aglomerados rotulados como neve, chuva, granizo e neve, cercados por uma forma e cercados.

Figura 4. Clusters de padrões climáticos rotulados como neve, granizo chuva e sem chuva.

Teste seu conhecimento

O que diferencia uma abordagem supervisionada de uma não supervisionada?
Uma abordagem supervisionada recebe dados que contêm a resposta correta.
Uma abordagem supervisionada recebe dados que contêm a resposta correta. O trabalho do modelo é encontrar conexões nos dados que produzam as responder. Na abordagem não supervisionada, são fornecidos dados sem a resposta correta. A função dele é encontrar agrupamentos nos dados.
Uma abordagem supervisionada geralmente usa clustering.
Uma abordagem não supervisionada usa clustering.
Uma abordagem não supervisionada sabe como rotular clusters de dados.
Uma abordagem não supervisionada não sabe o que os clusters de dados significam. Com base em sua compreensão dos dados, cabe a você defini-los.

Aprendizado por reforço

Aprendizado por reforço modelos fazem previsões recebendo recompensas ou penalidades com base nas ações realizadas em um ambiente. Um reforço de machine learning gera uma política que define a melhor estratégia para receber o máximo de recompensas.

O aprendizado por reforço é usado para treinar robôs para realizar tarefas, como caminhar em uma sala e programas de software, como AlphaGo para jogar Go.

IA generativa

A IA generativa é uma classe de modelos que cria conteúdo com base na entrada do usuário. Por exemplo, a IA generativa pode criar imagens exclusivas, composições musicais e piadas; ele pode resumir artigos, explicar como realizar uma tarefa ou editar uma foto.

A IA generativa pode usar uma variedade de entradas e criar uma variedade de saídas, como como textos, imagens, áudio e vídeo. Ele também pode pegar e criar combinações de essas. Por exemplo, um modelo pode usar uma imagem como entrada e criar uma imagem e como saída ou usar imagem e texto como entrada e criar um vídeo como saída.

Podemos discutir modelos generativos por entradas e saídas, geralmente escritas como "tipo de entrada" para "tipo de saída". Por exemplo, o seguinte é um valor parcial lista de algumas entradas e saídas para modelos generativos:

  • Texto para texto
  • Texto para imagem
  • Texto para vídeo
  • Texto para código
  • Conversão de texto em voz
  • Imagem e texto para imagem

A tabela a seguir lista exemplos de modelos generativos, as entradas deles e uma exemplo de uma possível saída:

Modelo Entrada Exemplo de saída
Texto para texto Quem inventou a corrida de Le Mans? As 24 Horas de Le Mans foram fundadas pelo Automobile Club de l'Ouest (ACO), uma empresa automobilística fundada em 1906. A primeira corrida foi realizada em 26 e 27 de maio de 1923, no Circuito de Sarthe, um circuito de 13,426 quilômetros 12 km, localizado perto da cidade de Le Mans, na França. A corrida foi concebida originalmente como uma forma de promover a ACO e a Região Sarthe.
Fonte: Bard
Texto para imagem Um polvo alienígena flutua por um portal lendo um jornal. Imagem de um desenho de polvo. e
Fonte: Imagen
Texto para vídeo Um urso de pelúcia fotorrealista nadando no oceano em São Francisco. O ursinho de pelúcia fica debaixo d'água. O urso de pelúcia continua nadando na água com peixes coloridos. Um urso panda nadando debaixo d'água. Vídeo de um urso de pelúcia nadando debaixo d'água. e
Fonte: Phenaki
Texto para código Escreva uma repetição em Python que gera um loop em uma lista de números e mostra os números primos.
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)
e
Fonte: Bard
Conversão de imagem em texto Imagem de um flamingo. Este é um flamingo. Elas são encontradas no Caribe.
Fonte: Google DeepMind

Como funciona a IA generativa? De modo geral, os modelos generativos aprendem padrões em dados com o objetivo de produzir dados novos, mas semelhantes. Generativa são semelhantes a estes:

  • Comediantes que aprendem a imitar outras pessoas observando os comportamentos e estilo de fala
  • Artistas que aprendem a pintar em um estilo específico estudando muitas pinturas nesse estilo
  • Bandas cover que aprendem a soar como um grupo musical específico ouvindo muitas músicas desse grupo

Para produzir resultados únicos e criativos, os modelos generativos são treinados inicialmente usando uma abordagem não supervisionada, em que o modelo aprende a imitar os dados para o treinamento. Às vezes, o modelo é treinado com recursos aprendizado por reforço sobre dados específicos relacionados a tarefas que o modelo pode estar para realizar, por exemplo, resumir um artigo ou editar uma foto.

A IA generativa é uma tecnologia em rápida evolução com novos casos de uso constantemente serem descobertos. Por exemplo, os modelos generativos estão ajudando as empresas a refinar as imagens dos produtos de e-commerce removendo automaticamente planos de fundo que causam distração ou melhorar a qualidade de imagens de baixa resolução.