O que é Machine Learning?

O machine learning (ML) em algumas das tecnologias mais importantes que usamos, de apps de tradução a veículos autônomos. Neste curso, explicamos os principais conceitos do ML.

O ML oferece uma nova maneira de resolver problemas, responder a perguntas complexas e criar conteúdo. O ML pode prever o clima, estimar o tempo de viagem, recomendar músicas, preencher frases automaticamente, resumir artigos e gerar imagens inéditas.

Em termos básicos, ML é o processo de treinar um software, chamado de model, para fazer previsões úteis ou gerar conteúdo a partir de dados.

Por exemplo, suponha que você queira criar um aplicativo para prever chuva. Poderíamos usar uma abordagem tradicional ou de ML. Usando uma abordagem tradicional, criaríamos uma representação baseada em física da atmosfera e da superfície da Terra, calculando grandes quantidades de equações da dinâmica dos fluidos. Isso é incrivelmente difícil.

Usando uma abordagem de ML, daríamos a um modelo de ML grandes quantidades de dados meteorológicos até que o modelo de ML finalmente aprendeu a relação matemática entre padrões climáticos que produzem diferentes quantidades de chuva. Daria ao modelo os dados meteorológicos atuais, e ele preveria a quantidade de chuva.

Teste seu conhecimento

O que é um "modelo" em machine learning?
Um modelo é uma relação matemática derivada de dados que um sistema de ML usa para fazer previsões
Um modelo é um hardware de computador
Um modelo é uma representação menor do que você está estudando.

Tipos de sistemas de ML

Os sistemas de ML se enquadram em uma ou mais das seguintes categorias com base em como eles aprendem a fazer previsões ou gerar conteúdo:

  • Aprendizado supervisionado
  • Aprendizado não supervisionado
  • Aprendizado por reforço
  • IA generativa

Aprendizado supervisionado

Os modelos de aprendizado supervisionado podem fazer previsões depois de ver muitos dados com as respostas corretas e descobrir as conexões entre os elementos nos dados que produzem as respostas corretas. Isso é como um estudante que está aprendendo um novo material estudando exames antigos que contêm perguntas e respostas. Depois que o aluno tiver treinado em exames antigos suficientes, ele estará bem preparado para fazer um novo exame. Esses sistemas de ML são "supervisionados" no sentido de que um ser humano fornece os dados do sistema de ML com os resultados corretos conhecidos.

Dois dos casos de uso mais comuns para aprendizado supervisionado são regressão e classificação.

Regressão

Um modelo de regressão prevê um valor numérico. Por exemplo, um modelo meteorológico que prevê a quantidade de chuva, em polegadas ou milímetros, é um modelo de regressão.

Consulte a tabela abaixo para mais exemplos de modelos de regressão:

Cenário Possíveis dados de entrada Previsão numérica
Preço futuro da casa Mesas quadradas, CEP, número de quartos e banheiros, tamanho do lote, taxa de juros de hipoteca, taxa de impostos sobre propriedades, custos de construção e número de casas à venda na área. O preço da casa.
Horário da viagem futura Histórico de condições de trânsito (coletadas por smartphones, sensores de trânsito, serviços de transporte por aplicativo e outros aplicativos de navegação), distância do destino e condições climáticas. O tempo em minutos e segundos para chegar a um destino.

Classificação

Os modelos de classificação preveem a probabilidade de que algo pertença a uma categoria. Ao contrário dos modelos de regressão, em que a saída é um número, os modelos de classificação geram um valor que indica se algo pertence ou não a uma categoria específica. Por exemplo, os modelos de classificação são usados para prever se um e-mail é spam ou se uma foto contém um gato.

Os modelos de classificação são divididos em dois grupos: classificação binária e multiclasse. Os modelos de classificação binária geram um valor de uma classe que contém apenas dois valores, por exemplo, um modelo que gera rain ou no rain. Os modelos de classificação multiclasse geram um valor de uma classe que contém mais de dois valores. Por exemplo, um modelo que pode gerar rain, hail, snow ou sleet.

Teste seu conhecimento

Que tipo de modelo você usaria se quisesse usar um modelo de ML para prever o uso de energia em edifícios comerciais?
Regressão
O uso de energia é medido em quilowatt-hora (kWh), que é um número. Use um modelo de regressão.
Classificação
Os modelos de classificação preveem se algo pertence ou não a uma categoria, enquanto os modelos de regressão preveem um número. Como o uso de energia é medido em quilowatt-hora (kWh), que é um número, use um modelo de regressão.

Aprendizado não supervisionado

Os modelos de aprendizado não supervisionado fazem previsões recebendo dados que não contêm respostas corretas. O objetivo de um modelo de aprendizado não supervisionado é identificar padrões significativos entre os dados. Em outras palavras, o modelo não tem dicas sobre como categorizar cada dado, mas precisa inferir as próprias regras.

Um modelo de aprendizado não supervisionado muito usado emprega uma técnica chamada clustering. O modelo encontra pontos de dados que demarcam agrupamentos naturais.

Uma imagem mostrando pontos coloridos em clusters.

Figura 1. Um modelo de ML que faz o clustering de pontos de dados semelhantes.

Imagem mostrando pontos coloridos em clusters cercados por uma forma e lado a lado.

Figura 2. grupos de clusters com demarcações naturais.

O clustering é diferente da classificação porque as categorias não são definidas por você. Por exemplo, um modelo não supervisionado pode agrupar um conjunto de dados climáticos com base na temperatura, revelando segmentações que definem as estações. Em seguida, tente nomeá-los com base na sua compreensão do conjunto de dados.

Uma imagem mostrando pontos coloridos em grupos rotulados como neve, chuva, granizo e sem chuva.

Figura 3. Um modelo de ML que agrupa padrões climáticos semelhantes.

Uma imagem mostrando pontos coloridos em clusters rotulados como neve, chuva, granizo e nenhuma chuva, colocados em uma forma e lado a lado.

Figura 4. Clusters de padrões climáticos rotulados como neve, granizo, chuva e nenhuma chuva.

Teste seu conhecimento

O que diferencia uma abordagem supervisionada de uma não supervisionada?
Uma abordagem supervisionada recebe dados que contêm a resposta correta.
Uma abordagem supervisionada recebe dados que contêm a resposta correta. O trabalho do modelo é encontrar conexões nos dados que produzam a resposta correta. Uma abordagem não supervisionada recebe dados sem a resposta correta. A função dele é encontrar agrupamentos nos dados.
Uma abordagem supervisionada normalmente usa clustering.
Uma abordagem não supervisionada usa clustering.
Uma abordagem não supervisionada sabe como rotular clusters de dados.
Uma abordagem não supervisionada não sabe o que os clusters de dados significam. Com base em sua compreensão dos dados, cabe a você defini-los.

Aprendizado por reforço

Os modelos de aprendizado por reforço fazem previsões recebendo recompensas ou penalidades com base nas ações realizadas em um ambiente. Um sistema de aprendizado por reforço gera uma política que define a melhor estratégia para receber o máximo de recompensas.

O aprendizado por reforço é usado para treinar robôs para executar tarefas, como caminhar ao redor de uma sala, e programas de software, como o AlphaGo, para jogar Go.

IA generativa

A IA generativa é uma classe de modelos que cria conteúdo com base na entrada do usuário. Por exemplo, a IA generativa pode criar novas imagens, composições musicais e piadas, além de resumir artigos, explicar como realizar uma tarefa ou editar uma foto.

A IA generativa pode receber uma variedade de entradas e criar uma variedade de saídas, como texto, imagens, áudio e vídeo. Ele também pode pegar e criar combinações deles. Por exemplo, um modelo pode usar uma imagem como entrada e criar uma imagem e um texto como saída, ou usar uma imagem e um texto como entrada e criar um vídeo como saída.

Podemos discutir modelos generativos por entradas e saídas, geralmente escritas como "tipo de entrada" para "tipo de saída". Confira a seguir uma lista parcial de algumas entradas e saídas para modelos generativos:

  • Texto para texto
  • Texto para imagem
  • Texto para vídeo
  • Texto para código
  • Conversão de texto em voz
  • Imagem e texto em imagem

A tabela a seguir lista exemplos de modelos generativos, as entradas deles e um exemplo das possíveis saídas:

Modelo Entrada Exemplo de saída
Texto para texto Quem inventou a corrida de Le Mans? As 24 Horas de Le Mans foram fundadas pelo Automobile Club de l'Ouest (ACO), uma montadora de automóveis, fundada em 1906. A primeira corrida foi realizada nos dias 26 e 27 de maio de 1923 no Circuito Sarthe, um circuito de 13,426 quilômetros localizado perto da cidade de Le Mans, na França. A corrida foi concebida originalmente como forma de promover o ACO e a região de Sarthe.
Fonte: Bard
Texto para imagem Um polvo alienígena flutua por um portal lendo um jornal. Imagem de um desenho de um polvo.
Fonte: Imagen
Texto para vídeo Um urso de pelúcia fotorrealista nadando no oceano em São Francisco. O urso de pelúcia vai debaixo d'água. O urso de pelúcia continua nadando debaixo d'água com peixes coloridos. Um urso panda nadando debaixo d'água. Vídeo de um urso de pelúcia nadando embaixo d'água.
Fonte: Phenaki
Texto para código Escreva um loop em Python que executa uma lista de números e mostra os números primos.
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

Fonte: Bard
Conversão de imagem em texto Imagem de um flamingo. Este é um flamingo. Eles são encontrados no Caribe.
Fonte: Google DeepMind

Como funciona a IA generativa? Em um alto nível, os modelos generativos aprendem padrões de dados com o objetivo de produzir dados novos, mas semelhantes. Os modelos generativos são assim:

  • Comediantes que aprendem a imitar os outros, observando o comportamento e o estilo de fala das pessoas.
  • Artistas que aprendem a pintar em um estilo específico estudando muitas pinturas nesse estilo
  • Bandas cover que aprendem a soar como um grupo musical específico ouvindo muitas músicas desse grupo

Para produzir resultados exclusivos e criativos, os modelos generativos são treinados inicialmente usando uma abordagem não supervisionada, em que aprendem a imitar os dados usados. Às vezes, o modelo é treinado mais usando aprendizado supervisionado ou por reforço em dados específicos relacionados a tarefas que o modelo pode receber, como resumir um artigo ou editar uma foto.

A IA generativa é uma tecnologia em rápida evolução com novos casos de uso sendo descobertos constantemente. Por exemplo, os modelos generativos ajudam as empresas a refinar as imagens de produtos de e-commerce removendo automaticamente planos de fundo que causam distração ou melhorando a qualidade de imagens de baixa resolução.