O que é Machine Learning?

O machine learning (ML) é a base de algumas das tecnologias mais importantes que usamos, desde apps de tradução a veículos autônomos. Neste curso, explicamos os principais conceitos do ML.

O ML oferece uma nova maneira de resolver problemas, responder a perguntas complexas e criar conteúdo. O ML pode prever o clima, estimar tempos de viagem, recomendar músicas, completar automaticamente frases, resumir artigos e gerar imagens inéditas.

Em termos básicos, ML é o processo de treinar um software, chamado de model, para fazer previsões úteis ou gerar conteúdo com base em dados.

Por exemplo, suponha que você queira criar um aplicativo para prever chuvas. Poderíamos usar uma abordagem tradicional ou uma abordagem de ML. Usando uma abordagem tradicional, criaríamos uma representação física da atmosfera e da superfície da Terra, calculando grandes quantidades de equações da dinâmica dos fluidos. Isso é incrivelmente difícil.

Usando uma abordagem de ML, forneceríamos enormes quantidades de dados meteorológicos até que ele aprendesse a relação matemática entre padrões climáticos que produzem diferentes quantidades de chuva. Daríamos, então, ao modelo os dados meteorológicos atuais, e ele faria uma previsão da quantidade de chuva.

Teste seu conhecimento

O que é um "modelo" em machine learning?
Um modelo é uma relação matemática derivada de dados que um sistema de ML usa para fazer previsões
Um modelo é um hardware de computador
Um modelo é uma representação menor do que você está estudando.

Tipos de sistemas de ML

Os sistemas de ML se enquadram em uma ou mais das seguintes categorias com base em como eles aprendem a fazer previsões ou gerar conteúdo:

  • Aprendizado supervisionado
  • Aprendizado não supervisionado
  • Aprendizado por reforço
  • IA generativa

Aprendizado supervisionado

Os modelos de aprendizado supervisionado podem fazer previsões depois de ver muitos dados com as respostas corretas e descobrir as conexões entre os elementos nos dados que produzem as respostas corretas. Isso é como um estudante que está aprendendo um novo material estudando provas antigas que contêm perguntas e respostas. Depois de treinar com exames antigos suficientes, o aluno está bem preparado para fazer um novo exame. Esses sistemas de ML são "supervisionados" no sentido de que um ser humano fornece os dados do sistema de ML com os resultados corretos conhecidos.

Dois dos casos de uso mais comuns para aprendizado supervisionado são de regressão e classificação.

Regressão

Um modelo de regressão prevê um valor numérico. Por exemplo, um modelo meteorológico que prevê a quantidade de chuva, em polegadas ou milímetros, é um modelo de regressão.

Consulte a tabela abaixo para mais exemplos de modelos de regressão:

Cenário Possíveis dados de entrada Previsão numérica
Preço da casa futura Metragem quadrada, CEP, número de quartos e banheiros, tamanho do lote, taxa de juros hipotecário, taxa de impostos sobre propriedades, custos de construção e número de casas à venda na área. O preço da casa.
Tempo de viagem futuro Histórico das condições de trânsito (coletadas de smartphones, sensores de trânsito, transporte por aplicativo e outros aplicativos de navegação), distância do destino e condições climáticas. Tempo em minutos e segundos para chegar a um destino.

Classificação

Os modelos de classificação preveem a probabilidade de que algo pertença a uma categoria. Ao contrário dos modelos de regressão, que têm a saída como um número, os modelos de classificação geram um valor que indica se algo pertence ou não a uma categoria específica. Por exemplo, os modelos de classificação são usados para prever se um e-mail é spam ou se uma foto contém um gato.

Os modelos de classificação são divididos em dois grupos: classificação binária e multiclasse. Os modelos de classificação binária geram um valor de uma classe que contém apenas dois valores, por exemplo, um modelo que gera rain ou no rain. Os modelos de classificação multiclasse geram um valor de uma classe que contém mais de dois valores. Por exemplo, um modelo que pode gerar rain, hail, snow ou sleet.

Teste seu conhecimento

Se você quisesse usar um modelo de ML para prever o uso de energia em edifícios comerciais, que tipo de modelo usaria?
Regressão
O uso de energia é medido em quilowatt-hora (kWh), que é um número. Use um modelo de regressão.
Classificação
Os modelos de classificação preveem se algo pertence ou não a uma categoria, enquanto os modelos de regressão preveem um número. Como o uso de energia é medido em quilowatt-hora (kWh), que é um número, use um modelo de regressão.

Aprendizado não supervisionado

Os modelos de aprendizado não supervisionado fazem previsões ao receber dados que não contêm respostas corretas. O objetivo de um modelo de aprendizado não supervisionado é identificar padrões significativos entre os dados. Em outras palavras, o modelo não tem dicas sobre como categorizar cada dado, mas, em vez disso, precisa inferir as próprias regras.

Um modelo de aprendizado não supervisionado usado com frequência usa uma técnica chamada clustering. O modelo encontra pontos de dados que demarcam agrupamentos naturais.

Uma imagem mostrando pontos coloridos em grupos.

Figura 1. Um modelo de ML que agrupa pontos de dados semelhantes.

Uma imagem mostrando pontos coloridos em grupos fechados em uma forma e que se limitam entre si.

Figura 2. Grupos de clusters com demarcações naturais.

O clustering é diferente da classificação porque as categorias não são definidas por você. Por exemplo, um modelo não supervisionado pode agrupar um conjunto de dados meteorológicos com base na temperatura, revelando segmentações que definem as estações. Em seguida, tente nomear esses clusters com base na sua compreensão do conjunto de dados.

Uma imagem mostrando pontos coloridos em grupos rotulados como neve, chuva, granizo e nenhuma chuva.

Figura 3. Um modelo de ML que agrupa padrões climáticos semelhantes.

Uma imagem mostrando pontos coloridos em grupos rotulados como neve, chuva, granizo e nenhuma chuva, dentro de uma forma e nas bordas.

Figura 4. Clusters de padrões climáticos rotulados como neve, granizo, chuva e nenhuma chuva.

Teste seu conhecimento

O que diferencia uma abordagem supervisionada de uma não supervisionada?
Uma abordagem supervisionada recebe dados que contêm a resposta correta.
Uma abordagem supervisionada recebe dados que contêm a resposta correta. A tarefa do modelo é encontrar conexões nos dados que produzam a resposta correta. Uma abordagem não supervisionada recebe dados sem a resposta correta. A função dele é encontrar agrupamentos nos dados.
Uma abordagem supervisionada geralmente usa clustering.
Uma abordagem não supervisionada usa clustering.
Uma abordagem não supervisionada sabe como rotular clusters de dados.
Uma abordagem não supervisionada não sabe o que os clusters de dados significam. Com base em seu entendimento dos dados, cabe a você defini-los.

Aprendizado por reforço

Os modelos de aprendizado por reforço fazem previsões recebendo recompensas ou penalidades com base nas ações realizadas em um ambiente. Um sistema de aprendizado por reforço gera uma política que define a melhor estratégia para receber o maior número de recompensas.

O aprendizado por reforço é usado para treinar robôs para executar tarefas, como caminhar pela sala, e programas de software, como o AlphaGo, para jogar Go.

IA generativa

A IA generativa é uma classe de modelos que cria conteúdo com base na entrada do usuário. Por exemplo, ela pode criar imagens, composições musicais e piadas únicas, além de resumir artigos, explicar como realizar uma tarefa ou editar uma foto.

A IA generativa pode usar uma variedade de entradas e criar diversas saídas, como texto, imagens, áudio e vídeo. Ele também pode pegar e criar combinações deles. Por exemplo, um modelo pode usar uma imagem como entrada e criar uma imagem e um texto como saída ou usar uma imagem e um texto como entrada e criar um vídeo como saída.

Podemos discutir modelos generativos por entradas e saídas, normalmente escritos como "tipo de entrada" para "tipo de saída". Por exemplo, confira a seguir uma lista parcial de algumas entradas e saídas para modelos generativos:

  • Texto para texto
  • Texto para imagem
  • Texto para vídeo
  • Texto para código
  • Conversão de texto em voz
  • Conversão de imagem e texto em imagem

A tabela a seguir lista exemplos de modelos generativos, as entradas deles e um exemplo das possíveis saídas:

Modelo Entrada Exemplo de saída
Texto para texto Quem inventou a corrida de Le Mans? As 24 Horas de Le Mans foram fundadas pelo Automobile Club de l'Ouest (ACO), uma organização automotiva fundada em 1906. A primeira corrida aconteceu nos dias 26 e 27 de maio de 1923 no Circuito Sarthe, um circuito rodoviário de 13,426 quilômetros localizado perto da cidade de Le Mans, na França. A corrida foi concebida originalmente como uma forma de promover o ACO e a região de Sarthe.
Fonte: Bard
Texto para imagem Um polvo alienígena flutua por um portal lendo um jornal. Imagem de um polvo em desenho animado.
Fonte: Imagen
Texto para vídeo Um urso de pelúcia fotorrealista nadando no oceano em São Francisco. O ursinho de pelúcia vai debaixo d'água. O ursinho de pelúcia fica nadando de baixo d'água com peixes coloridos. Um urso panda nadando debaixo d'água. Vídeo de um urso de pelúcia nadando debaixo d'água.
Fonte: Phenaki
Texto para código Escreva um loop em Python que repete uma lista de números e exibe os números primos.
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

Fonte: Bard
Conversão de imagem em texto Imagem de um flamingo. Este é um flamingo. Eles são encontrados no Caribe.
Fonte: Google DeepMind

Como funciona a IA generativa? De modo geral, os modelos generativos aprendem padrões de dados com o objetivo de produzir dados novos, mas semelhantes. Os modelos generativos são como estes:

  • Comediantes que aprendem a imitar os outros observando o comportamento e o estilo de fala
  • Artistas que aprendem a pintar em um estilo específico, estudando muitas pinturas nesse estilo
  • Bandas cover que aprendem a soar como um grupo musical específico ouvindo várias músicas desse grupo

Para produzir saídas únicas e criativas, os modelos generativos são inicialmente treinados usando uma abordagem não supervisionada, em que o modelo aprende a imitar os dados usados. Às vezes, o modelo é treinado mais detalhadamente usando o aprendizado supervisionado ou por reforço em dados específicos relacionados a tarefas que podem ser solicitadas. Por exemplo, resumir um artigo ou editar uma foto.

A IA generativa é uma tecnologia em rápida evolução, com novos casos de uso sendo descobertos constantemente. Por exemplo, os modelos generativos ajudam as empresas a refinar as imagens de produtos de e-commerce removendo automaticamente planos de fundo que causam distração ou melhorando a qualidade de imagens de baixa resolução.