O que é Machine Learning?

O aprendizado de máquina (ML) impulsiona algumas das tecnologias mais importantes que usamos, desde apps de tradução até veículos autônomos. Este curso explica os conceitos básicos de ML.

O ML oferece uma nova maneira de resolver problemas, responder a perguntas complexas e criar conteúdo. A ML pode prever o clima, estimar tempos de viagem, recomendar músicas, completar frases automaticamente, resumir artigos e gerar imagens inéditas.

Em termos básicos, o ML é o processo de treinar um software, chamado de modelo, para fazer previsões úteis ou gerar conteúdo (como texto, imagens, áudio ou vídeo) com base em dados.

Por exemplo, suponha que você queira criar um app para prever a chuva. Podemos usar uma abordagem tradicional ou de ML. Usando uma abordagem tradicional, criaríamos uma representação baseada em física da atmosfera e da superfície da Terra, calculando grandes quantidades de equações de dinâmica de fluidos. Isso é incrivelmente difícil.

Usando uma abordagem de ML, daríamos a um modelo de ML enormes quantidades de dados meteorológicos até que ele aprendesse a relação matemática entre padrões climáticos que produzem quantidades diferentes de chuva. Em seguida, forneceríamos ao modelo os dados meteorológicos atuais, e ele preveria a quantidade de chuva.

Teste seu conhecimento

O que é um "modelo" em machine learning?
Um modelo é uma relação matemática derivada de dados que um sistema de ML usa para fazer previsões.
Um modelo é um hardware de computador
Um modelo é uma representação menor do que você está estudando.

Tipos de sistemas de ML

Os sistemas de ML se enquadram em uma ou mais das seguintes categorias com base em como eles aprendem a fazer previsões ou gerar conteúdo:

  • Aprendizado supervisionado
  • Aprendizado não supervisionado
  • Aprendizado por reforço
  • IA generativa

Aprendizado supervisionado

Os modelos de aprendizado supervisionado podem fazer previsões depois de analisar muitos dados com as respostas corretas e descobrir as conexões entre os elementos nos dados que produzem as respostas corretas. É como um estudante aprender um novo material estudando provas antigas que contêm perguntas e respostas. Depois que o estudante treina com exames antigos suficientes, ele está bem preparado para fazer um novo exame. Esses sistemas de ML são "supervisionados" porque um humano fornece ao sistema dados com os resultados corretos conhecidos.

Dois dos casos de uso mais comuns do aprendizado supervisionado são regressão e classificação.

Regressão

Um modelo de regressão prevê um valor numérico. Por exemplo, um modelo de clima que prevê a quantidade de chuva, em polegadas ou milímetros, é um modelo de regressão.

Confira mais exemplos de modelos de regressão na tabela abaixo:

Cenário Possíveis dados de entrada Previsão numérica
Preço futuro da casa Metragem quadrada, CEP, número de quartos e banheiros, tamanho do lote, taxa de juros da hipoteca, taxa de tributos imobiliários, custos de construção e número de casas à venda na área. O preço da casa.
Horário futuro da viagem Condições históricas de trânsito (coletadas de smartphones, sensores de trânsito, aplicativos de transporte por carro e outros aplicativos de navegação), distância do destino e condições climáticas. O tempo em minutos e segundos para chegar a um destino.

Classificação

Modelos de classificação preveem a probabilidade de algo pertencer a uma categoria. Ao contrário dos modelos de regressão, cuja saída é um número, os modelos de classificação geram um valor que indica se algo pertence ou não a uma categoria específica. Por exemplo, os modelos de classificação são usados para prever se um e-mail é spam ou se uma foto contém um gato.

Os modelos de classificação são divididos em dois grupos: classificação binária e classificação multiclasse. Os modelos de classificação binária geram um valor de uma classe que contém apenas dois valores, por exemplo, um modelo que gera rain ou no rain. Os modelos de classificação multiclasse geram um valor de uma classe que contém mais de dois valores, por exemplo, um modelo que pode gerar rain, hail, snow ou sleet.

Teste seu conhecimento

Se você quisesse usar um modelo de ML para prever o consumo de energia em edifícios comerciais, que tipo de modelo usaria?
Regressão
O uso de energia é medido em quilowatts-hora (kWh), que é um número. Portanto, use um modelo de regressão.
Classificação
Os modelos de classificação preveem se algo pertence ou não a uma categoria, enquanto os modelos de regressão preveem um número. Como o uso de energia é medido em quilowatts-hora (kWh), que é um número, use um modelo de regressão.

Aprendizado não supervisionado

Os modelos de aprendizado não supervisionado fazem previsões com base em dados que não contêm respostas corretas. O objetivo de um modelo de aprendizado não supervisionado é identificar padrões significativos entre os dados. Em outras palavras, o modelo não tem dicas sobre como categorizar cada dado, mas precisa inferir as próprias regras.

Um modelo de aprendizado não supervisionado usado com frequência emprega uma técnica chamada clustering. O modelo encontra pontos de dados que demarcam agrupamentos naturais.

Uma imagem mostrando pontos coloridos em clusters.

Figura 1. Um modelo de ML que agrupa pontos de dados semelhantes.

Uma imagem mostrando pontos coloridos em clusters que estão fechados em uma forma e se limitam.

Figura 2. Grupos de clusters com demarcações naturais.

O clustering difere da classificação porque as categorias não são definidas por você. Por exemplo, um modelo não supervisionado pode agrupar um conjunto de dados meteorológicos com base na temperatura, revelando segmentações que definem as estações do ano. Em seguida, tente nomear esses clusters com base no seu entendimento do conjunto de dados.

Uma imagem mostrando pontos coloridos em grupos rotulados como neve, chuva, granizo e sem chuva.

Figura 3. Um modelo de ML que agrupa padrões climáticos semelhantes.

Uma imagem mostrando pontos coloridos em grupos rotulados como neve, chuva, granizo e sem chuva, que estão fechados em uma forma e se limitam.

Figura 4. Agrupamentos de padrões climáticos rotulados como neve, granizo, chuva e sem chuva.

Teste seu conhecimento

O que distingue uma abordagem supervisionada de uma não supervisionada?
Uma abordagem supervisionada recebe dados que contêm a resposta correta.
Uma abordagem supervisionada recebe dados que contêm a resposta correta. O trabalho do modelo é encontrar conexões nos dados que produzam a resposta correta. Uma abordagem não supervisionada recebe dados sem a resposta correta. O trabalho dele é encontrar agrupamentos nos dados.
Uma abordagem supervisionada geralmente usa clustering.
Uma abordagem não supervisionada usa o agrupamento.
Uma abordagem não supervisionada sabe como rotular clusters de dados.
Uma abordagem não supervisionada não sabe o que os clusters de dados significam. Com base no seu entendimento dos dados, você pode definir essas categorias.

Aprendizado por reforço

Os modelos de aprendizagem por reforço fazem previsões recebendo recompensas ou penalidades com base nas ações realizadas em um ambiente. Um sistema de aprendizado por reforço gera uma política que define a melhor estratégia para receber o máximo de recompensas.

O aprendizado por reforço é usado para treinar robôs a realizar tarefas, como andar por um quarto, e programas de software, como o AlphaGo, para jogar Go.

IA generativa

A IA generativa é uma classe de modelos que cria conteúdo com base na entrada do usuário. Por exemplo, a IA generativa pode criar imagens, composições musicais e piadas exclusivas, resumir artigos, explicar como realizar uma tarefa ou editar uma foto.

A IA generativa pode receber vários tipos de entradas e criar vários tipos de saídas, como texto, imagens, áudio e vídeo. Ele também pode fazer e criar combinações deles. Por exemplo, um modelo pode usar uma imagem como entrada e criar uma imagem e texto como saída, ou usar uma imagem e texto como entrada e criar um vídeo como saída.

Podemos discutir modelos generativos pelas entradas e saídas, geralmente escritas como "tipo de entrada" para "tipo de saída". Por exemplo, a seguir está uma lista parcial de algumas entradas e saídas para modelos generativos:

  • Texto para texto
  • Texto para imagem
  • Texto para vídeo
  • Conversão de texto em código
  • Conversão de texto em voz
  • Imagem e conversão de texto em imagem

A tabela a seguir contém exemplos de modelos generativos, entradas e possíveis saídas:

Modelo Entrada Exemplo de saída
Texto para texto Quem inventou a corrida de Le Mans? As 24 Horas de Le Mans foram fundadas pelo Automobile Club de l'Ouest (ACO), uma organização automobilística criada em 1906. A primeira corrida foi realizada em 26 e 27 de maio de 1923 no Circuito de Sarthe, um circuito de estrada de 13,426 quilômetros (8,345 milhas) localizado perto da cidade de Le Mans, na França. A corrida foi originalmente concebida como uma forma de promover o ACO e a região de Sarthe.
Fonte: Bard
Texto para imagem Um polvo alienígena flutua por um portal enquanto lê um jornal. Imagem de um polvo de desenho animado.
Fonte: Imagen
Texto para vídeo Um urso de pelúcia fotorrealista está nadando no oceano em São Francisco. O ursinho de pelúcia entra na água. O ursinho de pelúcia continua nadando debaixo d'água com peixes coloridos. Um panda está nadando debaixo d'água. Vídeo de um ursinho de pelúcia nadando embaixo d'água.
Fonte: Phenaki
Conversão de texto em código Escreva um loop em Python que itere uma lista de números e mostre os números primos.
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

Fonte: Bard
Conversão de imagem em texto Imagem de um flamingo. Isso é um flamingo. Eles são encontrados no Caribe.
Fonte: Google DeepMind

Como funciona a IA generativa? Em um nível mais alto, os modelos generativos aprendem padrões em dados com o objetivo de produzir dados novos, mas semelhantes. Os modelos generativos são como os seguintes:

  • Comediantes que aprendem a imitar outras pessoas observando o comportamento e o estilo de fala delas
  • Artistas que aprendem a pintar em um estilo específico estudando muitas pinturas desse estilo
  • Bandas cover que aprendem a tocar como um grupo musical específico ouvindo muitas músicas desse grupo

Para produzir resultados únicos e criativos, os modelos generativos são treinados inicialmente usando uma abordagem não supervisionada, em que o modelo aprende a imitar os dados com que é treinado. Às vezes, o modelo é treinado ainda mais usando aprendizado supervisionado ou por reforço em dados específicos relacionados a tarefas que ele pode precisar realizar, por exemplo, resumir um artigo ou editar uma foto.

A IA generativa é uma tecnologia que evolui rapidamente, e novos casos de uso são descobertos constantemente. Por exemplo, os modelos generativos ajudam as empresas a refinar as imagens de produtos de e-commerce removendo automaticamente planos de fundo que distraem ou melhorando a qualidade de imagens de baixa resolução.