O que é Machine Learning?

O aprendizado de máquina (ML) é a base de algumas das tecnologias mais importantes que usamos, de apps de tradução a veículos autônomos. Este curso explica os principais conceitos por trás da ML.

O ML oferece uma nova maneira de resolver problemas, responder a perguntas complexas e criar novo conteúdo. O ML pode prever o clima, estimar tempos de viagem, recomendar músicas, preencher frases automaticamente, resumir artigos e gerar imagens nunca vistas.

Em termos básicos, o ML é o processo de treinar um software, chamado de modelo, para fazer previsões úteis ou gerar conteúdo com base em dados.

Por exemplo, suponha que queremos criar um app para prever a chuva. Poderíamos usar uma abordagem tradicional ou de ML. Usando uma abordagem tradicional, criaríamos uma representação baseada em física da atmosfera e da superfície da Terra, calculando grandes quantidades de equações de dinâmica de fluidos. Isso é incrivelmente difícil.

Usando uma abordagem de ML, forneceríamos ao modelo de ML grandes quantidades de dados meteorológicos até que ele aprendesse a relação matemática entre padrões climáticos que produzem diferentes quantidades de chuva. Em seguida, fornecemos ao modelo os dados meteorológicos atuais, e ele previu a quantidade de chuva.

Teste seu conhecimento

O que é um "modelo" em machine learning?
Um modelo é uma relação matemática derivada de dados que um sistema de ML usa para fazer previsões.
Um modelo é um hardware de computador
Um modelo é uma representação menor daquilo que você está estudando.

Tipos de sistemas de ML

Os sistemas de ML se enquadram em uma ou mais das seguintes categorias com base em como eles aprendem a fazer previsões ou gerar conteúdo:

  • Aprendizado supervisionado
  • Aprendizado não supervisionado
  • Aprendizado por reforço
  • IA generativa

Aprendizado supervisionado

Os modelos de aprendizado supervisionado podem fazer previsões depois de analisar muitos dados com as respostas corretas e descobrir as conexões entre os elementos nos dados que produzem as respostas corretas. É como um estudante aprender um novo material estudando exames antigos que contêm perguntas e respostas. Depois que o aluno treinar em exames antigos suficientes, ele estará bem preparado para fazer um novo exame. Esses sistemas de ML são "supervisionados" no sentido de que um humano fornece dados ao sistema de ML com os resultados corretos conhecidos.

Dois dos casos de uso mais comuns para o aprendizado supervisionado são a regressão e a classificação.

Regressão

Um modelo de regressão prevê um valor numérico. Por exemplo, um modelo meteorológico que prevê a quantidade de chuva, em polegadas ou milímetros, é um modelo de regressão.

Confira mais exemplos de modelos de regressão na tabela abaixo:

Cenário Possíveis dados de entrada Previsão numérica
Preço futuro da casa Metros quadrados, CEP, número de quartos e banheiros, tamanho do lote, taxa de juros da hipoteca, taxa de imposto predial, custos de construção e número de casas à venda na área. O preço da casa.
Horário do trajeto futuro Condições históricas de trânsito (coletadas de smartphones, sensores de trânsito, apps de transporte por aplicativo e outros apps de navegação), distância do destino e condições climáticas. O tempo em minutos e segundos para chegar a um destino.

Classificação

Os modelos de classificação preveem a probabilidade de algo pertencer a uma categoria. Ao contrário dos modelos de regressão, cuja saída é um número, os modelos de classificação geram um valor que indica se algo pertence ou não a uma categoria específica. Por exemplo, os modelos de classificação são usados para prever se um e-mail é spam ou se uma foto contém um gato.

Os modelos de classificação são divididos em dois grupos: classificação binária e classificação multiclasse. Os modelos de classificação binária geram um valor de uma classe que contém apenas dois valores, por exemplo, um modelo que gera rain ou no rain. Os modelos de classificação multiclasse geram um valor de uma classe que contém mais de dois valores. Por exemplo, um modelo que pode gerar rain, hail, snow ou sleet.

Teste seu conhecimento

Se você quisesse usar um modelo de ML para prever o uso de energia em edifícios comerciais, que tipo de modelo você usaria?
Regressão
O uso de energia é medido em quilowatt-hora (kWh), que é um número. Portanto, use um modelo de regressão.
Classificação
Os modelos de classificação preveem se algo pertence ou não a uma categoria, enquanto os modelos de regressão preveem um número. Como o uso de energia é medido em kilowatt-hora (kWh), que é um número, é necessário usar um modelo de regressão.

Aprendizado não supervisionado

Os modelos de aprendizado não supervisionado fazem previsões com base em dados que não contêm respostas corretas. O objetivo de um modelo de aprendizado não supervisionado é identificar padrões significativos entre os dados. Em outras palavras, o modelo não tem dicas sobre como categorizar cada dado, mas precisa inferir as próprias regras.

Um modelo de aprendizado não supervisionado usado com frequência emprega uma técnica chamada agrupamento. O modelo encontra pontos de dados que delimitam agrupamentos naturais.

Uma imagem mostrando pontos coloridos em clusters.

Figura 1. Um modelo de ML agrupando pontos de dados semelhantes.

Uma imagem mostrando pontos coloridos em clusters que são cercados por uma forma e fazem fronteira entre si.

Figura 2. Grupos de clusters com demarcações naturais.

O agrupamento é diferente da classificação porque as categorias não são definidas por você. Por exemplo, um modelo não supervisionado pode agrupar um conjunto de dados meteorológicos com base na temperatura, revelando segmentações que definem as estações. Em seguida, você pode tentar nomear esses clusters com base no seu entendimento do conjunto de dados.

Uma imagem mostrando pontos coloridos em grupos rotulados como neve, chuva, granizo e sem chuva.

Figura 3. Um modelo de ML agrupando padrões climáticos semelhantes.

Uma imagem que mostra pontos coloridos em grupos rotulados como neve, chuva, granizo e sem chuva, que estão contidos em uma forma e fazem fronteira entre si.

Figura 4. Grupos de padrões climáticos rotulados como neve, granizo, chuva e sem chuva.

Teste seu conhecimento

O que diferencia uma abordagem supervisionada de uma não supervisionada?
Uma abordagem supervisionada recebe dados que contêm a resposta correta.
Uma abordagem supervisionada recebe dados que contêm a resposta correta. O trabalho do modelo é encontrar conexões nos dados que produzem a resposta correta. Uma abordagem não supervisionada recebe dados sem a resposta correta. A tarefa dele é encontrar agrupamentos nos dados.
Uma abordagem supervisionada geralmente usa agrupamento.
Uma abordagem não supervisionada usa o agrupamento.
Uma abordagem não supervisionada sabe como rotular clusters de dados.
Uma abordagem não supervisionada não sabe o que os clusters de dados significam. Com base no seu entendimento dos dados, cabe a você definir as métricas.

Aprendizado por reforço

Os modelos de aprendizado por reforço fazem previsões recebendo recompensas ou penalidades com base nas ações realizadas em um ambiente. Um sistema de aprendizado por reforço gera uma política que define a melhor estratégia para receber mais recompensas.

O aprendizado por reforço é usado para treinar robôs a realizar tarefas, como andar por uma sala, e programas de software, como AlphaGo, para jogar o jogo de Go.

IA generativa

A IA generativa é uma classe de modelos que cria conteúdo com base na entrada do usuário. Por exemplo, a IA generativa pode criar imagens, composições musicais e piadas exclusivas. Ela pode resumir artigos, explicar como realizar uma tarefa ou editar uma foto.

A IA generativa pode receber várias entradas e criar várias saídas, como texto, imagens, áudio e vídeo. Ele também pode criar combinações desses elementos. Por exemplo, um modelo pode usar uma imagem como entrada e criar uma imagem e um texto como saída ou usar uma imagem e um texto como entrada e criar um vídeo como saída.

Podemos discutir os modelos generativos pelas entradas e saídas, normalmente escritos como "tipo de entrada"-"tipo de saída". Por exemplo, confira a lista parcial de algumas entradas e saídas de modelos generativos:

  • Texto para texto
  • Texto para imagem
  • Texto para vídeo
  • Texto para código
  • Conversão de texto em voz
  • Imagem e texto para imagem

A tabela a seguir lista exemplos de modelos generativos, a entrada deles e um exemplo de saída possível:

Modelo Entrada Exemplo de saída
Texto para texto Quem inventou a corrida de Le Mans? A corrida 24 Horas de Le Mans foi fundada pelo Automobile Club de l'Ouest (ACO), uma organização de automobilismo fundada em 1906. A primeira corrida foi realizada entre 26 e 27 de maio de 1923 no circuito Sarthe, um circuito rodoviário de 13,426 quilômetros localizado perto da cidade de Le Mans, na França. A corrida foi originalmente concebida como uma forma de promover o ACO e a região de Sarthe.
Fonte: Bard
Texto para imagem Um polvo alienígena flutua por um portal enquanto lê um jornal. Imagem de um polvo de desenho animado.
Fonte: Imagen
Texto para vídeo Um urso de pelúcia fotorrealista está nadando no oceano em São Francisco. O ursinho de pelúcia vai para debaixo d'água. O ursinho continua nadando embaixo da água com peixes coloridos. Um urso panda está nadando debaixo d'água. Vídeo de um urso de pelúcia nadando debaixo d'água.
Fonte: Phenaki
Texto para código Crie um loop em Python que itere em uma lista de números e mostra os números primos.
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

Origem: Bard
Conversão de imagem em texto Imagem de um flamingo. Isso é um flamingo. Elas são encontradas no Caribe.
Fonte: Google DeepMind

Como funciona a IA generativa? Em um nível alto, os modelos generativos aprendem padrões nos dados com o objetivo de produzir dados novos, mas semelhantes. Os modelos generativos são assim:

  • Comediantes que aprendem a imitar outras pessoas observando o comportamento e o estilo de fala delas
  • Artistas que aprendem a pintar em um estilo específico estudando muitas pinturas nesse estilo
  • Bandas cover que aprendem a soar como um grupo musical específico ouvindo muitas músicas desse grupo

Para produzir resultados únicos e criativos, os modelos generativos são inicialmente treinados usando uma abordagem não supervisionada, em que o modelo aprende a imitar os dados em que é treinado. Às vezes, o modelo é treinado usando aprendizado supervisionado ou de reforço com dados específicos relacionados a tarefas que o modelo pode precisar realizar, por exemplo, resumir um artigo ou editar uma foto.

A IA generativa é uma tecnologia que evolui rapidamente, com novos casos de uso sendo descobertos constantemente. Por exemplo, os modelos generativos estão ajudando as empresas a refinar as imagens de produtos de e-commerce, removendo automaticamente os planos de fundo que distraem ou melhorando a qualidade das imagens de baixa resolução.