Uma versão nova e aprimorada do curso intensivo de machine learning vai ser lançada em agosto de 2024. Não perca as novidades!

Esta página foi traduzida pela API Cloud Translation.

Cruzamentos de atributos: exercícios do Playground

Introdução ao cruzamento de atributos

Um cruzamento de atributos pode realmente permitir que um modelo se ajuste a dados não lineares? Para descobrir, experimente este exercício.

Tarefa: tente criar um modelo que separe os pontos azuis dos pontos laranja alterando manualmente os pesos dos três atributos de entrada a seguir:

x₁
x₂
x₁ x₂ (um cruzamento de atributos)

Para alterar um peso manualmente:

Clique em uma linha que conecte "RECURSOS" a "SAÍDA". Um formulário de entrada será exibido.
Digite um valor de ponto flutuante nesse formulário de entrada.
Pressione Enter.

A interface deste exercício não contém um botão "Step". Isso porque esse exercício não treina um modelo de forma iterativa. Em vez disso, insira manualmente os pesos "final" do modelo.

As respostas aparecem logo abaixo do exercício.

Clique no ícone de adição para a resposta.

w₁ = 0
w₂ = 0
x₁ x₂ = 1 (ou qualquer valor positivo)

Se você inserir um valor negativo para o cruzamento de atributos, o modelo vai separar os pontos azuis dos pontos laranjas, mas as previsões vão ficar completamente erradas. Ou seja, o modelo prevê a cor laranja para os pontos azuis e azul para os pontos laranjas.

Cruzamentos de atributos mais complexos

Agora, vamos jogar com algumas combinações avançadas de atributos. Os dados definidos neste exercício do Playground são semelhantes a um alvo com ruído em um jogo de dardos, com os pontos azuis no meio e os pontos laranja em um anel externo.

Clique no ícone de adição para ver uma explicação da visualização do modelo.

Cada exercício do Playground exibe uma visualização do estado atual do modelo. Por exemplo, veja uma visualização:

Observe o seguinte sobre a visualização do modelo:

Cada eixo representa um recurso específico. No caso de spam x não spam, os recursos podem ser a contagem de palavras e o número de destinatários do e-mail.
Observação:os valores apropriados para o eixo dependerão dos dados do recurso. Os valores dos eixos mostrados acima não faziam sentido na contagem de palavras nem no número de destinatários, já que nenhum deles pode ser negativo.
Cada ponto representa os valores de atributo de um exemplo de dados, como um e-mail.
A cor do ponto representa a classe a que o exemplo pertence. Por exemplo, os pontos azuis podem representar e-mails que não são spam, enquanto os pontos laranja podem representar e-mails de spam.
A cor do plano de fundo representa a previsão do modelo de onde os exemplos dessa cor devem ser encontrados. Um plano de fundo azul ao redor de um ponto azul significa que o modelo está prevendo corretamente esse exemplo. Por outro lado, um plano de fundo laranja em torno de um ponto azul significa que o modelo está prevendo incorretamente esse exemplo.
Os tons de azul e laranja do fundo são ajustados. Por exemplo, o lado esquerdo da visualização fica em azul sólido, mas gradualmente muda para branco no centro da visualização. Pense na força da cor como uma sugestão do modelo para garantir a confiança. Azul sólido significa que o modelo está muito confiante sobre a suposição, e azul-claro significa que o modelo está menos confiante. A visualização do modelo mostrada na figura está fazendo um job ruim de previsão.

Use a visualização para avaliar o progresso do seu modelo. Ótimo! A maioria dos pontos azuis tem um plano de fundo azul, ou “Ah, não! Os pontos azuis têm um plano de fundo laranja.") Além das cores, o Playground também exibe numericamente a perda atual do modelo. (Ah, não! A perda está subindo em vez de desistir.")

Tarefa 1:execute o modelo linear conforme indicado. Passe um ou dois minutos, mas não mais, testando configurações diferentes de taxa de aprendizado para ver se há melhorias. Um modelo linear pode produzir resultados eficazes para esse conjunto de dados?

Tarefa 2: agora tente adicionar recursos de vários produtos, como x₁x₂, tentando otimizar o desempenho.

Quais recursos são mais úteis?
Qual é o melhor desempenho possível?

Tarefa 3: quando você tiver um bom modelo, examine a superfície de saída do modelo (mostrada pela cor do plano de fundo).

Parece um modelo linear?
Como você descreveria o modelo?

As respostas aparecem logo abaixo do exercício.

Clique no ícone de adição para responder à Tarefa 1.

Não. Um modelo linear não pode modelar este conjunto de dados de maneira eficaz. Reduzir a taxa de aprendizado diminui a perda, mas a perda ainda converge a um valor inaceitável.

Clique no ícone de adição para ver uma resposta à Tarefa 2.

Os conjuntos de dados do Playground são gerados aleatoriamente. Por isso, é possível que nossas respostas nem sempre concordem exatamente com a sua. Na verdade, se você gerar novamente o conjunto de dados entre as execuções, seus resultados nem sempre concordarão exatamente com as execuções anteriores. Dessa forma, você terá resultados melhores se fizer o seguinte:

Uso de x₁² e x₂² como cruzamentos de atributos. Adicionar x₁x₂ como um cruzamento de atributos não parece ajudar.
Reduzindo a taxa de aprendizado, talvez para 0,001.

Clique no ícone de adição para ver uma resposta à Tarefa 3.

A superfície de saída do modelo não parece um modelo linear. Em vez disso, ele parece elíptico.

Como cruzar vetores de um ponto só

Exercício de programação