Cruzamentos de atributos: exercícios do Playground
Introdução ao cruzamento de atributos
Um cruzamento de atributos pode realmente permitir que um modelo se ajuste a dados não lineares?
Para descobrir, experimente este exercício.
Tarefa: tente criar um modelo que separe os pontos azuis dos
pontos laranja alterando manualmente os pesos dos três
atributos de entrada a seguir:
x1
x2
x1x2 (um cruzamento de atributos)
Para alterar um peso manualmente:
Clique em uma linha que conecte "RECURSOS" a "SAÍDA".
Um formulário de entrada será exibido.
Digite um valor de ponto flutuante nesse formulário de entrada.
Pressione Enter.
A interface deste exercício não contém um botão "Step".
Isso porque esse exercício não treina um modelo de forma iterativa.
Em vez disso, insira manualmente os pesos "final" do modelo.
As respostas aparecem logo abaixo do exercício.
Clique no ícone de adição para a resposta.
w1 = 0
w2 = 0
x1x2 = 1 (ou qualquer valor positivo)
Se você inserir um valor negativo para o cruzamento de atributos, o modelo vai separar
os pontos azuis dos pontos laranjas, mas as previsões vão ficar completamente erradas.
Ou seja, o modelo prevê a cor laranja para os pontos azuis e azul para os pontos laranjas.
Cruzamentos de atributos mais complexos
Agora, vamos jogar com algumas combinações avançadas de atributos.
Os dados definidos neste exercício do Playground
são semelhantes a um alvo
com ruído em um jogo de dardos, com os pontos azuis no meio e
os pontos laranja em um anel externo.
Clique no ícone de adição para ver uma explicação da visualização do modelo.
Cada exercício do Playground exibe uma visualização do estado
atual do modelo. Por exemplo, veja uma visualização:
Observe o seguinte sobre a visualização do modelo:
Cada eixo representa um recurso específico. No caso de spam x não spam, os recursos podem ser a contagem de palavras e o número de destinatários do e-mail.
Cada ponto representa os valores de atributo de um exemplo de dados, como um e-mail.
A cor do ponto representa a classe a que o exemplo pertence.
Por exemplo, os pontos azuis podem representar e-mails que não são spam, enquanto os pontos laranja podem representar e-mails de spam.
A cor do plano de fundo representa a previsão do modelo de onde os exemplos dessa cor devem ser encontrados. Um plano de fundo azul ao redor de um ponto azul significa que o modelo está prevendo corretamente esse exemplo. Por outro lado,
um plano de fundo laranja em torno de um ponto azul significa que o modelo está
prevendo incorretamente esse exemplo.
Os tons de azul e laranja do fundo são ajustados. Por exemplo, o lado esquerdo
da visualização fica em azul sólido, mas gradualmente muda para branco no centro
da visualização. Pense na força da cor como uma sugestão do modelo para garantir a confiança. Azul sólido significa que o modelo está muito confiante sobre a suposição, e azul-claro significa que o modelo está menos confiante. A visualização do modelo mostrada na figura está fazendo um
job ruim de previsão.
Use a visualização para avaliar o progresso do seu modelo.
Ótimo! A maioria dos pontos azuis tem um plano de fundo azul, ou “Ah, não! Os pontos azuis têm um plano de fundo laranja.")
Além das cores, o Playground
também exibe numericamente a perda atual do modelo.
(Ah, não! A perda está subindo em vez de desistir.")
Tarefa 1:execute o modelo linear conforme indicado. Passe um ou dois minutos, mas não mais, testando configurações diferentes de taxa de aprendizado para ver se há melhorias. Um modelo linear pode produzir resultados eficazes para
esse conjunto de dados?
Tarefa 2: agora tente adicionar recursos de vários produtos, como x1x2, tentando otimizar o desempenho.
Quais recursos são mais úteis?
Qual é o melhor desempenho possível?
Tarefa 3: quando você tiver um bom modelo, examine a superfície de saída do modelo (mostrada pela cor do plano de fundo).
Parece um modelo linear?
Como você descreveria o modelo?
As respostas aparecem logo abaixo do exercício.
Clique no ícone de adição para responder à Tarefa 1.
Não. Um modelo linear não pode modelar este conjunto de dados de maneira eficaz. Reduzir a taxa de aprendizado diminui a perda, mas a perda ainda converge a um valor inaceitável.
Clique no ícone de adição para ver uma resposta à Tarefa 2.
Os conjuntos de dados do Playground são gerados aleatoriamente. Por isso, é possível que nossas respostas nem sempre concordem exatamente com a sua. Na verdade, se você gerar novamente o conjunto de dados entre as execuções, seus resultados nem sempre concordarão exatamente com as execuções anteriores. Dessa forma, você terá resultados melhores se fizer o seguinte:
Uso de x12 e x22 como cruzamentos de atributos. Adicionar x1x2 como um cruzamento de atributos não parece ajudar.
Reduzindo a taxa de aprendizado, talvez para 0,001.
Clique no ícone de adição para ver uma resposta à Tarefa 3.
A superfície de saída do modelo não parece um modelo linear. Em vez disso,
ele parece elíptico.