Uma versão nova e aprimorada do curso intensivo de machine learning vai ser lançada em agosto de 2024. Não perca as novidades!

Esta página foi traduzida pela API Cloud Translation.

Embeddings

Um embedding é um espaço relativamente baixo em que é possível transformar vetores de alta dimensão. Com os embeddings, é mais fácil fazer o machine learning em entradas grandes, como vetores esparsos que representam palavras. O ideal é que um embedding capture algumas das semânticas da entrada colocando-as semanticamente semelhantes no espaço de embedding. Um embedding pode ser aprendizado e reutilizado em vários modelos.

Embeddings

Motivação da filtragem colaborativa

Entrada: 1 milhão de filmes que 500 mil usuários escolheram assistir.
Tarefa: recomendar filmes para os usuários

Para solucionar esse problema, vamos adotar um método para determinar quais filmes são semelhantes entre si.

Como organizar filmes por semelhança (1d)

Uma lista de filmes ordenados em uma única linha da esquerda para a direita. Começando com a esquerda, 'Shrek', 'The Incredibles', 'The Triplets of Belleville', 'Harry Potter', 'Star Wars', 'Bleu',##9;' ' ' ' ' ' ' ' ' ' ' '

Como organizar filmes por semelhança (2d)

A mesma lista de filmes no slide anterior, mas organizada em duas dimensões. Por exemplo, 'Shrek' está à esquerda e acima de 'Os Incríveis

Embedding bidimensional

A mesma organização do último slide. 'Shrek' e 'Bleu' são destacados como exemplos de coordenadas no plano de incorporação 2D.

Embeddings d-dimensionais

Supõe que o interesse do usuário em filmes pode ser explicado de forma aproximada por d aspectos
Cada filme se torna um ponto d-dimensional em que o valor na dimensão d representa o quanto o filme se encaixa nesse aspecto
Embeddings podem ser aprendidos com dados

Como incorporar embeddings em uma rede profunda

Nenhum processo de treinamento separado necessário. A camada de embedding é apenas uma camada escondida com uma unidade por dimensão
As informações supervisionadas (por exemplo, usuários assistem aos mesmos dois filmes) ajustam os embeddings aprendidos para a tarefa desejada
As unidades ocultas descobrem como organizar os itens no espaço d-dimensional de modo a otimizar melhor o objetivo final

Representação de entrada

Cada exemplo (uma linha nesta matriz) é um vetor esparso de recursos (filmes) que foram assistidos pelo usuário
Representação densa desse exemplo como: (0, 1, 0, 1, 0, 0, 0, 1)

Eles não são eficientes em termos de espaço e tempo.

Uma tabela em que cada cabeçalho de coluna é um filme, e cada linha representa um usuário e os filmes que ele assistiu.

Representação de entrada

Crie um dicionário que mapeie cada atributo para um número inteiro de 0, ..., # filmes - 1
Representa o vetor esparso de maneira eficiente como apenas os filmes que o usuário assistiu. Isso pode ser representado como:

Um vetor esparso representado como uma tabela, em que cada coluna representa um usuário e cada linha representa um usuário. A tabela contém os filmes dos diagramas anteriores e foi numerada de 1 a 999.999. Cada célula da tabela será verificada se um usuário tiver assistido a um filme.

Uma camada de embedding em uma rede profunda

Problema de regressão para prever preços de vendas domésticas:

Um diagrama de uma rede neural profunda usada para prever preços de vendas domésticas

Uma camada de embedding em uma rede profunda

Problema de regressão para prever preços de vendas domésticas:

Um diagrama de uma rede neural profunda usada para prever preços de vendas domésticas
(a codificação vetorial esparsa destacada)

Uma camada de embedding em uma rede profunda

Problema de regressão para prever preços de vendas domésticas:

Um diagrama de uma rede neural profunda usada para prever preços de venda doméstica
(camada de embedding tridimensional oculta destacada)

Uma camada de embedding em uma rede profunda

Problema de regressão para prever preços de vendas domésticas:

Um diagrama de uma rede neural profunda usada para prever preços de venda doméstica
(recursos adicionais de entrada de latitude e longitude destacados)

Uma camada de embedding em uma rede profunda

Problema de regressão para prever preços de vendas domésticas:

Um diagrama de uma rede neural profunda usada para prever preços de vendas domésticas
(atributos de entrada sendo alimentados em várias camadas ocultas em destaque)

Uma camada de embedding em uma rede profunda

Problema de regressão para prever preços de vendas domésticas:

Um diagrama de uma rede neural profunda usada para prever preços de venda caseira
(saída da rede neural profunda destacada)

Uma camada de embedding em uma rede profunda

Classificação multiclasse para prever um dígito escrito à mão:

Diagrama de uma rede neural profunda usada para prever dígitos escritos à mão

Uma camada de embedding em uma rede profunda

Classificação multiclasse para prever um dígito escrito à mão:

Diagrama de uma rede neural profunda usada para prever dígitos escritos à mão
(a codificação vetorial de entrada esparsa destacada)

Uma camada de embedding em uma rede profunda

Classificação multiclasse para prever um dígito escrito à mão:

Diagrama de uma rede neural profunda usada para prever dígitos escritos à mão
(outros recursos destacados)

Uma camada de embedding em uma rede profunda

Classificação multiclasse para prever um dígito escrito à mão:

Diagrama de uma rede neural profunda usada para prever dígitos escritos à mão
(incorporação tridimensional destacada)

Uma camada de embedding em uma rede profunda

Classificação multiclasse para prever um dígito escrito à mão:

Diagrama de uma rede neural profunda usada para prever dígitos escritos à mão
(camadas ocultas destacadas)

Uma camada de embedding em uma rede profunda

Classificação multiclasse para prever um dígito escrito à mão:

Diagrama de uma rede neural profunda usada para prever dígitos manuscritos
(camada de lógica destacada)