Flujo de trabajo del agrupamiento en clústeres

Para agrupar tus datos, sigue estos pasos:

Preparar los datos.
Crea una métrica de similitud.
Ejecuta el algoritmo de agrupamiento.
Interpreta los resultados y ajusta el agrupamiento.

En esta página, se presentan brevemente los pasos. Analizaremos esto en detalle en las secciones posteriores.

Preparar los datos

Al igual que con cualquier problema de AA, debes normalizar, escalar y transformar los datos de atributos antes de entrenar o ajustar un modelo con esos datos. Además, antes de agrupar, verifica que los datos preparados te permitan calcular con precisión la similitud entre los ejemplos.

Crea una métrica de similitud

Antes de que un algoritmo de agrupamiento pueda agrupar datos, debe saber qué tan similares son los pares de ejemplos. Para cuantificar la similitud entre los ejemplos, puedes crear una métrica de similitud, lo que requiere una comprensión cuidadosa de tus datos.

Ejecuta el algoritmo de agrupamiento

Un algoritmo de agrupamiento usa la métrica de similitud para agrupar datos. En este curso, se usa k-means.

Interpreta los resultados y realiza ajustes

Dado que el agrupamiento no produce ni incluye una "verdad" con la que puedes verificar el resultado, es importante verificar el resultado en función de tus expectativas a nivel del clúster y del ejemplo. Si el resultado se ve extraño o de baja calidad, experimenta con los tres pasos anteriores. Continúa iterando hasta que la calidad del resultado satisfaga tus necesidades.

Algoritmos de agrupamiento en clústeres

Preparación de datos