Para agrupar los datos en clústeres, sigue estos pasos:
- Preparar los datos.
- Crea una métrica de similitud.
- Ejecutar el algoritmo de agrupamiento en clústeres
- Interpreta los resultados y ajusta tu agrupamiento en clústeres.
En esta página, se describen brevemente los pasos. En adelante, secciones.
Preparar los datos
Como con cualquier problema de AA, debes normalizar, escalar y transformar los datos de los atributos antes de entrenar o ajustar un modelo con esos datos. Además, antes de y agrupa en clústeres, comprueba que los datos preparados te permitan calcular con precisión similitud entre ejemplos.
Crear métrica de similitud
Antes de que un algoritmo de agrupamiento en clústeres pueda agrupar datos, necesita saber pares de ejemplos. Puedes cuantificar la similitud entre ejemplos crear una métrica de similitud, lo que requiere una comprensión cuidadosa de tu de datos no estructurados.
Ejecuta el algoritmo de agrupamiento en clústeres
Un algoritmo de agrupamiento en clústeres usa la métrica de similitud para agrupar los datos. En este curso, se usan k-means.
Interpreta los resultados y realiza ajustes
Porque el agrupamiento en clústeres no produce ni incluye una “verdad” fundamental contra el cual puedes verificar el resultado, es importante verificarlo con tu en el nivel del clúster y del ejemplo. Si el resultado se vea extraño o de baja calidad, experimenta con los tres pasos anteriores. Continuar iterando hasta que la calidad de los resultados satisfaga tus necesidades.