El proceso de preparación de datos y de ingeniería de atributos

¿Cómo es el proceso?

Como se mencionó antes, este curso se enfoca en la construcción de tu conjunto de datos y su transformación.

La construcción de tu conjunto de datos consta de las siguientes tareas: 1. Recopilar datos sin procesar.  2. Identifica las fuentes de atributos y etiquetas. 3. Selecciona una estrategia de muestreo.
4. Dividir los datos La transformación de datos consta de las siguientes tareas:
1. Explora y limpia tus datos. 2. Realizar ingeniería de atributos

Ten en cuenta lo siguiente:

  • En la figura, se muestra un proceso típico, que podría no ser ideal para todos los proyectos. Este curso se aplica principalmente a la regresión lineal y a las redes neuronales.
  • El proceso que se muestra no siempre es secuencial. Por ejemplo, puedes dividir tus datos después de transformarlos. Es posible que debas recopilar más datos. Es posible que debas modificar el conjunto de atributos, incluso después de que comience el entrenamiento, ya que aprenderás empíricamente qué funciona y qué no.

¿Cuánto tiempo lleva?

En la siguiente pregunta, haz clic en la flecha deseada para verificar tu respuesta:

Adivina: En tu proyecto de aprendizaje automático, ¿cuánto tiempo sueles dedicar a la preparación y transformación de datos?
Más de la mitad del tiempo del proyecto
Correcto: Pasarás la mayor parte del tiempo en un proyecto de aprendizaje automático que construye conjuntos de datos y los transforma.
Menos de la mitad del tiempo del proyecto
Planifique más. Por lo general, el 80% del tiempo en un proyecto de aprendizaje automático se dedica a construir conjuntos de datos y transformar datos.