Questo modulo inizia con una domanda principale.
Scegli una delle seguenti risposte:
Se dovessi dare la priorità al miglioramento di una delle seguenti aree
nel tuo progetto di machine learning, che avrebbe il massimo
impatto?
Migliorare la qualità del set di dati
I dati prevalgono su tutti.
La qualità e le dimensioni del set di dati sono molto più importanti
all'algoritmo che usi per creare il tuo modello.
Applicazione di una funzione di perdita più intelligente all'addestramento del modello
Una migliore funzione di perdita può aiutare ad addestrare un modello più velocemente,
è ancora un secondo lontano a un altro elemento di questo elenco.
Ed ecco una domanda ancora più insistente:
Indovina: nel tuo progetto di machine learning, quanto tempo
in genere investi nella preparazione e nella trasformazione dei dati?
Più di metà delle ore di utilizzo del progetto
Sì, i professionisti di ML trascorrono la maggior parte del loro tempo
la creazione di set di dati
e il feature engineering.
Meno di metà delle ore di utilizzo del progetto
Preparati per qualcosa di più. Di solito, l'80% delle volte utilizza il machine learning
alla creazione di set di dati e alla trasformazione dei dati.
In questo modulo scoprirai di più sulle caratteristiche del machine learning
set di dati e come prepararli per garantire risultati di alta qualità
per l'addestramento e la valutazione
del modello.
[null,null,["Ultimo aggiornamento 2024-08-13 UTC."],[[["This module emphasizes the critical role of data quality in machine learning projects, highlighting that it significantly impacts model performance more than algorithm choice."],["Machine learning practitioners typically dedicate a substantial portion of their project time (around 80%) to data preparation and transformation, including tasks like dataset construction and feature engineering."],["The module covers key concepts in data preparation, such as identifying data characteristics, handling unreliable data, understanding data labels, and splitting datasets for training and evaluation."],["Learners will gain insights into techniques for improving data quality, mitigating issues like overfitting, and interpreting loss curves to assess model performance."],["This module builds upon foundational machine learning concepts, assuming familiarity with topics like linear regression, numerical and categorical data handling, and basic machine learning principles."]]],[]]