Dieses Modul beginnt mit einer Suggestivfrage.
Wählen Sie eine der folgenden Antworten aus:
Wenn Sie in einem der folgenden Bereiche Verbesserungsbedarf hatten,
die in Ihrem ML-Projekt am meisten
Auswirkungen?
Qualität Ihres Datasets verbessern
Daten haben Vorrang vor allen.
Die Qualität und Größe des Datasets ist viel wichtiger als das,
mit dem Sie Ihr Modell erstellen.
Eine cleverere Verlustfunktion zum Trainieren Ihres Modells anwenden
Richtig, eine bessere Verlustfunktion
kann dazu beitragen, dass ein Modell schneller
ist es noch eine Sekunde von einem
anderen Element auf dieser Liste entfernt.
Und hier kommt eine noch Suggestivfrage:
Lassen Sie es raten: Wie viel Zeit in Ihrem ML-Projekt
widmen Sie sich normalerweise der Datenvorbereitung und -transformation?
Mehr als die Hälfte der Projektzeit
Ja, ML-Anwender verbringen den Großteil ihrer Zeit
für das Erstellen von Datasets
und für Feature Engineering.
Weniger als die Hälfte der Projektzeit
Planen Sie für mehr! Bei Machine Learning werden üblicherweise 80 %
mit dem Erstellen von Datasets
und Transformieren von Daten.
In diesem Modul erfahren Sie mehr über die Eigenschaften des maschinellen Lernens.
Datasets und wie Sie Ihre Daten aufbereiten, um qualitativ hochwertige Ergebnisse zu gewährleisten, wenn
Training und Bewertung Ihres Modells.
[null,null,["Zuletzt aktualisiert: 2024-08-13 (UTC)."],[[["This module emphasizes the critical role of data quality in machine learning projects, highlighting that it significantly impacts model performance more than algorithm choice."],["Machine learning practitioners typically dedicate a substantial portion of their project time (around 80%) to data preparation and transformation, including tasks like dataset construction and feature engineering."],["The module covers key concepts in data preparation, such as identifying data characteristics, handling unreliable data, understanding data labels, and splitting datasets for training and evaluation."],["Learners will gain insights into techniques for improving data quality, mitigating issues like overfitting, and interpreting loss curves to assess model performance."],["This module builds upon foundational machine learning concepts, assuming familiarity with topics like linear regression, numerical and categorical data handling, and basic machine learning principles."]]],[]]