ML-Anwender verbringen viel mehr Zeit damit, die Daten auszuwerten, zu bereinigen und zu transformieren. als Modelle zu erstellen. Daten sind so wichtig, dass dem Thema in diesem Kurs drei ganze Einheiten gewidmet sind:
- Mit numerischen Daten arbeiten (diese Einheit)
- Mit kategorialen Daten arbeiten
- Datasets, Generalisierung und Überanpassung
In diesem Modul geht es um numerische Daten bedeutet Ganzzahlen oder Gleitkommawerte die sich wie Zahlen verhalten. Das heißt, sie sind additiv, zählbar, geordnet und so weiter. Im nächsten Modul geht es um kategorische Daten enthalten, für die enthalten Zahlen, die sich wie Kategorien verhalten. Im dritten Modul geht es darum, Bereiten Sie Ihre Daten vor, um qualitativ hochwertige Ergebnisse beim Training und bei der Bewertung sicherzustellen. für Ihr Modell erstellen.
Beispiele für numerische Daten:
- Temperatur
- Gewicht
- Die Anzahl der Rehe, die in einem Naturschutzgebiet überwintern
Im Gegensatz dazu verwenden US-Postleitzahlen trotz 5- oder 9-stellige Zahlen sind, verhalten Sie sich nicht wie Zahlen und stellen Sie mathematische Beziehungen. Die Postleitzahl 40004 (in Nelson County, Kentucky) ist nicht doppelt so hoch wie die Postleitzahl 20002 (in Washington, D.C.). Diese Nummern Kategorien, insbesondere geografische Bereiche, und werden als kategorialen Daten verwendet werden.