Proces przygotowywania i obsługi funkcji związanych z danymi

Jak wygląda ten proces?

Jak już wspominaliśmy, ten kurs skupia się na tworzeniu zbioru danych i przekształcaniu go.

Tworzenie zbioru danych obejmuje te zadania: 1. Gromadzenie nieprzetworzonych danych.  2. Identyfikuj źródła funkcji i etykiet. 3. Wybierz strategię próbkowania.
4. Podziel dane. Dane przekształcenia składają się z następujących zadań:
1. Przejrzyj i wyczyść dane. 2. Przeprowadź inżynierię cech.

Pamiętaj:

  • Rysunek przedstawia typowy proces, który może nie sprawdzić się w każdym projekcie. Kurs ten dotyczy głównie regresji liniowej i sieci neuronowych.
  • Proces nie zawsze jest sekwencyjny. Możesz na przykład podzielić dane po ich przekształceniu. Może być konieczne zebranie większej ilości danych. Być może trzeba będzie zmienić zestaw funkcji, nawet po rozpoczęciu trenowania, w miarę jak empirycznie dowiesz się, co działa, a co nie.

Ile czasu zajmuje?

W przypadku tego pytania kliknij strzałkę, aby sprawdzić odpowiedź:

Zgadnij: ile czasu zazwyczaj poświęcasz na przygotowanie i transformację danych w swoim projekcie systemów uczących się?
Ponad połowa czasu projektu
Prawidłowo: będziesz poświęcić większość czasu na projekt systemów uczących się tworzący zbiory danych i przekształcające dane.
Mniej niż połowa czasu projektu
Planuj więcej! Zwykle 80% czasu w projekcie systemów uczących się poświęca się na tworzenie zbiorów danych i przekształcanie danych.