ML-Produktionssysteme: Testen Sie Ihr Wissen

  1. Sie verwenden maschinelles Lernen, um ein Klassifizierungsmodell zu erstellen, das das Aussehen von Einhörnern vorhersagt. Ihr Dataset enthält 10.000 Darstellungen von Einhörnern und 10.000 nicht vorkommende Einhörner. Das Dataset enthält den Standort, die Tageszeit, die Höhe, die Temperatur, die Luftfeuchtigkeit, die Baumbedeckung, das Vorhandensein eines Regenbogens und einige weitere Merkmale.

    Nachdem Sie den Prädiktor für das Aussehen eines Einhorns gestartet haben, müssen Sie Ihr Modell aktuell halten, indem Sie mit neuen Daten noch einmal trainieren. Da Sie zu viele neue Daten für das Training erfassen, beschließen Sie, die Trainingsdaten zu begrenzen, indem Sie die neuen Daten über ein Zeitfenster abtasten. Außerdem musst du tägliche und jährliche Muster beim Aussehen der Einhörner berücksichtigen. Welches Zeitfenster wählen Sie aus?

  2. Sie starten Ihren Prädiktor für das Aussehen eines Einhorns. Es funktioniert gut! Sie fahren in den Urlaub und kehren nach drei Wochen zurück, um festzustellen, dass die Qualität Ihres Modells deutlich gesunken ist. Es ist unwahrscheinlich, dass sich das Einhornverhalten in drei Wochen signifikant ändert. Was ist die wahrscheinlichste Erklärung für den Qualitätsverlust?

  3. Sie überprüfen die Vorhersagen des Modells für die Antarktis und stellen fest, dass das Modell dort schlechte Vorhersagen getroffen hat, seit das Modell in die Produktion freigegeben wurde. Woran könnte das liegen?

  4. Dein Prädiktor für das Aussehen eines Einhorns ist seit einem Jahr in Betrieb. Du hast viele Probleme behoben und die Qualität ist nun hoch. Sie bemerken jedoch ein kleines, aber dauerhaftes Problem. Die Qualität Ihres Modells ist in städtischen Gebieten etwas gesunken. Woran könnte das liegen?

  5. Durch all Ihre Fehlerbehebungen haben Sie die Qualität der Vorhersagen des Einhornmodells stark verbessert, wodurch sich die Nutzung verzehnfacht hat. Die Nutzenden beschweren sich inzwischen jedoch, dass das Modell extrem langsam ist. Bei Inferenzanfragen dauert es in der Regel mehr als 30 Sekunden, bis Vorhersagen zurückgegeben werden. Welche der folgenden Änderungen könnte zur Lösung dieses Problems beitragen?