ML-Produktionssysteme: Fragen, die gestellt werden sollten

In dieser Lektion geht es vorrangig um die Fragen, die Sie sich zu Ihren Daten stellen sollten. und Modell in Produktionssystemen.

Sind die einzelnen Funktionen hilfreich?

Sie sollten Ihr Modell kontinuierlich beobachten, um Features zu entfernen, die einen Beitrag zur die Vorhersagefähigkeit des Modells beeinflussen. Wenn die Eingabedaten für die sich abrupt ändern, kann auch das Verhalten Ihres Modells abrupt auf unerwünschte Weise verändern.

Berücksichtigen Sie auch die folgende verwandte Frage:

  • Werden durch die Nützlichkeit der Funktion die Kosten dafür gerecht?

Es ist immer verlockend, dem Modell weitere Funktionen hinzuzufügen. Beispiel: Angenommen, Sie finden ein neues Feature, dessen Addition die Vorhersagen Ihres Modells bildet. etwas besser. Etwas bessere Vorhersagen scheinen auf jeden Fall besser zu sein als etwas schlechtere Vorhersagen Die zusätzliche Funktion trägt jedoch Wartungsaufwand.

Ist Ihre Datenquelle zuverlässig?

Einige Fragen, die Sie sich zur Verlässlichkeit Ihrer Eingabedaten stellen sollten:

  • Ist das Signal immer verfügbar oder stammt es von einem unzuverlässige Quelle? Beispiel:
    • Stammt das Signal von einem Server, der unter hoher Last abstürzt?
    • Kommt das Signal von Menschen, die jeden August in Urlaub fahren?
  • Ändert sich das System, das die Eingabedaten Ihres Modells berechnet, jemals? Falls ja: <ph type="x-smartling-placeholder">
      </ph>
    • Wie oft?
    • Woher wissen Sie, wann sich das System ändert?

Erstellen Sie gegebenenfalls eine eigene Kopie der Daten, die Sie vom vorgelagerte Prozesse. Fahren Sie dann nur mit der nächsten Version des Upstreams fort. wenn Sie sicher sind, dass dies sicher ist.

Ist Ihr Modell Teil einer Feedbackschleife?

Manchmal kann sich ein Modell auf seine eigenen Trainingsdaten auswirken. Beispiel: Der Parameter Ergebnisse aus einigen Modellen wiederum werden (direkt oder indirekt) Funktionen zum gleichen Modell hinzufügen.

Manchmal kann sich ein Modell auf ein anderes Modell auswirken. Nehmen wir zum Beispiel zwei Modelle zur Vorhersage von Aktienkursen:

  • Modell A ist ein schlechtes Vorhersagemodell.
  • Modell B.

Da Modell A fehlerhaft ist, entscheidet er sich fälschlicherweise dafür, Aktien von Stock X zu kaufen. Diese Käufe erhöhen den Preis von Aktie X. Modell B verwendet den Preis von Aktie X als Eingabemerkmal verwendet, sodass Modell B falsch werden kann, Schlussfolgerungen über den Wert von Aktie X. Modell B könnte daher Kauf oder Verkauf von Aktien X basierend auf dem fehlerhaften Verhalten von Modell A. Das Verhalten von Modell B wiederum kann sich auf Modell A auswirken und möglicherweise Tulpenwahn oder Slide-in Aktien von Unternehmen X.

Übung: Wissenstest

Welche drei der folgenden Modelle sind anfällig für Feedbackschleife?
Ein Modell zur Verkehrsprognose, das Staus an Autobahnausgängen vorhersagt in der Nähe des Strandes, was unter anderem die Größe des Strandes nutzt.
Manche Strandbesucher stützen ihre Pläne wahrscheinlich auf den Traffic. vorhersagen können. Wenn am Strand viele Menschenmengen sind und der Verkehr laut Prognose aber viele Menschen machen andere Pläne. Das kann am Strand deprimierend wirken sodass die Verkehrslage geringer ist, die Anwesenheit zu steigern, und der Zyklus wiederholt sich.
Buchempfehlungsmodell, das Romanen vorschlägt, die den Nutzern gefallen könnten basierend auf ihrer Beliebtheit (d.h. der Häufigkeit, mit der die Bücher gekauft).
Buchempfehlungen führen mit hoher Wahrscheinlichkeit zu mehr Käufen. zusätzliche Umsätze wieder in das Modell eingespeist werden, Dadurch wird die Wahrscheinlichkeit erhöht, dass Sie dieselben Bücher in der in der Zukunft.
Modell für das Ranking von Universitäten, bei dem Schulen zum Teil nach ihrem Selektivität: der Prozentsatz der Lernenden, die sich beworben haben, zugelassen sind.
Die Rankings des Modells können das Interesse an den Top-Bewertungen steigern. Bildungseinrichtungen. Dadurch steigt die Zahl der Bewerbungen, die sie erhalten. Wenn diese Bildungseinrichtungen die gleiche Anzahl an Lernenden zulassen, wird die Selektion erhöhen (der Prozentsatz der zugelassenen Schüler sinkt). Dieses wird die Leistung dieser Bildungseinrichtungen Rankings, die sich weiter erhöhen werden, Interessen der Lernenden usw.
Ein Wahlergebnismodell, das den Gewinner eines Bürgermeisterwahl, indem nach Ende der Wahllokale 2% der Wähler befragt wurden.
Wenn die Prognose des Modells erst veröffentlicht wird, nachdem geschlossen haben, können sich die Vorhersagen nicht auf den Wähler auswirken verhalten.
Ein Immobilienwertmodell, das Immobilienpreise anhand Größe (Fläche in Quadratmetern), Anzahl der Schlafzimmer und geografischer Standort als Merkmale.
Es ist nicht möglich, den Standort eines Hauses Größe oder Anzahl der Schlafzimmer als Reaktion auf Preisprognosen wodurch eine Feedbackschleife unwahrscheinlich ist. Es gibt jedoch möglicherweise Korrelation zwischen Größe und Anzahl der Schlafzimmer (größere Häuser und wahrscheinlich mehr Räume haben, die möglicherweise auseinandergerissen werden müssen.
Modell mit Gesichterattributen, das erkennt, ob eine Person lächelt auf einem Foto, das regelmäßig anhand einer Datenbank mit Stockfotos trainiert wird die monatlich automatisch aktualisiert wird.
Es gibt hier keine Feedbackschleife, da Modellvorhersagen Auswirkungen auf die Fotodatenbank. Die Versionierung der Eingabe ein Problem darstellen, da die monatlichen Aktualisierungen unvorhergesehene Auswirkungen auf das Modell haben.