Apache Airflow-Projekt

Auf dieser Seite finden Sie die Details zu einem Projekt für technisches Schreiben, das für Google Season of Docs angenommen wurde.

Projektzusammenfassung

Open-Source-Organisation:
Apache Airflow
Technischer Redakteur:
kartik khare
Projektname:
Workflow erstellen
Projektlänge:
Standardlänge (3 Monate)

Projektbeschreibung

Ich werde eine Dokumentation dazu erstellen, wie Sie neue Workflows einfach und effektiv erstellen. Workflows umfassen unter anderem folgende Schritte:

  1. Lesen
  2. Vorverarbeitung
  3. In Bearbeitung
  4. Nachbearbeitung
  5. Speichern/Aktion
  6. Monitoring

Jeder Schritt kann mehrere Aufgaben umfassen und nach jedem Schritt können zahlreiche Aktionen ausgeführt werden, z. B. der Abbruch des Jobs, wenn zwei oder mehr Aufgaben in einer Phase fehlschlagen, oder die erneute Ausführung einer Aufgabe, wenn sie mindestens zweimal fehlschlägt.

Ein weiterer Teil der Workflows besteht darin, zwei oder mehr Jobs parallel auszuführen und dann ihr kombiniertes Ergebnis für die nächste Phase zu verwenden.

Ein weiterer Aspekt eines Workflows besteht darin, den Nutzer zu benachrichtigen, falls etwas schiefgeht, entweder per E-Mail, Slack oder Pager.

Außerdem plane ich, einige nicht triviale Möglichkeiten zur Verwendung von Workflows hinzuzufügen, z. B. die Ausführung von Echtzeit-Streamingjobs bei fehlenden Daten in nachgelagerten Kafka-Themen.

Ich werde mit Mentoren zusammenarbeiten, um den Umfang des Projekts zu verfeinern und dann die Aufgaben abzuschließen.

Ich freue mich auf die nächsten Monate.