Projekt Apache Airflow

Ta strona zawiera szczegółowe informacje o projekcie polegającym na pisaniu tekstów technicznych, który został zaakceptowany w ramach Google Season of Docs.

Podsumowanie projektu

Organizacja open source:
Apache Airflow
Pisarz techniczny:
kartik khare
Nazwa projektu:
Jak utworzyć przepływ pracy
Długość projektu:
Standardowa długość (3 miesiące)

Opis projektu

Będę pracować nad dokumentacją dotyczącą łatwego i skutecznego tworzenia nowych przepływów pracy. Niektóre kroki w procesach to:

  1. Odczyt
  2. Wstępne przetwarzanie
  3. Przetwarzam
  4. Przetwarzanie końcowe
  5. Zapisz/działanie
  6. Monitorowanie

Każdy krok może obejmować wiele zadań, a po każdym z nich można wykonać wiele działań, np. przerwać zadanie, jeśli 2 lub więcej zadań nie powiedzie się na etapie, lub ponownie uruchomić zadanie, jeśli nie powiedzie się ono co najmniej 2 razy.

Inne procesy obejmują równoległe wykonywanie co najmniej 2 zadań, a następnie wykorzystanie ich połączonych wyników na następnym etapie.

Kolejnym aspektem przepływu pracy jest powiadomienie użytkownika w przypadku wystąpienia błędu, na przykład za pomocą poczty e-mail, Slacka lub pagera.

Planuję też opisać kilka nieoczywistych sposobów korzystania z przepływów pracy, np. uruchamiania zadań strumieniowych w czasie rzeczywistym i ich restartowania w przypadku braku danych w tematach Kafka w dół łańcucha.

Będę współpracować z mentorami, aby dokładniej określić zakres projektu, a następnie go wykonać.

Czekamy na kilka kolejnych miesięcy.