Apache Airflow 專案

本頁針對 Google 系列文件接受的技術撰寫專案提供詳細資料。

專案摘要

開放原始碼機構:
Apache Airflow
技術文件撰寫者:
kartik khare
專案名稱:
如何建立工作流程
專案長度:
標準長度 (3 個月)

Project description

我的文件將說明如何輕鬆有效地建立新工作流程。 工作流程中需要執行幾個步驟:

  1. 讀取
  2. 預先處理
  3. 處理中
  4. 後續處理中
  5. 儲存/動作
  6. Monitoring

每個步驟中可以涉及多項任務,而且可以在完成每個步驟後執行多種動作。舉例來說,如果階段有 2 個以上的工作失敗,系統就會取消工作,或是在工作失敗至少 2 次時,重新執行工作。

工作流程的其他部分包括同時執行 2 項以上的工作,然後運用綜合結果在下個階段運用。

工作流程的另一個重點是提醒使用者,萬一發生透過郵件、包裹或分頁任務發生問題的問題,請務必提醒使用者。

另外,我也計劃加入一些可運用工作流程的簡單方法,例如在下游 Kafka 主題中,針對任何缺少的資料重新啟動時執行即時串流工作。

我會協助導師改善專案範圍,然後再完成接下來的工作。

預祝您未來幾個月再見!