Apache Airflow プロジェクト

このページでは、Google Season of Docs に承認された技術文書作成プロジェクトの詳細について説明します。

プロジェクトの概要

オープンソース組織:
Apache Airflow
テクニカル ライター:
kartik khare
プロジェクト名:
ワークフローを作成する方法
プロジェクトの長さ:
標準期間(3 か月)

プロジェクトの説明

新しいワークフローを簡単に効果的に作成する方法に関するドキュメントの作成に取り組んでいます。ワークフローには、次のステップが含まれます。

  1. 読み取り
  2. 前処理
  3. 処理中
  4. 後処理中
  5. 保存/アクション
  6. モニタリング

各ステップには複数のタスクが含まれ、各ステップの後にさまざまなアクションを実行できます。たとえば、ステージで 2 つ以上のタスクが失敗した場合はジョブを中止したり、タスクが 2 回以上失敗した場合はタスクを再実行したりできます。

ワークフローの他の部分では、2 つ以上のジョブを並行して実行し、その結果を組み合わせて次のステージに活かします。

ワークフローのもう一つの側面として、郵便、スラック、ポケベル業務など、なんらかの問題が発生した場合にユーザーにアラートを出す機能もあります。

また、ダウンストリームの Kafka トピックに不足しているデータがある場合に、リアルタイム ストリーミング ジョブを再起動して実行するなど、ワークフローを利用する簡単ではない方法も含める予定です。

メンターと協力してプロジェクトの範囲をさらに絞り込み、そこからタスクを完了します。

今後数か月間、素晴らしい時間を過ごせることを楽しみにしています。