Apache Airflow プロジェクト
コレクションでコンテンツを整理
必要に応じて、コンテンツの保存と分類を行います。
このページでは、Google Season of Docs に承認された技術文書作成プロジェクトの詳細について説明します。
プロジェクトの概要
- オープンソース組織:
- Apache Airflow
- テクニカル ライター:
- kartik khare
- プロジェクト名:
- ワークフローを作成する方法
- プロジェクトの長さ:
- 標準期間(3 か月)
プロジェクトの説明
新しいワークフローを簡単に効果的に作成する方法に関するドキュメントの作成に取り組んでいます。ワークフローには、次のステップが含まれます。
- 読み取り
- 前処理
- 処理中
- 後処理中
- 保存/アクション
- モニタリング
各ステップには複数のタスクが含まれ、各ステップの後にさまざまなアクションを実行できます。たとえば、ステージで 2 つ以上のタスクが失敗した場合はジョブを中止したり、タスクが 2 回以上失敗した場合はタスクを再実行したりできます。
ワークフローの他の部分では、2 つ以上のジョブを並行して実行し、その結果を組み合わせて次のステージに活かします。
ワークフローのもう一つの側面として、郵便、スラック、ポケベル業務など、なんらかの問題が発生した場合にユーザーにアラートを出す機能もあります。
また、ダウンストリームの Kafka トピックに不足しているデータがある場合に、リアルタイム ストリーミング ジョブを再起動して実行するなど、ワークフローを利用する簡単ではない方法も含める予定です。
メンターと協力してプロジェクトの範囲をさらに絞り込み、そこからタスクを完了します。
今後数か月間、素晴らしい時間を過ごせることを楽しみにしています。
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2025-07-25 UTC。
[null,null,["最終更新日 2025-07-25 UTC。"],[],["The project focuses on documenting the creation of new workflows for Apache Airflow. Key steps in workflows include reading, pre-processing, processing, post-processing, saving/action, and monitoring, each potentially involving multiple tasks. Workflows can handle task failures, parallel job execution, and combined result utilization. Alerting users via mail, Slack, or PagerDuty in case of errors is also part of workflows. The project will also include workflows for running real-time streaming jobs and restarting them on missing data.\n"],null,[]]