Questa pagina contiene i dettagli di un progetto di documentazione tecnica accettato per la stagione della documentazione di Google.
Riepilogo progetto
- Organizzazione open source:
- Apache Airflow
- Technical Writer:
- kartik khare
- Nome del progetto:
- Come creare un flusso di lavoro
- Durata del progetto:
- Durata standard (3 mesi)
Project description
Mi occuperò di creare la documentazione su come creare nuovi flussi di lavoro in modo facile ed efficace. Ecco alcuni dei passaggi coinvolti nei flussi di lavoro:
- Leggi
- Pre-elaborazione
- Elaborazione
- Post-elaborazione
- Salva/azione
- Monitoraggio
Ogni passaggio può includere più attività ed è possibile eseguire una serie di azioni dopo ogni passaggio, ad esempio interrompere il job se due o più attività non vanno a buon fine o ripetere un'attività se non riesce per almeno due volte.
Un'altra parte dei flussi di lavoro include l'esecuzione di 2 o più job in parallelo e poi l'utilizzo dei risultati combinati per la fase successiva.
Un altro aspetto di un flusso di lavoro è avvisare l'utente in caso di problemi tramite posta, Slack o il servizio di pager.
Prevedo anche di includere alcuni modi non banali in cui è possibile utilizzare i flussi di lavoro, ad esempio eseguire job di flussi di dati in tempo reale al riavvio su eventuali dati mancanti negli argomenti Kafka downstream.
Collaborerò con i mentor per perfezionare l'ambito del progetto e poi completare le attività.
Non vedo l'ora di vivere questi mesi incredibili.