Lynn's Journey - BigQuery per l'analisi dei dati nel settore sanitario

Lynn Langit, GDE, Cloud
"Aspettati di trascorrere il 20-25% del tuo tempo professionale per la durata della tua carriera."
Domande e risposte con Lynn
-
D: Quali strumenti Google avete utilizzato?R: Tantissime! I miei servizi Google Cloud preferiti sono CloudRun, BigQuery, Dataproc. Gli strumenti preferiti sono l'editor di Cloud Shell, il browser SSH per Compute Engine e i dettagli di esecuzione di Big Query.
-
D: quale strumento hai preferito utilizzare? Come mai?R: Mi piace usare lo strumento open source Variant Transforms per i file di dati VCF [o genomici]. Questo strumento permette ai bioinformatici di lavorare rapidamente con BigQuery. I ricercatori usano lo strumento VariantTransforms per convalidare e caricare i file VCF in BigQuery. VariantTransforms supporta i carichi di lavoro di analisi dei dati su scala genomica. Questi carichi di lavoro possono contenere centinaia di migliaia di file, milioni di campioni genomici e miliardi di record di input.
-
D: Condividi qualcosa che hai creato in passato utilizzando gli strumenti Google.R: Lavoro con team di tutto il mondo per creare, scalare ed eseguire il deployment di più pipeline di dati su scala genomica per la salute umana. I casi d'uso recenti sono l'analisi di dati a supporto del Covid o dello sviluppo di farmaci antitumorali.
-
D: quali consigli daresti a qualcuno per iniziare il suo percorso di sviluppatore?R. Prevedi di dedicare il 20-25% del tuo tempo professionale all'apprendimento per tutta la durata della tua carriera. Tutti i servizi cloud pubblici, incluso Google Cloud, sono in continua evoluzione. Per creare in modo efficace è necessario conoscere a fondo sia i pattern che i servizi cloud.