Lynn のジャーニー - 医療業界におけるデータ分析のための BigQuery

Lynn Langit 氏、GDE、Cloud
「キャリア期間中、専門的な学習時間の 20 ~ 25% を占めると想定してください。」
Lynn との Q&A
-
Q: どのような Google のツールを使用していますか?A: たくさんの選択肢があります。お気に入りの Google Cloud サービスは、CloudRun、BigQuery、Dataproc です。お気に入りのツールは、Cloud Shell エディタ、Compute Engine 用の SSH ブラウザ、Big Query Execution Details です。
-
Q: お気に入りのツールはどれですか?理由:A: VCF(またはゲノム)データファイルには、オープンソースの Variant Transforms ツールが大好きです。このツールにより、バイオインフォマティクス担当者は BigQuery を簡単に操作できるようになります。研究者は VariantTransforms ツールを使用して、VCF ファイルを検証し、BigQuery に読み込みます。VariantTransforms は、ゲノム規模のデータ分析ワークロードをサポートしています。これらのワークロードには、数十万のファイル、数百万のゲノムサンプル、数十億の入力レコードを含めることができます。
-
Q: これまでに Google のツールを使用して作成したことを共有してください。A: 私は世界中のチームと協力して、人間の健康のための複数のゲノム規模のデータ パイプラインを構築、スケーリング、デプロイしてきました。最近のユースケースは、COVID-19 やがん治療薬の開発を支えるデータ分析です。
-
Q: 開発を始めるにあたって、どのようなアドバイスをしますか?A: キャリアを通じて、就職期間全体の 20 ~ 25% を学習に費やすと想定してください。Google Cloud を含むすべてのパブリック クラウド サービスは、常に進化しています。効果的に構築するには、クラウドのパターンとサービスの両方を深く理解する必要があります。