Lynn's Journey — BigQuery для анализа данных в сфере здравоохранения

Линн Лэнгит, GDE, Cloud
«Будьте готовы тратить 20-25% своего профессионального времени на обучение на протяжении всей своей карьеры».
Вопросы и ответы с Линн
-
В: Какие инструменты Google вы использовали?А: Так много! Мои любимые облачные сервисы Google — CloudRun, BigQuery, Dataproc. Любимые инструменты — редактор Cloud Shell, браузер с поддержкой SSH для Compute Engine и сведения о выполнении больших запросов.
-
В: Какой инструмент вам больше всего понравился? Почему?О: Мне нравится использовать инструмент Variant Transforms с открытым исходным кодом для файлов данных VCF [или геномных]. Этот инструмент позволяет биоинформатикам быстро работать с BigQuery. Исследователи используют инструмент VariantTransforms для проверки и загрузки файлов VCF в BigQuery. VariantTransforms поддерживает рабочие нагрузки анализа данных в масштабе генома. Эти рабочие нагрузки могут содержать сотни тысяч файлов, миллионы геномных образцов и миллиарды входных записей.
-
В: Расскажите, что вы создали в прошлом с помощью инструментов Google.Ответ: Я работал с командами по всему миру над созданием, масштабированием и развертыванием нескольких конвейеров данных геномного масштаба для здоровья человека. Недавние примеры использования — это анализ данных в поддержку разработки лекарств от Covid или рака.
-
В: Какой совет вы бы дали тем, кто только начинает свой путь разработчика?Ответ: Будьте готовы тратить 20–25% своего профессионального времени на обучение на протяжении всей своей карьеры. Все общедоступные облачные сервисы, включая Google Cloud, постоянно развиваются. Для эффективного построения требуется знание как облачных шаблонов, так и сервисов на глубоком уровне.