התהליך של לין – BigQuery לניתוח נתונים בתחום הבריאות

לין לנגיט, GDE, Cloud
"צפוי להשקיע 20-25% מהזמן המקצועי שלכם במהלך הקריירה שלכם".
שאלות ותשובות עם לין
-
ש: באילו כלים של Google השתמשתם?תשובה: כל כך הרבה! שירותי Google Cloud האהובים עליי הם CloudRun, BigQuery ו-Dataproc. הכלים המועדפים הם: Cloud Shell Editor, דפדפן SSH ל-Compute Engine ופרטי ביצוע של Big Query.
-
ש: באיזה כלי הכי אהבת להשתמש? למה?ת: אני אוהב להשתמש בכלי המרות של וריאציות בקוד פתוח לקובצי נתונים של VCF [או גנומי]. הכלי הזה עוזר לביו-אינפורמטיבים לעבוד עם BigQuery במהירות. חוקרים משתמשים בכלי VariantTransforms כדי לאמת ולטעון קובצי VCF ב-BigQuery. משפחת וריאנטים תומכת בעומסי עבודה בניתוח נתונים בקנה מידה גנומי. עומסי העבודה האלה יכולים להכיל מאות אלפי קבצים, מיליוני דוגמאות גנומיות ומיליארדי רשומות קלט.
-
ש: יש לשתף משהו שבניתם בעבר באמצעות הכלים של Google.תשובה: שיתפתי פעולה עם צוותים מרחבי העולם כדי לפתח, להרחיב ולפרוס כמה צינורות עיבוד נתונים בקנה מידה גנומי כדי לשמור על בריאות האדם. מקרי שימוש אחרונים הם ניתוח נתונים לתמיכה בפיתוח תרופות לקורונה או לסרטן.
-
ש: אילו עצות הייתם נותנים למישהו שהתחיל את תהליך הפיתוח שלו?תשובה: במהלך הקריירה אתם צריכים להשקיע 20-25% מהזמן המקצועי שלכם בלמידה. כל שירותי הענן הציבורי, כולל Google Cloud, משתנים כל הזמן. כדי ליצור מבנה אפקטיבי צריך להכיר את התבניות והשירותים בענן ברמה עמוקה.