WEBVTT 00:00:02.120 --> 00:00:03.830 在探索世界的道路上 00:00:03.830 --> 00:00:06.240 我们走得比以往任何文明都更远 00:00:07.670 --> 00:00:10.476 但有一个问题始终困扰着我们: 00:00:11.150 --> 00:00:12.800 蛋白质是如何折叠的 00:00:14.180 --> 00:00:19.600 蛋白质如何从氨基酸链 折叠成驱动生命的精密机器 00:00:19.600 --> 00:00:22.180 这一过程至今仍是未解之谜 00:00:22.490 --> 00:00:25.040 探究蛋白质时,你会发现它如此令人着迷 00:00:25.040 --> 00:00:28.020 你可以把它们视作生物界的纳米机器 00:00:28.160 --> 00:00:31.110 它们是构成地球上所有生命体的基本单元 00:00:31.110 --> 00:00:33.290 是推动生命运转的微观引擎 00:00:34.120 --> 00:00:37.512 如果能利用AI准确预测蛋白质结构 00:00:37.740 --> 00:00:40.580 我们对自然界的认知将发生颠覆性改变 00:00:40.716 --> 00:00:42.791 AlphaFold 00:00:42.902 --> 00:00:46.480 DeepMind / 伦敦 2018年春 00:00:46.720 --> 00:00:51.975 [Demis Hassabis - DeepMind创始人暨CEO] 蛋白质折叠堪称生物学界“圣杯级”难题之一 00:00:52.080 --> 00:00:53.240 我们一直坚信 00:00:53.240 --> 00:00:58.110 AI能加速重大科学突破的进程 00:00:58.110 --> 00:01:00.050 - 后面我可能会做些调整 00:01:00.050 --> 00:01:01.560 - 可能会产生些影响 00:01:01.600 --> 00:01:03.284 - 它应该创建一个distogram文件 00:01:03.284 --> 00:01:04.620 - 和一个背景distogram文件 00:01:04.620 --> 00:01:08.060 我们已经在AlphaFold系统上耕耘了两年多 00:01:08.060 --> 00:01:11.560 未来,生物学家可能无需再辛苦做实验 00:01:11.560 --> 00:01:13.860 而是可以借力于AI 00:01:13.860 --> 00:01:16.870 快速高效地直接预测蛋白质结构 00:01:17.250 --> 00:01:21.830 [Kathryn Tunyasuvunakool - DeepMind科学工程师] 生物学家对计算机能否解决这类问题往往持怀疑态度 00:01:22.010 --> 00:01:24.790 这种质疑是健康的科学态度,值得尊重 00:01:24.790 --> 00:01:27.573 但我对AlphaFold的潜力充满期待 00:01:28.630 --> 00:01:30.860 [Andrew Senior - DeepMind研究科学家] CASP就像一场期末考 00:01:30.860 --> 00:01:34.156 向全世界展示DeepMind 在蛋白质折叠预测领域的成绩单 00:01:34.156 --> 00:01:37.248 和别人比比看,是名列前茅还是差强人意 00:01:37.409 --> 00:01:40.000 我们决定参加CASP竞赛 00:01:40.000 --> 00:01:43.740 就是为了挑战这个蛋白质折叠领域的“奥运会” 00:01:43.740 --> 00:01:45.816 [John Moult - CASP联合创始人,马里兰大学] 我们举办CASP竞赛 00:01:45.816 --> 00:01:50.380 [John Moult - CASP联合创始人,马里兰大学] 是为了加速破解蛋白质折叠难题 00:01:50.640 --> 00:01:53.820 回首1994年,我们创立CASP竞赛时 00:01:53.960 --> 00:01:57.535 我对挑战之艰巨显然认识不足 00:01:58.000 --> 00:01:59.487 - 这个方法太繁琐了 00:01:59.487 --> 00:02:00.920 - 花的时间太长了 00:02:00.920 --> 00:02:03.160 - 我们看看还有什么改进方法 00:02:03.270 --> 00:02:07.240 通常,全球约有100个团队参与CASP竞赛的角逐 00:02:07.370 --> 00:02:10.150 我们会选取100种蛋白质 00:02:10.280 --> 00:02:14.992 让各团队预测并提交它们的空间结构 00:02:15.120 --> 00:02:19.244 对照CASP12的标准答案,我们的得分是57.9 GDT 00:02:19.600 --> 00:02:23.961 [John Jumper - DeepMind AlphaFold项目主管] CASP竞赛的评分标准就是GDT分数 00:02:25.380 --> 00:02:27.240 满分为100 00:02:27.560 --> 00:02:29.940 GDT分数达到90以上 00:02:30.220 --> 00:02:32.310 才算是“答题正确” 00:02:33.350 --> 00:02:34.760 如果能实现这一目标 00:02:34.760 --> 00:02:36.961 将对医学领域产生革命性的影响 00:02:37.000 --> 00:02:39.210 [Pushmeet Kohli - DeepMind科学AI主管] 这一课题意义重大 00:02:39.210 --> 00:02:44.176 [Pushmeet Kohli - DeepMind科学AI主管] 从疾病的进展机制,到新药的研发 00:02:44.890 --> 00:02:45.926 潜力无限 00:02:46.040 --> 00:02:48.193 - 我原本只是想做一个简单的系统 00:02:48.193 --> 00:02:49.824 - 没想到效果这么好 00:02:49.964 --> 00:02:52.798 新技术为团队带来了惊喜 00:02:52.850 --> 00:02:53.944 - 不仅更精确 00:02:53.944 --> 00:02:56.070 - 速度相比旧系统也大幅提升 00:02:56.080 --> 00:02:59.481 - 我认为我们将实现巨大的飞跃 00:02:59.481 --> 00:03:01.470 - 这将彻底改变游戏规则 00:03:02.160 --> 00:03:03.560 在CASP13中 00:03:03.680 --> 00:03:05.867 我们取得了里程碑式的进展 00:03:06.200 --> 00:03:11.460 我们见证了人工智能在这个领域的首次成功应用 00:03:11.480 --> 00:03:14.120 我们一举突破了该领域的现有技术水平 00:03:14.120 --> 00:03:15.265 虽然成果喜人 00:03:15.265 --> 00:03:18.200 但距离真正破题,仍有很长的路要走 00:03:18.360 --> 00:03:21.970 我们已经大致勾勒出许多蛋白质的轮廓 00:03:22.080 --> 00:03:24.890 但原子层面的精确定位 00:03:24.890 --> 00:03:27.320 即真正意义上的解决方案 00:03:27.480 --> 00:03:28.810 仍有待突破 00:03:29.540 --> 00:03:32.920 如果你的目标是登月,那再高的梯子也没用 00:03:32.920 --> 00:03:33.920 2019年春 00:03:33.920 --> 00:03:36.667 CASP夺冠后,我们遇到了瓶颈 00:03:37.220 --> 00:03:39.229 我们回到原点,集思广益 00:03:39.229 --> 00:03:40.960 力求突破思维桎梏 00:03:41.920 --> 00:03:43.820 经过一段时间的蛰伏酝酿 00:03:43.820 --> 00:03:46.747 团队循着全新思路,找回状态,渐入佳境 00:03:47.327 --> 00:03:50.920 现在,新思路的优势日益显现 00:03:51.050 --> 00:03:52.710 助力我们更上一层楼 00:03:52.750 --> 00:03:55.280 这一转折点意义重大 00:03:55.280 --> 00:03:57.220 我曾多次见证类似时刻 00:03:57.370 --> 00:03:59.180 我深知其重要性 00:03:59.180 --> 00:04:01.280 此时不搏,更待何时? 00:04:01.390 --> 00:04:04.439 - 从现在起,我们需要加倍努力、全力冲刺 00:04:04.659 --> 00:04:06.387 - 没有时间可以浪费了 00:04:06.840 --> 00:04:09.415 我们志在再次征战CASP 00:04:09.600 --> 00:04:11.640 但CASP真的让人压力山大 00:04:11.750 --> 00:04:14.480 [Tim Green - DeepMind AlphaFold技术主管] - 模型的学习状况有些蹊跷 00:04:14.480 --> 00:04:17.340 [Tim Green - DeepMind AlphaFold技术主管] - 它学到了与GDT关联的知识 00:04:17.380 --> 00:04:18.570 - 但没有经过校准 00:04:18.655 --> 00:04:19.876 - 我觉得有些不对劲 00:04:20.010 --> 00:04:22.900 - 按说应该眨眼间就能学会 00:04:23.380 --> 00:04:27.110 DeepMind之外 技术进步同样令人瞩目、成果斐然 00:04:27.110 --> 00:04:29.650 [Richard Evans - DeepMind研究科学家] 也许,某个默默无闻的黑马团队 00:04:29.650 --> 00:04:31.735 正蓄势待发,等着一鸣惊人 00:04:31.790 --> 00:04:33.360 有人问我是不是该慌了? 00:04:33.360 --> 00:04:35.188 当然,我们早就该慌了! 00:04:35.188 --> 00:04:36.360 - 表现虽有提升 00:04:36.360 --> 00:04:38.801 - 但与顶尖模型相比还有差距 00:04:39.050 --> 00:04:41.627 - 看来还有提升空间 00:04:41.730 --> 00:04:43.600 百密一疏在所难免 00:04:43.600 --> 00:04:46.430 因此,CASP这样的盲测才尤为重要 00:04:46.430 --> 00:04:48.750 是检验成果是否可靠的“试金石” 00:04:48.760 --> 00:04:51.340 显然,我对CASP14充满期待 00:04:51.340 --> 00:04:53.680 我们现在要全神贯注、心无旁骛 00:04:53.680 --> 00:04:56.340 全力以赴攻克难题,实现最终目标 00:04:57.290 --> 00:05:00.700 2020年春 00:05:01.320 --> 00:05:07.580 - 首相颁布了英国近年来最严厉的禁足令 00:05:08.030 --> 00:05:11.310 - 我要向全体英国人民传达一条简单明确的指令 00:05:11.310 --> 00:05:12.930 - 待在家中,切勿外出 00:05:14.480 --> 00:05:17.640 我们原计划于4月15日参加CASP 00:05:17.640 --> 00:05:19.940 竞赛原本在那天揭幕 00:05:20.070 --> 00:05:22.976 因新冠疫情影响,不得不推迟一个月 00:05:23.270 --> 00:05:25.349 我真的好想念大家! 00:05:25.530 --> 00:05:28.499 一开始调整生活节奏确实费了些功夫 00:05:28.700 --> 00:05:32.194 尤其是我太太也感染病毒,让我有些手忙脚乱 00:05:32.560 --> 00:05:34.560 好在她的症状并不严重 00:05:34.670 --> 00:05:36.850 CASP周一正式开赛了 00:05:36.970 --> 00:05:38.940 - John,我能看下这张图吗? 00:05:38.940 --> 00:05:40.480 - 这张跟标准答案对比的 00:05:40.480 --> 00:05:41.870 - 我们在这里的表现不太好? 00:05:41.870 --> 00:05:43.760 - 其实我们在这个区域表现不错 00:05:43.760 --> 00:05:44.680 - 试想一下 00:05:44.680 --> 00:05:46.720 - 如果我们没有让它绕到这里 00:05:46.720 --> 00:05:48.680 - 而是延伸到正确位置 - 对,该是那边 00:05:48.935 --> 00:05:52.281 迄今为止,CASP竞赛中最棘手的蛋白质之一 00:05:52.281 --> 00:05:55.220 是一种名为Orf8的SARS-Cov-2蛋白 00:05:55.360 --> 00:05:57.880 Orf8是新冠病毒中的一种蛋白 00:05:57.880 --> 00:06:02.340 为了改进对它的预测,我们可谓是绞尽脑汁 00:06:02.340 --> 00:06:05.390 可能是我们对单个蛋白投入时间最多的一次 00:06:05.630 --> 00:06:08.350 CASP赛程已过三分之二 00:06:08.610 --> 00:06:10.770 我们已收到三种蛋白质的答案 00:06:10.880 --> 00:06:15.260 新冠病毒Orf8蛋白的真实结构已经揭晓 00:06:16.010 --> 00:06:19.280 事实证明,我们的预测结果非常准确 00:06:20.090 --> 00:06:22.020 大家做得非常出色 00:06:22.020 --> 00:06:24.360 所有人共同努力,创造了奇迹! 00:06:24.750 --> 00:06:27.320 在CASP14中,我们见证了一支团队 00:06:27.650 --> 00:06:30.745 一举实现了原子级精度 00:06:31.270 --> 00:06:34.320 从根本上解决了我们领域的两大难题: 00:06:34.450 --> 00:06:37.629 如何找到正确的解决方案 00:06:37.629 --> 00:06:40.904 以及如何确认自己 已经找到了正确的解决方案 00:06:40.904 --> 00:06:42.625 - 人差不多到齐了吗? 00:06:43.600 --> 00:06:45.460 - 我要给大家念一封电邮 00:06:45.760 --> 00:06:48.220 - 这封信是John Moult发来的 00:06:48.910 --> 00:06:50.200 - 信上这么说: 00:06:50.200 --> 00:06:52.360 - John,我想你已经知道了 00:06:53.160 --> 00:06:56.940 - 你的团队在CASP14中的表现令人惊叹 00:06:57.120 --> 00:06:59.100 - 无论是相对于其他团队 00:06:59.100 --> 00:07:01.370 - 还是在模型的绝对精度方面 00:07:02.920 --> 00:07:04.800 - 恭喜你们取得出色成果 00:07:04.800 --> 00:07:06.223 - 实在非凡! 00:07:06.560 --> 00:07:09.190 AlphaFold横空出世,向前迈出一大步 00:07:09.190 --> 00:07:11.640 将为药物研发按下加速键 00:07:11.640 --> 00:07:14.270 为我们深入了解疾病的奥秘带来曙光 00:07:14.280 --> 00:07:15.660 这是划时代的突破! 00:07:15.990 --> 00:07:18.300 这样的成果对我来说意义非凡 00:07:18.300 --> 00:07:22.170 在蛋白质折叠问题上,我们经历了漫长的探索 00:07:22.170 --> 00:07:24.840 屡屡受挫,也曾怀疑过能否走到终点 00:07:25.040 --> 00:07:28.360 而如今,我们竟然攻克了这个难题,梦想成真! 00:07:28.840 --> 00:07:30.880 科学的力量让我深受鼓舞 00:07:30.880 --> 00:07:33.090 它的魅力就在于不可预知性 00:07:33.090 --> 00:07:37.010 你永远无法确切预见 甚至无法粗略估计下一步的发展 00:07:37.480 --> 00:07:39.230 科学的道路上总会有惊喜 00:07:39.230 --> 00:07:42.240 正是这些惊喜 激励着科研工作者不断前行 00:07:42.240 --> 00:07:44.420 下一个惊喜,又会是什么呢?