从2011年到2016年,IBM Watson热度高涨,似乎全世界都在讨论其知识图谱可能为药物发现和医疗健康带来的巨变。2014年,当深度学习开始在多种任务中显示出超越人类的实力时,媒体开始关注从事药物发现的人工智能初创公司,围绕人工智能的突破进行大量报道。最佳例子便是DeepMind的AlphaFold。自AlphaFold在2018年第13届蛋白质结构预测关键评估(CASP)比赛中拔得头筹后,媒体持续跟踪报道,称之为加速药物发现的关键突破点。然而四年过去,没有一个AlphaFold辅助的药物研发项目进入临床阶段。
人工智能和机器人技术有望彻底颠覆制药行业,并因此引发了巨大的关注。从根本来说,这是件好事,毕竟以药物发现为首的科学技术的发展确实需要更多的力量。然而,各界往往会忽略那些在机器学习和人工智能应用方面都很出色的大型制药公司。
从诺华和葛兰素史克等跨国制药巨头,再到其他较少有人关注的制药行业玩家,许多公司都在大力推动内部人工智能技术的应用。作为英矽智能的创始人兼首席执行官,我有幸从诸多行业合作中一窥大型制药公司对于AI制药平台的使用情况,对利用AI或者机器学习技术赋能创新药物,并推进到临床试验甚至上市阶段的项目也有所了解。
(资料图片仅供参考)
目前,我已经与制药行业数以百计的杰出科学家们达成过合作,真是倍感荣幸。这其中有很多精彩的故事,但出于对大药企保密性政策的尊重,许多前沿突破性进展都不能提前公开,希望未来能有机会和大家一起见证这些变革。在今天这篇文章里,故事的主角是Jiye Shi博士,一位对行业贡献巨大的关键人物。
由于对Bimekizumab研发的巨大贡献,Terry Baker(右)和Jiye Shi获“优时比伙伴”表彰,来源:Jiye Shi博士
作为礼来副总裁兼计算机设计与自动化平台负责人,Jiye Shi博士在过去一年内连点成线,将过往零散的药物发现工作进行了重组和精简,并开始以结果为导向大力推进人工智能和机器人技术。在此之前,他曾在全球性创新型生物医药公司优时比负责全球计算机辅助药物设计(CADD)业务。(作者注:优时比总部位于比利时,以其在药物化学方面的成就闻名,吡拉西坦之类我个人很喜欢的药物正是出自优时比之手。)
第一次见到Jiye Shi博士是在2015年的比利时,在英矽智能还主要关注靶点发现和抗衰研究的时候,是他帮助我们翻开了新的篇章。在我的专题分享结束后,他表示英矽智能在人工智能方面确实很优秀,但一定要踏足化学领域才能和大型药企达成规模化合作。
“在深度学习领域,英矽智能做得很好”,他说,“但要真正成为一家伟大的公司,一定要进军化学领域”。他的嗓音很特别,让我终身难忘。我回答说英矽智能暂时没有踏足化学领域的打算,但我们还是开展了相关解决方案的讨论,业界首个商业化的生成化学人工智能平台Chemistry42就是这样诞生了。值得一提的是,当Chemistry42在2020年首次发布测试版时,Jiye Shi博士曾供职的优时比,也是首批和英矽智能达成软件授权合作的客户之一,另一位客户则是德国默克公司。在Chemistry42后期发展过程中,这两家公司成为了最活跃的用户,并协助了平台强化和迭代。
2022年夏天,我在圣迭戈再一次见到了Jiye Shi博士,有了以下这段对话。
Jiye Shi博士:“英矽智能在小分子生成化学方面做得不错,不过我觉得,把业务拓展到生物药设计很有必要。”
Alex Zhavoronkov博士:“我们有在做这方面的研究,不过我想做一些比其他公司更宏大的事情,不想只是替换几个氨基酸。很多公司对外宣称自己是AI驱动的biotech,但事实上他们使用的机器学习技术并不算先进。”
Jiye Shi博士:“志向高远是没错,但有时也要看到唾手可得的成就。你知道吗,我已经把一款AI/机器学习辅助设计的抗体药物推到了临床。我说的可不是临床试验的临床,是临床应用。这款药物已经获批上市了。”
Alex Zhavoronkov博士:“真的吗?真是难以置信。一款药物光在临床试验阶段就要花几年时间,这怎么可能呢?”
再之后,Jiye Shi博士向我讲述了Bimekizumab的故事。这是第一款同时靶向IL-17A和IL-17F的单克隆抗体,于近日获批用于治疗斑块状银屑病,针对其他适应症的临床试验也在优时比主导下有序进行中。试验数据表明,Bimekizumab药效良好,甚至超过了杨森旗下乌司奴单抗(Stelara)和诺华旗下苏金单抗(Cosentyx)等已上市药物,有望为优时比带来巨额盈利。
AI生成的单克隆抗体图片,来源:Alex Zhavoronkov博士、Midjourney
和双抗不同,Bimekizumab并不是通过不同的片段实现双靶点靶向的。换句话说,只要对Bimekizumab的一个片段进行调整,就有可能在保留传统抗体结构的同时,实现三个靶点的同时靶向,从而降低免疫原性风险。此外,Bimekizumab还有改进成为抗体药物偶联(ADC)的潜力,前景几乎难以限量。至此,机器学习辅助设计的双靶点抗体药物已经拥有了盈利能力,同时为后续药物研发提供了优秀的起点。
成功将计算机辅助设计的生物药推到获批上市阶段并非易事,能从完成如此创举的人身上汲取经验更是难得。这次见面,我抓紧机会问了Jiye Shi博士几个问题,他的回答让人茅塞顿开。
以下为与Jiye Shi 博士的专访实录:
Alex: 你同时从事人工智能 (AI)/机器学习 (ML) 领域的小分子和生物制药工作,并且拥有经批准上市销售的药物,是如今业内从事相关领域中为数不多的人之一。但我们在这个领域也看到了很多围绕人工AI/ML的炒作,AlphaFold 几乎天天都上头条,但却很少听到大药厂有突破性成果。你认为原因是什么?
Dr. Shi: AI和机器学习技术已经取得了不可思议的突破,并且已经在许多方面重塑了药物发现和分子设计过程。我很能理解当今业界对AI和机器学习技术的热情,二十年前踏足药物发现领域的我也有同样的热情,满心都是短时间内用计算结构生物学变革药物发现的憧憬。
是的,我也在早期参与过蛋白质结构预测关键评估(CASP)大赛,也得到过不错的成果,但和现在AlphaFold的成就相比完全不值一提。再进一步说,蛋白质靶点的三维结构设计对药物发现确实有促进作用,但离真正的药物设计还有很远,更不用说真正把药物送到患者手中了。在这里,我真的要感谢我的同事和导师们,是他们在过去这些年不断启发我,让我看到药物发现当中相辅相成的各个方面。对我来说,只有集思广益才能真正实现药物发现突破,众人拾柴火焰高。我说的“人”既包括人类,也包括AI和机器学习技术。
简单来说,药物发现突破需要各大科技领域的进展。对大药企而言,一款新药的获批上市总是值得庆祝的重大消息,但这样的成功是以AI、机器学习技术等多种技术的革新为基础的。对规模较小的初创公司而言,在细分技术赛道发力、关注核心竞争力是常见做法,这也是理所应当。我要说的是,初创公司应该在药物管线搭建阶段关注沟通,不管是做内部研发还是外部合作,都要将自身核心竞争力对外宣传出去。
Alex: 据我所知,Bimekizumab 是 UCB 首个计算机设计的单克隆抗体,是一种潜在的重磅治疗方法。你认为这是业界第一个通过计算设计的抗体,还是说你知道有其他先例?
Dr. Shi:这取决于你所说的 "计算机设计 "是什么意思。在实验筛选后,采用计算机设计进行抗体特性微调已经不是新鲜事了。我本人长期关注很多产业先驱,包括Medimmune的Bojana Popovic,礼来的Qing Chai、BigHat Biosciences的Mark DePristo,他们不仅开发了用于抗体效果和类药性预测的前沿计算方法,还将其运用到药物发现实践。我认为过去十年中获批的许多单克隆抗体,以及目前正在进行临床试验或早期发现的更多单克隆抗体,都在某种程度上受到了计算机技术的辅助。对于Bimekizumab来说,最特别的点在于药物最终结构是由计算机设计的,而且起到了双靶点靶向的效果。据我所知,Bimekizumab是目前市场上第一个也是唯一一个计算机设计的双靶点抗体药物。
Alex: 您能告诉我们关于发现 Bimekizumab的过程和时间线吗?
Dr. Shi:从2008年开始,公司就有针对IL17A和IL17F进行双靶点药物设计的想法,原因是生物学家提出的假说表明,同时靶向两个靶点有望高效治疗银屑病,同时清除炎症。在18个月的时间里,研发团队已经筛选了几十亿个抗体结构,也找到了一些潜力不错的抗体,但没有一个可以同时靶向两个靶点。生物结构学同事做出了靶点的3D结构,我们也了解了候选抗体的作用机制。所有的传统结构设计方法都用过了,但没有结果。当时简直是山穷水尽,团队已经做好了就此停手的准备。
还好我们没有放弃。在那个时候,研发团队决定尝试一下内部新开发的机器学习算法。该算法基于两个大胆的假设,其中一个是我的同事Alastair Lawson提出的假说:如果从现有的蛋白质结构数据集中学习蛋白质相互结合所利用的原子相互作用的规则,就可以将所学的知识应用于计算机设计,辅助有效靶向目标靶点的抗体设计。然而在2009年时,蛋白质复合体数据并不充分,不足以支撑有效的机器学习。这时第二个假说就发挥作用了:蛋白质之间的相互作用,本质上与单个蛋白质用以维持自身结构的原子相互作用并无区别。换句话说,分子内相互作用的大量数据可以用作分子间相互作用数据集的补充,进而支持机器学习系统。这个方法在2013年已经申请了专利。
在算法辅助下,研究团队得出了18种可能的药物结构,以单纯靶向IL17A的抗体为起点进行了几十次试验。这次我们没有重复几十亿个分子的大量筛选,最终挑选出5种有潜力的突变,通过结合实现了IL17F亲和力近200倍的增长,同时保留了IL17A亲和力,整个过程耗时3个月Bimekizumab就这样诞生了。我想向我亲爱的同事和朋友Terry Baker表示敬意,他在算法开发和抗体设计方面都起到了重要作用。不幸的是,在Bimekizumab在欧洲获得批准前不久,他就去世了。Bimekizumab是他为患者留下的重要遗产,他是我的英雄。
Alex: 这是一个非常有趣的成功故事。但在生物制药领域,我们可以在更多方面利用现代机器学习。你认为在有哪些巨大挑战可以利用人工智能助力解决?
Dr. Shi:我认为最主要的挑战是提高生物药的安全性和耐受性。
由于毒性研究首先在动物身上进行,试验对象不同导致的效果差异可能会导致对早期对药物毒性的认知不足。理想情况下,我们希望一种药物在人类和动物体内产生的效用类似。对Bimekizumab也是如此,只是对象变成人类蛋白质和用于毒性研究的类似动物蛋白质而已。此外,我们希望设计出化学和热稳定性更强、免疫原性和粘度更低的抗体,以此提高安全性和舒适度。
在患者可及性方面,AI和机器学习技术也能在提高生产效率发挥重要作用。生物药生产并非易事,成本也不低。通过生产操作数字化,以及先进人工智能辅助下的来实时学习、监测和流程优化,行业有望大幅降低生物药的生产成本,真正让利于患者。
Alex: 在你看来,人工智能驱动抗体发现的前景如何?
Dr. Shi:我并不认为抗体发现的问题已经解决,这个领域仍有很大的创新空间。我相信,通过将人工智能的快速数据生成特点与生物制药相结合,生物药的整体表现有望再上一个台阶。在我看来,未来趋势不是AI驱动的抗体药物发现或者小分子药物发现,而是整体上由AI驱动的药物发现流程,对所有药物类别都一样。也就是说,小分子也好,生物药也好,DNA/RNA药物也好,行业会利用现有的所有药物类型,加强对疾病的了解和控制,并采用最佳的分类或者组合(比如抗体药物偶联)来实现患者获益最大化。
Alex: 作为头部药企中计算科学与机器人部门的掌舵人,可以分享一些公司的计划和愿景吗?
Dr. Shi: 我相信,提高药物设计流程中的数据驱动力,进而降低研发过程的偶然性,是提升行业效率的关键。所谓数据驱动的药物设计,其核心是对于设计流程的高效评估和不断学习。因此,我总是从系统的角度来看待药物设计——智能化药物设计只是其中的一小部分,学习的速度也很重要,其底层正是药物分子从设计到落地的速度、药物分子测试的效率、实验与实践的相关性,以及从实验结果中吸取经验的效率。在这些方面,AI和机器学习技术相辅相成,前景无限。我现在的工作给了我同时接触这两大前沿技术的机会,非常激动人心。
文末彩蛋:ChatGPT笔下的全文总结
既然本文以AI和机器学习为主题,不如顺便运用一下最近大火的对话式人工智能来做结尾。以下作者冒昧采用OpenAI的ChatGPT引擎,对本文进行了总结。
ChatGPT表示,“人工智能(AI)和机器人技术潜力巨大,有望彻底改变制药行业。目前,许多大型制药公司正在利用AI和机器学习技术推进新药研发进程,甚至一路走到临床试验或者上市阶段。在优时比工作期间,现任礼来公司副总裁兼计算机设计与自动化平台负责人Jiye Shi博士在机器学习技术助力下简化了药物发现工作,并于最近带领团队将首个AI设计的抗体推进到上市阶段。这一成功案例突出展示了AI大幅加速药物发现流程的潜力。”