AI+生命科学必将大有所为,2022《理解未来》世界级科学家线上开讲
4月21日,2022《理解未来》首期科学讲座——“AI+蛋白质结构和功能预测”在全网线上开讲。未来论坛理事、北京大学李兆基讲席教授谢晓亮,中国工程院院士、鹏城实验室主任、北京大学博雅讲席教授高文,美国芝加哥丰田计算技术研究所教授、北京大学客座教授许锦波,聚焦AI+生命科学,分享前沿学术成果,探讨跨学科交叉领域的深度融合创新。
在科学面临历史性机遇的今天,人工智能和传统科研结合带来的巨大潜能使 AI for Science 成为当前的重要趋势。2022年,未来论坛以AI for Science为年度系列主题,关注前沿交叉领域和科学热点话题,并以《理解未来》科学讲座作为此系列的首场活动,正式开启人工智能与科学前沿创新之旅。
作为未来论坛重磅推出的年度高质量科学公益讲座,2022《理解未来》科学讲座聚焦“AI+生命科学”,由未来论坛理事、北京大学李兆基讲席教授谢晓亮领衔倾力策划,邀请人工智能、计算机领域以及蛋白质结构预测、分子力学等生命科学领域的科学家担任主讲及对话嘉宾,分享前沿科学突破,激发科学创新思维。
谢晓亮教授首先对参会嘉宾和线上观众表达了欢迎与感谢。“2022年,未来论坛聚集各领域最具影响力的科学家,以AI for Science作为年度主题,站在科研前沿,聚集知识之光、智慧之光。今年《理解未来》科学讲座聚焦AI+Life Science,将面向科研人员、青年科学家与产业界相关人士,打造思想交流的平台。”谢晓亮教授表示,“在此,我们期待听到来自科学家关于未来科技发展趋势独到而具引领性的判断和思考,相信这也是未来论坛《理解未来》系列所承载的使命与价值。”
高文:以鹏城云脑Ⅱ超强算力赋能生命健康基础研究
在主题演讲环节,高文教授以《AI for 生命科学》为题,围绕云脑II:AI for Science智能算力,以及鹏城·扁鹊大模型等最新科研成果进行分享。
高文教授介绍,为了让AI为科学问题服务,首先要打造先进自主的云态智能算力平台,支持大规模开源、开放和模型共享。
他指出,鹏城云脑 II 已建设成为首个国产自主的 E 级 AI 算力平台,并形成了自主AI基础软件栈、AI 算法流水线,高性能并行计算等一系列支撑架构。云脑的超大规模模型训练平台现已赋能全球首个 2 千亿参数中文预训练语言模型-鹏程·盘古、多对多模式的多语言机器翻译模型-鹏程·丝路、视觉与跨模态的模型-鹏程·大圣,与百度联合开发的增强知识模型-鹏城百度·文心等多项引擎.
而在AI赋能生命健康领域,鹏城实验室正在开展建设的鹏城·扁鹊大模型通过依托鹏城云脑大装置构建横跨基因和表型的多模态知识图谱、预训练模型和高精度生理生化仿真模型等,通过对人体生命组学大数据进行数据感知融合分析建模,最终服务生命健康领域的基础研究和推动健康医疗。
许锦波:AI颠覆蛋白质结构预测改变分子生物学研究范式
本场活动中,许锦波教授以《蛋白质结构和功能预测》为题,分享通过使用人工智能,颠覆蛋白质结构预测,改变分子生物学研究范式的突破。
许锦波教授指出,由于蛋白质是由二十种天然氨基酸组成,通过原子间相互作用形成稳定的三维构象,因此,准确测定蛋白质三维结构对我们理解蛋白功能非常重要。在技术上,过去,科学家通过使用晶体衍射、核磁共振、冷冻电镜等实验技术,来测定原子的三维坐标,但这些技术通常存在耗时长、花费高、无法保证100%成功的问题。在方法上,传统的结构预测方法基于能量最小化,需要大量的计算资源,成功率很低。而深度学习技术可以从同家族蛋白的演化关系中学习并预测残基间的相互作用关系,对于蛋白质结构预测领域起到非常关键的作用。
许锦波教授介绍,2016年,团队开发的深度卷积残差网络,大幅度提高残基或原子相互作用预测的准确度。2020年,DeepMind开发的基于注意力机制的神经网络,都是需要同一个家族蛋白质的序列比对,如果一个家族里没有足够的蛋白,这些方法基本上效果都不是很好。
“通过使用人工智能,我们颠覆了蛋白质结构预测,甚至改变了很多分子生物学家的研究范式,很多人开始使用预测的结构去分析蛋白质功能。”许锦波教授也指出,目前该领域还面临一些未解决的问题,比如当一个家族里只有一个孤儿蛋白的时候,还有蛋白质的复合物,现有方法准确度还不太理想。“我们希望准确预测蛋白质在某种特定条件下的结构,和多肽、核酸的相互作用,以及预测突变对蛋白质结构功能的影响。”许锦波教授表示。
前瞻对话:AI for Science的未来十年
在前瞻对话环节,嘉宾们围绕“AI for Science及AI+生命科学的未来十年”,“ AI+生命科学目前面临的主要挑战”,“如何促进交叉学科的融合发展”以及“产业角度的应用路径和价值”等议题展开对话,分享深刻的洞察与思考。
高文教授指出,AI在未来十年的生命科学发展当中,将大有用武之地。例如:人类对于基因组学的分析,哪些片段具有哪些功能?哪些片段的突变会为人类健康带来怎样的影响?只要获取到足够多的数据,我们就可以通过AI来进行计算、分析,并给出药物、饮食方面的建议,降低或延缓人类的患病速度,提高人们的生活的质量。
另外,高文教授还表示,在小分子药物设计领域,AI也将发挥关键作用。以往,药物成分大多从自然界中提取,而有了AI的赋能,蛋白质结构和功能得以高效测定,我们可以针对某些蛋白对症治疗,并通过生成或设计蛋白质结构制作药物。预计,通过AI算法以及数据模型的不断演进,该领域十年内就会实现突破。
谈到AI+生命科学的产业应用价值,许锦波教授表示,目前AI for Science的产业化环境很好,特别是AI for BioTech。国家在AI for BioTech领域非常重视,投资机构也非常支持硬科技领域的早期、长期投资。而从产业角度来讲,由于AI在生物制药领域为各个环节赋能,帮助行业提升了效率与准确度,因此AI在该领域的产业化也具有很好的前景。
许锦波教授分享了一组数据,他指出,根据美国公布的一份报告显示,通过AI的参与,蛋白质工程的效率提高了1倍,抗体设计的时间缩短了1倍。“这是一个非常好的结果,AI应用到生物科技领域时间并不长,但已经实现了较为理想的效果,相信未来AI的赋能还将帮助整个行业实现更多突破。”他表示。
谢晓亮教授也在前瞻对话环节分享了关于AI for Life Science的理解与经验。他表示,AI for Science目前有很高的关注度,但仍要在细分领域中找到突破口,这就需要AI不断验 证、优化和迭代,从而为基础研究赋能,实现底层突破。另外,在生命科学领域,我们需要AI加强对生命过程的理解,也需要生命科学家理解AI可以做什么,当他们在一起碰撞才有可能产生问题导向,才可以真正运用AI解决重要的生物医学问题。
关于《理解未来》
《理解未来》科学讲座是未来论坛面向公众开放的高质量科学公益讲座,是联结科学与公众的桥梁与纽带,是带领公众探寻世界前沿最新科技的“望远镜”。讲座目前已成功举办70余场,超过140位科学家参与其中,包括:潘建伟、田刚、谢晓亮、Kip Thorne、陈列平、Phil Baran、李凯、薛其坤等。2022年,在科学面临历史性机遇,站在第四范式时代门槛的今天,《理解未来》将更加关注和聚焦前沿交叉领域和科学热点的系列话题,"AI+生命科学"将作为该系列的首个主题,邀请最具洞察力和前瞻性的国内外科学家担任主讲及对话嘉宾,介绍最新科研突破,分享前沿科技信息,探讨跨学科交叉领域的融合创新。