药物研发过程漫长而复杂ღ★✿★,“先导化合物的发现”是关键一步ღ★✿★。面对化合物多如牛毛ღ★✿★、靶点信息有限ღ★✿★、作用机制难以明确的困境尊龙凯时 - 人生就是搏!ღ★✿★,人工智能会发挥什么样的作用?
2024浦江创新论坛期间ღ★✿★,上海国际计算生物学创新大赛面向业界出题ღ★✿★:筛选出对NMDA受体亚型GluN1/GluN3A具有高活性的药物分子新万博亚洲ღ★✿★。来自上海科技大学的GeminiMol团队开发了一种人工智能模型ღ★✿★,该模型通过融合化合物的成药性与构象空间信息以精准表征药物分子性质ღ★✿★,从而显著提高药物筛选命中率ღ★✿★。凭借这一创新方法ღ★✿★,团队筛选出的分子在所有参赛队伍中活性最强ღ★✿★,并以总分第一的成绩斩获一等奖新万博亚洲ღ★✿★。
“尽管人工智能带来的变革刚起步ღ★✿★,但它已经显示出巨大潜力ღ★✿★。”上海科技大学研究员白芳说ღ★✿★,传统的计算生物学依赖物理模型驱动ღ★✿★,需要将生物学现象抽象成数学公式ღ★✿★,而人工智能的出现改变了这一局面ღ★✿★,“即使缺乏精确的物理模型ღ★✿★,人工智能依然可以通过‘数据驱动’的方法ღ★✿★,将物理或生物现象直接映射到所需的输出结果ღ★✿★。这种‘黑箱’特性使人工智能具有极高的应用潜力ღ★✿★,但同时也限制了模型的解释性和可控性ღ★✿★,因此展现出一种双刃剑的性质ღ★✿★。”
为什么以NMDA受体亚型GluN1/GluN3A为题?记者采访了解到ღ★✿★,NMDA受体是神经疾病的热门药物靶点ღ★✿★,与脑卒中ღ★✿★、抑郁症ღ★✿★、癫痫ღ★✿★、阿尔茨海默病ღ★✿★、疼痛等多种疾病相关ღ★✿★。而该受体亚型GluN1/GluN3A尚未被广泛开发新万博亚洲ღ★✿★,关于其蛋白结构和小分子调节剂的信息非常匮乏ღ★✿★。
如果把受体比作门锁ღ★✿★,那么药物分子就是打开门锁的钥匙ღ★✿★。在不知道锁孔形状的情况下寻找钥匙尊龙凯时 - 人生就是搏!ღ★✿★,非常困难ღ★✿★。
大赛的出题人介绍ღ★✿★,研究人员以往普遍采用高通量生物实验的方法筛选药物分子ღ★✿★,这一过程犹如大海捞针ღ★✿★。
计算生物学可以通过模拟和计算加快这一进程ღ★✿★。简单来说ღ★✿★,计算生物学是利用计算机技术研究生物学的交叉学科ღ★✿★,如今深度学习等人工智能技术可通过“干实验”(计算模拟)先从大量化合物中筛选出潜在的药物分子ღ★✿★,相当于为生物学“湿实验”(生物实验)大幅缩小了范围ღ★✿★。
“药物分子要发挥生物功能ღ★✿★,与其自身多变的三维构象和蕴含的药效信息密切相关ღ★✿★。我们开发的人工智能模型GeminiMolღ★✿★,通过对比学习的方式将构象空间信息融入分子表征中ღ★✿★。与传统分子表征方法相比ღ★✿★,这种方式显著提升了模型的表征能力和预测精度ღ★✿★。”此次斩获一等奖的GeminiMol团队成员王世航说新万博亚洲ღ★✿★,团队先调研了一些已知活性分子ღ★✿★,然后在大赛主办方提供的分子库中寻找与已知活性分子的三维药效构象高度相似ღ★✿★、二维化合物结构不相似的新分子ღ★✿★。
王世航表示ღ★✿★,团队筛选出来的药物分子ღ★✿★,对NMDA受体亚型GluN1/GluN3A的活性为0.98微摩尔ღ★✿★,这一指标的含义是发挥出药物的作用需要的剂量ღ★✿★,数值越小越好ღ★✿★。
二维结构是生成分子数据的起点ღ★✿★,构象空间则进一步反映了分子在自然状态下可能存在的动态形态ღ★✿★。如果两个化合物在构象空间上非常相似ღ★✿★,它们可能作用于相同的疾病靶标ღ★✿★,有相似药效ღ★✿★。
GeminiMol团队成员王林介绍ღ★✿★,目前的分子相似性评价工具之所以有待提升ღ★✿★,是因为其往往只关注分子的二维结构ღ★✿★:“就像人们打招呼ღ★✿★,握手和握拳的意义完全不一样ღ★✿★,不同手势会产生不同效果ღ★✿★,药物分子的空间构象也决定了其药效ღ★✿★。”
人工智能的学习能力可以将人的经验转化为可靠的模型尊龙凯时 - 人生就是搏!ღ★✿★。王林表示ღ★✿★,团队首先花费了大量时间对分子的构象空间进行采样ღ★✿★,并投喂给人工智能模型进行学习ღ★✿★。此外ღ★✿★,团队通过计算分子间的构象空间相似性形成了一系列描述符号ღ★✿★,让模型从描述符号数据中学习评价分子相似性的能力ღ★✿★。
速度快ღ★✿★,是人工智能模型的优点之一ღ★✿★。以这次比赛为例ღ★✿★,面对1800万个化合物分子ღ★✿★,GeminiMol模型仅用不到半个小时就完成了筛选评价ღ★✿★。
在筛选过程中ღ★✿★,人工智能模型还可以“集百家之长”ღ★✿★。“我们可以同时借鉴两三个已知活性较佳的分子ღ★✿★,这样得到的新分子可能兼具所有已知活性分子的药效特征或结构信息ღ★✿★。”王林说ღ★✿★。
GeminiMol团队指导老师ღ★✿★、上海科技大学研究员白芳表示ღ★✿★,计算生物学经历了几十年的发展ღ★✿★,如今迎来了从硬件到算法的显著进步ღ★✿★。硬件方面ღ★✿★,人工智能芯片ღ★✿★、专门为计算生物学设计的高性能计算机提供了计算支持ღ★✿★;算法方面新万博亚洲ღ★✿★,人工智能的第三次浪潮带来了机器学习的飞跃ღ★✿★,深度学习等先进算法不仅提高了计算生物学的预测能力ღ★✿★,还赋予了它创造新事物的可能性ღ★✿★。
“人工智能赋能药物设计的空间非常大ღ★✿★,未来会发展得更好ღ★✿★。”白芳介绍ღ★✿★,现阶段的人工智能模型并非全能ღ★✿★,其带来的变革刚起步不久ღ★✿★,很多药物设计任务中还需要基于物理模型的计算机辅助药物设计方法予以辅助ღ★✿★。
生物制药中的问题通常是极其复杂的超高维问题ღ★✿★,但当前的生物实验数据在数量上极为有限ღ★✿★,质量参差不齐ღ★✿★,并且数据之间难以对齐ღ★✿★。“面对这些高维数据的挑战ღ★✿★,我们往往需要借助物理模型对科学问题进行降维处理ღ★✿★,以简化问题并降低数据量的需求ღ★✿★。”白芳表示ღ★✿★,这是权宜之计ღ★✿★,虽然降低了对数据数量的依赖性ღ★✿★,但也要付出一些准确性上的代价ღ★✿★。
以药物设计的两种路线为例ღ★✿★,一种是参考有药效活性的分子设计药效活性更佳的新分子ღ★✿★,这正是GeminiMol团队人工智能模型的思路ღ★✿★,业界探索广泛且成效初显ღ★✿★;另一种则是基于靶标结构来设计与其适配并强结合的分子尊龙凯时 - 人生就是搏!ღ★✿★,人工智能对此虽然有一些尝试ღ★✿★,但还不成熟ღ★✿★。再如新万博亚洲ღ★✿★,业界希望让人工智能自动生成高活性的化合物ღ★✿★,但生成全新化合物往往并不容易ღ★✿★,理想与现实间还存在技术壁垒新万博亚洲ღ★✿★。
受访者提到尊龙凯时 - 人生就是搏!ღ★✿★,计算生物学的发展表明ღ★✿★,单一学科的知识和经验已不足以应对当前的科研挑战ღ★✿★。GeminiMol团队成员田思源表示ღ★✿★,尽管团队主要负责人工智能工具的开发和应用ღ★✿★,但验证环节涉及生物实验ღ★✿★,这表明科研人员最好能了解并掌握从上游到下游各个环节的知识ღ★✿★。
白芳呼吁ღ★✿★,在人才培养方面ღ★✿★,尽可能早地进行学科交叉学习和项目实践ღ★✿★,“随着人工智能技术不断发展ღ★✿★,学科交叉已是大势所趋ღ★✿★,这种跨学科的合作和知识融合ღ★✿★,将为解决复杂科学问题提供新的视角和方法ღ★✿★。”尊龙凯时人生就博官网登录ღ★✿★,Z6尊龙凯时ღ★✿★!Z6尊龙·凯时z6尊龙凯时官方网站ღ★✿★,尊龙 agღ★✿★!尊龙凯时官网ღ★✿★,