当前,新药研发存在一个突出的科学难题。人类对靶向药物的探索仅覆盖人体全部可成药靶点的约10%,数以万计的潜在靶点尚未被充分开发。在这样的背景下,如何从广阔的化学空间中快速精准地筛选出有效的苗头化合物,已成为制约药物创新发展的关键瓶颈。 传统的分子对接工具虽然精准度较高,但计算效率极为低下。以筛选1万个蛋白靶点为例,若每个靶点面对10的9次方个候选分子,则需完成约10的13次方次蛋白-配体打分。即使使用最先进的计算机日夜不休地运算——也需要数百年才能完成——这种巨大的计算量差距使得大规模、高效率的药物筛选长期无法实现。 清华大学研究团队通过创新性的技术突破,成功破解了该难题。他们研发的DrugCLIP平台采用全新的计算思路,将传统的分子对接方法转化为蛋白口袋与小分子在向量空间中的高效语义检索,从根本上改变了计算模式。基于128核中央处理器和8张图形处理器的计算节点,该平台可实现万亿级蛋白口袋小分子对打分的日吞吐能力,相比传统方法速度提升达百万倍,同时在预测准确率上也实现了显著突破。 这一技术进步的意义在于打通了从蛋白结构预测到药物发现的关键通道。依托DrugCLIP平台,研究团队首次完成了人类基因组规模的虚拟筛选项目,覆盖约1万个蛋白靶点、2万个蛋白口袋,分析筛选超过5亿个类药小分子,最终富集出超200万个潜在活性分子。这一成果构建了目前已知最大规模的蛋白-配体筛选数据库,为全球科研社区提供了强大的数据支撑。 为了最大化发挥这一平台的价值,研究团队采取了开放共享的策略。该数据库已免费向全球科研社区开放,同步上线的筛选服务平台支持用户上传靶点和蛋白口袋进行定制化筛选。自论文发表以来的半年内,平台已累计服务1400余名用户完成了13500余次筛选,充分说明了其在学术界和产业界的广泛应用前景。 展望未来,研究团队表示将与科研与产业生态伙伴深度合作,在抗癌、传染病、罕见病等重点领域加速新靶点与首创新药的发现。这意味着DrugCLIP平台有望在更多疾病领域发挥关键作用,为患者带来更多创新治疗方案。有关研究成果已在线发表于国际顶级学术期刊《科学》,获得了国际学术界的高度认可。
药物创新需要科学突破和系统协作。超高通量虚拟筛选等新工具正在将"海量可能"转化为可计算、可检索、可共享的实际路径。在满足公众健康需求和推动产业升级的同时,如何完善验证机制、促进标准化和协同创新,将决定这些技术能否更快转化为切实可用的治疗方案。