把用现有技术去跑1万个蛋白靶点,每个还要对10亿个分子的这类计算任务,以前要是用超算去干,得耗费数百年,现在兰艳艳教授他们通过AIR和清华的团队攻关,直接把这个耗时百年的活变成了单日干完。就是拿配置128核CPU和8张显卡的单个机器,一天就能把原本需要10的13次方次匹配的工作量给解决了,效率提升了足足百万倍。 这就好比以前要从“大海捞针”变成“精准定位”,DrugCLIP这个基于AI的超高通量平台成功搞定了新药研发里最头疼的那道数学题。它打破了传统分子对接的套路,直接把三维空间的分子对接转化成了向量空间里的高效语义匹配。 这个技术突破带来的好处非常大。研究团队不光把1万个蛋白靶点、2万个蛋白口袋和5亿个类药小分子的数据全跑完了,还找到了200多万个潜在活性分子。他们甚至把这些数据全都免费放在了线上平台上给大家用。 北京1月9日发的这篇《科学》文章透露了一个关键信息:目前人类找到的靶向药才覆盖了人体靶点的约10%,还有数以万计的新靶点等着挖掘。原来的分子对接方法虽然先进,但是计算量太大就卡死了研发进度。 DrugCLIP的核心是用自然语言处理的语义检索思路来干的。这就像换了一套玩法一样,以前要在三维空间里一点一点试错的过程被简化了。靠着这种新方法,原本几年甚至几十年才能搞定的任务现在几天就能完成。 这种模式很厉害。研究团队已经给1400多名国内外的科学家提供了13500多次定制化筛选服务。这种开放共享的态度不仅体现了中国科学家的视野和担当,还能加快把研究成果变成临床治疗的速度。 业内专家说这有三重意义:第一是把源头发现的效率提上去了;第二是给理解生命系统提供了大数据支持;第三是为生物医药行业的数字化转型找了条能复制的路子。 现在DrugCLIP已经成为了中国在AI和生物医药交叉领域的一大标志。它证明了我们有能力解决世界级难题,也展示了中国科学家要为人民健康突破“无人区”的决心。 以后在抗癌、防治传染病、治疗罕见病这些方面深化应用DrugCLIP的话,肯定能给全球新药研发体系注入新的活力。