我国科学家突破新药研发瓶颈 基因组级靶点筛选效率提升百万倍

新药研发周期长、成本高、失败率高,其中一个关键瓶颈在于“找得到、找得准”——针对已知疾病靶点,从海量候选小分子中筛出可能有效的先导化合物,常被形容为“大海捞针”。

传统筛选依赖实验高通量测试与计算模拟相结合:前者需要昂贵设备与大量试剂,后者往往要对分子结合过程进行逐步计算,面对靶点数量与候选分子规模的快速增长,速度与算力消耗成为制约研发效率的突出问题。

尤其在精准医学不断推进、靶点发现持续涌现的背景下,筛选环节的“算得慢、筛不全”容易拖累从基础研究到药物转化的整体节奏。

造成这一困境的原因,一方面在于生物大分子结构复杂、相互作用类型多样,传统计算方法需要在精度与效率之间反复权衡;另一方面在于候选化合物库规模已从百万级迈向亿级乃至更高量级,叠加多靶点、多位点的系统性需求,计算量呈指数式放大。

换言之,药物发现正从“单点突破”走向“体系作战”,但工具链在效率与覆盖面上仍存在明显短板,迫切需要新的方法学与平台化能力来支撑规模化探索。

针对上述痛点,清华大学智能产业研究院(AIR)教授兰艳艳联合生命学院、化学系团队研发的DrugCLIP平台,尝试跳出传统筛选路径,通过将蛋白质与小分子转化为计算机可快速识别的“专属信号”,实现对潜在结合关系的自动化、规模化匹配,从而减少对逐步模拟结合过程的依赖。

研究团队公布的数据表明,该平台在常规高性能计算环境下可实现极高吞吐:单日完成31万亿次匹配计算,筛选100万个候选分子耗时可低至0.02秒,相比传统方法实现数量级跃升。

效率提升的直接意义在于,把原本受限于算力与时间的早期筛选,转化为可批量、可扩展的基础能力,为后续实验验证与成药性评估“提前过滤”大量低概率方案。

在“覆盖面”方面,DrugCLIP支撑团队完成对人类基因组约1万个靶点、2万个关键位点的全覆盖筛选,并对5亿余个候选小分子进行系统分析,富集出200多万个潜在有效分子,进而建成大规模药物靶点匹配数据库并向全球科研人员开放共享。

相较以往多聚焦于少量热门靶点或特定疾病领域的筛选策略,这种“基因组级、全景式”的匹配尝试,有望让更多非传统靶点、难靶点进入可探索范围,推动药物发现从“经验驱动”向“数据与方法驱动”进一步演进。

从影响看,一是有望提高药物研发的起点效率。

早期虚拟筛选更快、更全,意味着可在更短时间内提出更多可检验的候选方案,从而提升实验资源配置效率。

二是有助于降低研发不确定性。

通过大规模匹配数据库沉淀可复用的关联信息,研究机构与企业可在立项阶段获得更充分的证据参考,减少重复试错。

三是推动开放科学与协同创新。

数据库免费开放有利于促进跨机构、跨学科合作,形成“方法—数据—应用”闭环,加速从算法突破到药物管线的转化。

也应看到,超高通量筛选并不等同于药物成功。

虚拟匹配结果仍需实验验证,且需要进一步与药代动力学、安全性、选择性等指标协同评估,避免“算得快但不成药”的偏差。

下一步对策层面,可从三方面发力:其一,强化虚拟筛选与湿实验平台的衔接,建立标准化验证流程,提高命中率与可重复性;其二,持续扩充与校准数据库,引入更多结构数据、活性数据与临床相关信息,提升预测可靠性;其三,推动平台在重点疾病领域形成示范应用,围绕肿瘤、神经退行性疾病、耐药感染等急需方向开展联合攻关,以应用反馈反哺方法迭代。

展望未来,随着生命科学数据积累加速、计算方法持续演进以及科研资源共享机制完善,药物发现有望进入“更早发现、更快验证、更精确设计”的新阶段。

基因组级全覆盖筛选若能与靶点生物学、临床表型以及真实世界证据进一步融合,将可能推动从“对症用药”向“机制导向、个体差异可解释”的研发范式升级,并在公共卫生应急、新发突发疾病应对中展现更强的技术支撑能力。

清华大学DrugCLIP平台的问世,充分体现了我国科技工作者在基础研究领域的创新能力和担当精神。

从"大海捞针"到精准导航,从数百年到一日完成,这一跨越式进步不仅刷新了技术纪录,更重要的是为人类战胜重大疾病提供了新的科学工具。

在开放共享的理念引领下,这一成果必将激发全球科研界的创新热情,推动生物制药产业迈向更高效、更精准、更包容的发展阶段。