我国科学家突破新药研发瓶颈基因组级靶点筛选效率提升百万倍

新药研发周期长、成本高、失败率高，其中一个关键瓶颈在于“找得到、找得准”——针对已知疾病靶点，从海量候选小分子中筛出可能有效的先导化合物，常被形容为“大海捞针”。

传统筛选依赖实验高通量测试与计算模拟相结合：前者需要昂贵设备与大量试剂，后者往往要对分子结合过程进行逐步计算，面对靶点数量与候选分子规模的快速增长，速度与算力消耗成为制约研发效率的突出问题。

尤其在精准医学不断推进、靶点发现持续涌现的背景下，筛选环节的“算得慢、筛不全”容易拖累从基础研究到药物转化的整体节奏。

造成这一困境的原因，一方面在于生物大分子结构复杂、相互作用类型多样，传统计算方法需要在精度与效率之间反复权衡；另一方面在于候选化合物库规模已从百万级迈向亿级乃至更高量级，叠加多靶点、多位点的系统性需求，计算量呈指数式放大。

换言之，药物发现正从“单点突破”走向“体系作战”，但工具链在效率与覆盖面上仍存在明显短板，迫切需要新的方法学与平台化能力来支撑规模化探索。

针对上述痛点，清华大学智能产业研究院（AIR）教授兰艳艳联合生命学院、化学系团队研发的DrugCLIP平台，尝试跳出传统筛选路径，通过将蛋白质与小分子转化为计算机可快速识别的“专属信号”，实现对潜在结合关系的自动化、规模化匹配，从而减少对逐步模拟结合过程的依赖。

研究团队公布的数据表明，该平台在常规高性能计算环境下可实现极高吞吐：单日完成31万亿次匹配计算，筛选100万个候选分子耗时可低至0.02秒，相比传统方法实现数量级跃升。

效率提升的直接意义在于，把原本受限于算力与时间的早期筛选，转化为可批量、可扩展的基础能力，为后续实验验证与成药性评估“提前过滤”大量低概率方案。

在“覆盖面”方面，DrugCLIP支撑团队完成对人类基因组约1万个靶点、2万个关键位点的全覆盖筛选，并对5亿余个候选小分子进行系统分析，富集出200多万个潜在有效分子，进而建成大规模药物靶点匹配数据库并向全球科研人员开放共享。

相较以往多聚焦于少量热门靶点或特定疾病领域的筛选策略，这种“基因组级、全景式”的匹配尝试，有望让更多非传统靶点、难靶点进入可探索范围，推动药物发现从“经验驱动”向“数据与方法驱动”进一步演进。

从影响看，一是有望提高药物研发的起点效率。

早期虚拟筛选更快、更全，意味着可在更短时间内提出更多可检验的候选方案，从而提升实验资源配置效率。

二是有助于降低研发不确定性。

通过大规模匹配数据库沉淀可复用的关联信息，研究机构与企业可在立项阶段获得更充分的证据参考，减少重复试错。

三是推动开放科学与协同创新。

数据库免费开放有利于促进跨机构、跨学科合作，形成“方法—数据—应用”闭环，加速从算法突破到药物管线的转化。

也应看到，超高通量筛选并不等同于药物成功。

虚拟匹配结果仍需实验验证，且需要进一步与药代动力学、安全性、选择性等指标协同评估，避免“算得快但不成药”的偏差。

下一步对策层面，可从三方面发力：其一，强化虚拟筛选与湿实验平台的衔接，建立标准化验证流程，提高命中率与可重复性；其二，持续扩充与校准数据库，引入更多结构数据、活性数据与临床相关信息，提升预测可靠性；其三，推动平台在重点疾病领域形成示范应用，围绕肿瘤、神经退行性疾病、耐药感染等急需方向开展联合攻关，以应用反馈反哺方法迭代。

展望未来，随着生命科学数据积累加速、计算方法持续演进以及科研资源共享机制完善，药物发现有望进入“更早发现、更快验证、更精确设计”的新阶段。

基因组级全覆盖筛选若能与靶点生物学、临床表型以及真实世界证据进一步融合，将可能推动从“对症用药”向“机制导向、个体差异可解释”的研发范式升级，并在公共卫生应急、新发突发疾病应对中展现更强的技术支撑能力。

清华大学DrugCLIP平台的问世，充分体现了我国科技工作者在基础研究领域的创新能力和担当精神。

从"大海捞针"到精准导航，从数百年到一日完成，这一跨越式进步不仅刷新了技术纪录，更重要的是为人类战胜重大疾病提供了新的科学工具。

在开放共享的理念引领下，这一成果必将激发全球科研界的创新热情，推动生物制药产业迈向更高效、更精准、更包容的发展阶段。

我国科学家突破新药研发瓶颈 基因组级靶点筛选效率提升百万倍

我国科学家突破新药研发瓶颈基因组级靶点筛选效率提升百万倍