问题——“能说会答”的通用能力与“专精强算”的专业能力仍未形成合力。
近年来,通用大模型在语言理解、知识问答与多任务迁移方面表现突出,但面对实验设计、专业检索、复杂推理链条等高门槛任务时,常出现细节缺失、论证不闭合或结论不可靠等现象。
与之相对,一些面向特定领域的系统在蛋白结构预测、气象模拟等场景达到里程碑式效果,却往往难以跨领域迁移,缺少可复用的推理框架。
两类能力“各自为战”,成为进一步提升智能水平的重要瓶颈。
原因——传统路径在机制层面各有短板,尚难覆盖科学探索的全流程需求。
一方面,通用模型擅长从海量文本中提取与组织知识,但其“知与证”“记忆与推理”边界容易模糊,面对需要严格可验证步骤的任务时,缺少稳定的过程约束与自我校验机制。
另一方面,专业系统依赖明确目标、充分数据与固定评价指标,适合解决定义清晰的问题,却难以应对科学发现中的不确定性:研究对象可能缺数据、假设需迭代、实验要反复验证,甚至存在“未知的未知”。
近期学术界也发出提醒:过度依赖既有数据驱动范式,可能在一定条件下收窄新知识探索边界,对原创性发现形成约束。
这些因素叠加,使“通才”与“专家”之间的鸿沟在科学问题上尤为突出。
影响——科学发现正成为检验推理能力与创新能力的“试炼场”。
与日常问答不同,科学研究链条更长、约束更强,往往要求从问题定义、文献检索、假设生成,到实验方案、数据分析、理论归纳形成闭环。
任何一个环节的偏差都可能导致结论失真。
相关系统性评估显示:当前前沿模型在通用科学推理上表现尚可,但在专业推理任务中得分明显下降,集中暴露出“会回答但不够专业”“懂概念但不会做方案”“能总结但难以验证”等短板。
这意味着,若不能把通用推理、专业知识与可验证流程有效结合,智能技术在科研场景的价值将更多停留在辅助层面,难以成为推动发现的核心工具。
对策——以“通专融合”为主线,构建可动态协同的智能体系,并用工程化路径落地。
周伯文在大会特邀报告中提出,需要打破“通才”与“专家”的二元对立,形成能够在不同任务与不同阶段切换策略、融合能力的体系:既要保有快速生成与广泛联想能力,也要具备严密推演、可核查的慢推理能力,通过机制设计实现动态协同。
业内近两年的探索显示,在大模型之上引入强化学习等方法、强调过程性约束与推理链条的可用性,有助于提升逻辑推理与任务完成质量。
与此同时,围绕“知识—推理”分离、记忆结构解耦、过程奖励机制等关键环节的工程实践,正试图把“通专融合”从理念变为可复用的系统能力,并通过持续交互反馈实现迭代优化。
在科学领域,面向多模态科学数据与跨学科任务的平台化建设,也被视为支撑进一步探索的重要底座。
前景——从“AI for Science”迈向更高阶段的科学智能,关键在于把“能用”推进到“能发现”。
多位研究者判断,科学发现不仅是重要应用方向,更将反过来牵引智能体系升级:因为科学问题天然要求提出新假设、设计可验证路径、在不确定条件下进行迭代决策,这些能力恰是更高水平智能形态必须具备的核心。
未来一段时间,科研场景可能成为通用推理与专业能力深度融合的主战场:一方面,模型需要更好理解科学数据与实验约束;另一方面,系统需要把“生成”纳入“验证”的闭环之中,形成可追溯、可复核、可迭代的研究流程。
谁能率先在机制与基础设施上打通这一闭环,谁就可能在下一轮技术演进中占得先机。
当人工智能的发展从技术竞赛迈向认知革命,通专融合的探索不仅关乎机器智能的进化,更折射出人类对智能本质的深层思考。
这场跨越太平洋的学术对话提醒我们:真正的智能突破,或许正孕育在不同思维方式的创造性融合之中。