在大模型应用加速落地的背景下,如何提升推理可靠性、降低训练与推理成本,成为产业界与学术界共同关注的现实问题。
第十届世界华人数学家大会特别夜话聚焦“数学的严密逻辑如何校正模型的生成偏差”,并向全球发布“人类知识边界:全球数学征解”,试图以开放题目牵引基础研究与工程实践的深度耦合。
问题:大模型“会说但未必会证”的短板仍需补齐。
随着生成式技术向教育、科研、政务与产业链各环节扩展,模型在复杂推理、长链条证明、严谨性验证等方面的不足更加凸显。
一些场景中,模型能迅速给出看似完整的答案,但存在论证跳步、概念混淆、结论与前提不一致等风险。
与此同时,依赖堆叠算力和数据规模的路径也面临能耗与成本约束,模型能力增长与资源投入之间的边际收益开始下降,行业迫切需要更稳定、更高效的技术路线。
原因:瓶颈既来自工程边界,也根植于数学与算法基础。
与会专家以历史经验提示,技术跃迁往往并非简单加快硬件,而是依靠数学方法改写计算复杂度的底层结构。
菲尔兹奖得主丘成桐在发言中回顾,上世纪60年代计算机信号处理曾受制于高复杂度带来的指数级增长压力,直至快速傅里叶变换被重新发现并广泛应用,利用对称性将计算复杂度显著降低,从而带动产业形态发生变化。
与会人士据此认为,当下大模型同样面临“规模扩张遇到结构性天花板”的挑战,未来突破点或更多来自数学理论、算法结构、验证机制与训练范式的协同创新。
影响:基础研究与产业研发正在形成双向牵引。
此次夜话被视为一次面向能力边界的集中检验,国内多家大模型团队在数学难题与逻辑追问中展示新进展。
例如,上海人工智能实验室相关团队展示了通过提升“长时间推理”能力,使模型能够在更长链条的计算与论证中保持一致性,并在竞赛类评测中取得较高成绩。
阿里通义实验室则演示了模型在推导过程中主动进行自检与交叉验证的能力:当推理路径可能存在风险时,模型能够暂停并回溯,尝试替代方法以降低错误传播。
业内人士认为,这类“自我校验”“多路径验证”的能力,反映出模型从“快速生成”向“稳健推理”的方向演进,有助于提升在科研与工程场景中的可用性与可信度。
对策:以开放征解促进体系化攻关,推动“可证明的智能”。
大会发布的“人类知识边界:全球数学征解”设置分层任务,既面向本科生的“初探”,也面向硕博群体的“突破”,并通过“拓界”鼓励更广泛人群参与终极猜想与前沿议题,意在构建从人才培养到科学发现的连续通道。
与会专家建议,下一步应强化三方面工作:其一,推动数学、计算机科学与工程应用的联合攻关,围绕复杂度下降、可验证推理、结构化表示等方向形成可持续研究链条;其二,建立更严格的评测与验证体系,把“正确性、可解释性、可复核性”纳入关键指标,减少仅以结果正确率衡量能力的偏差;其三,鼓励开放数据、工具与基准的共享合作,形成面向公共利益的技术生态,避免重复建设与“各自为战”。
前景:从“算力竞赛”走向“范式创新”将成为重要趋势。
多位与会人士认为,未来大模型竞争不仅是参数规模之争,更是理论深度、算法创新与工程效率的综合较量。
以数学为牵引的跨学科合作,有望在降低能耗成本、提升推理可靠性、拓展科学计算边界等方面形成“关键变量”。
同时,随着教育、科研和产业对高可信推理需求上升,“以验证促生成、以结构促泛化”的技术路线可能加速成熟,推动大模型从通用生成工具向更可靠的知识与推理系统演进。
数学与人工智能的融合正在成为推动技术进步的新动力。
从快速傅里叶变换改变计算机产业的历史中,我们看到了数学创新的力量;从当代AI模型在数学竞赛中的突破表现中,我们看到了这种融合的现实可能。
"人类知识边界:全球数学征解"计划的发布,不仅是对数学难题的一次全球征集,更是对AI发展方向的一次重要指引。
在追求更强计算能力的同时,我们更需要寻求更深层的理论突破。
只有当数学的严谨性与人工智能的强大能力相结合,才能真正推动智能技术向着更加可靠、更加高效、更加可控的方向发展,为人类社会的进步提供更坚实的支撑。