聚焦“Data×AI”融合新赛道第五届OceanBase数据库大赛收官1223支高校队伍同场竞技

当前，以大模型为代表的人工智能技术快速迭代发展，对数据基础设施提出了前所未有的新要求。

传统数据库架构面临新挑战，AI原生数据库成为产业升级的重要方向。

在这一背景下，第五届OceanBase数据库大赛紧跟产业前沿，汇聚青年学子的智慧与创新力量。

从参赛规模看，本届大赛创造了新的纪录。

共有来自全国高等院校的1223支队伍、2620名学生参赛，较往届实现了显著增长。

赛事由系统能力培养研究专家组发起，全国高等学校计算机教育研究会、系统能力培养研究项目示范高校共同主办，北京科技大学、OceanBase联合承办。

作为教育部认定的A类学科竞赛，该赛事自2021年启动以来，已累计覆盖500余所高校、超1.1万名学生，成为培养数据库领域高端人才的重要平台。

大赛设置与产业实际紧密贴合。

在"初赛+决赛"递进赛制中，初赛基于实战项目MiniOB，要求参赛选手从零实现数据库核心模块并集成向量检索功能，旨在夯实系统底层能力。

决赛首次引入Apache 2.0开源的AI原生数据库OceanBase seekdb，设置"内核优化"与"AI应用开发"两道赛题。

其中，内核优化赛题要求在8核16GB单机环境下，极致提升"全文检索+标量过滤"混合查询性能，召回率不低于0.95；AI应用开发赛题要求基于自优化后的seekdb，构建端到端的多模态检索增强生成系统，在限定时间内输出准确答案，并可追溯至PDF页码或图表来源。

两道赛题分别对应人工智能落地应用中"跑得快"和"用得稳"的核心诉求，直指数据与AI融合的关键工程难点。

经过两个多月的激烈比拼，来自北京邮电大学、华东师范大学、北京交通大学、东北大学等高校的10支队伍进入决赛答辩阶段。

评审专家从系统设计、性能表现、稳定性、工程可复现性等多个维度进行综合评分。

最终，北邮"编程高手"队以优异成绩夺得冠军，获得10万元奖金。

该团队赛后表示，备赛过程让他们深刻认识到数据底座对人工智能应用的决定性作用，"我们不只是写代码，更在用系统思维验证AI应用的根基。

如果数据库拖后腿，再强的模型也会卡壳。

" 大赛所反映的问题具有深层意义。

当前，大模型与检索增强生成技术加速落地，企业AI应用对数据系统提出了全新要求：既要支持语义检索与结构化过滤等混合查询能力，也要满足权限控制、可追溯性与数据一致性等治理要求，实现AI应用"答得准、跑得快、用得稳"。

业内专家认为，传统"搜索引擎+数据库"拼接架构在延迟、复杂度、数据一致性等方面难以满足规模化应用需求，原生支持混合查询与多模态检索的AI原生数据库将迎来新一轮爆发式需求。

学界与产业界对此形成共识。

系统能力培养研究专家组成员、北京师范大学教授计卫星指出，大赛以真实产业问题为牵引，弥补实践教学案例"理想化"不足，强化学生的工程实践能力、综合素养与系统思维，是高校本研培养的重要补充。

他表示，我国数据库生态日益繁荣，部分方向已具备国际竞争力，但持续突破仍需夯实底层基础。

青年学子在赛事中展现的创新能力令人欣喜，部分"青年方案"具备落地潜力，专家组将持续优化赛制与产学研用协同机制，推动核心基础软件人才培养。

北京科技大学计算机与通信工程学院院长殷绪成强调，AI时代数据库人才培养需要推动"AI与数据库深度融合"，既用AI提升数据库性能，也建设面向AI训练与应用的高效数据基础设施。

大赛通过真实工程约束，推动学生从"会用工具"迈向"能做系统、能做优化"，培养兼具系统底层与AI工程化能力的复合型人才。

他认为，我国在互联网与AI数据库领域已与国际"并跑"，部分开源生态甚至领先，基础软件发展迎来关键机遇期。

这场汇聚全国高校技术精英的赛事，不仅展现了青年学子在基础软件领域的创新潜力，更折射出AI时代数据基础设施建设的紧迫性。

当数据库从幕后走向前台，成为智能经济的核心支柱，如何通过产学研深度融合培育更多"既见树木又见森林"的复合型人才，将是我国实现技术自主可控的关键命题。

聚焦“Data×AI”融合新赛道 第五届OceanBase数据库大赛收官1223支高校队伍同场竞技