当前,以大模型为代表的人工智能技术快速迭代发展,对数据基础设施提出了前所未有的新要求。
传统数据库架构面临新挑战,AI原生数据库成为产业升级的重要方向。
在这一背景下,第五届OceanBase数据库大赛紧跟产业前沿,汇聚青年学子的智慧与创新力量。
从参赛规模看,本届大赛创造了新的纪录。
共有来自全国高等院校的1223支队伍、2620名学生参赛,较往届实现了显著增长。
赛事由系统能力培养研究专家组发起,全国高等学校计算机教育研究会、系统能力培养研究项目示范高校共同主办,北京科技大学、OceanBase联合承办。
作为教育部认定的A类学科竞赛,该赛事自2021年启动以来,已累计覆盖500余所高校、超1.1万名学生,成为培养数据库领域高端人才的重要平台。
大赛设置与产业实际紧密贴合。
在"初赛+决赛"递进赛制中,初赛基于实战项目MiniOB,要求参赛选手从零实现数据库核心模块并集成向量检索功能,旨在夯实系统底层能力。
决赛首次引入Apache 2.0开源的AI原生数据库OceanBase seekdb,设置"内核优化"与"AI应用开发"两道赛题。
其中,内核优化赛题要求在8核16GB单机环境下,极致提升"全文检索+标量过滤"混合查询性能,召回率不低于0.95;AI应用开发赛题要求基于自优化后的seekdb,构建端到端的多模态检索增强生成系统,在限定时间内输出准确答案,并可追溯至PDF页码或图表来源。
两道赛题分别对应人工智能落地应用中"跑得快"和"用得稳"的核心诉求,直指数据与AI融合的关键工程难点。
经过两个多月的激烈比拼,来自北京邮电大学、华东师范大学、北京交通大学、东北大学等高校的10支队伍进入决赛答辩阶段。
评审专家从系统设计、性能表现、稳定性、工程可复现性等多个维度进行综合评分。
最终,北邮"编程高手"队以优异成绩夺得冠军,获得10万元奖金。
该团队赛后表示,备赛过程让他们深刻认识到数据底座对人工智能应用的决定性作用,"我们不只是写代码,更在用系统思维验证AI应用的根基。
如果数据库拖后腿,再强的模型也会卡壳。
" 大赛所反映的问题具有深层意义。
当前,大模型与检索增强生成技术加速落地,企业AI应用对数据系统提出了全新要求:既要支持语义检索与结构化过滤等混合查询能力,也要满足权限控制、可追溯性与数据一致性等治理要求,实现AI应用"答得准、跑得快、用得稳"。
业内专家认为,传统"搜索引擎+数据库"拼接架构在延迟、复杂度、数据一致性等方面难以满足规模化应用需求,原生支持混合查询与多模态检索的AI原生数据库将迎来新一轮爆发式需求。
学界与产业界对此形成共识。
系统能力培养研究专家组成员、北京师范大学教授计卫星指出,大赛以真实产业问题为牵引,弥补实践教学案例"理想化"不足,强化学生的工程实践能力、综合素养与系统思维,是高校本研培养的重要补充。
他表示,我国数据库生态日益繁荣,部分方向已具备国际竞争力,但持续突破仍需夯实底层基础。
青年学子在赛事中展现的创新能力令人欣喜,部分"青年方案"具备落地潜力,专家组将持续优化赛制与产学研用协同机制,推动核心基础软件人才培养。
北京科技大学计算机与通信工程学院院长殷绪成强调,AI时代数据库人才培养需要推动"AI与数据库深度融合",既用AI提升数据库性能,也建设面向AI训练与应用的高效数据基础设施。
大赛通过真实工程约束,推动学生从"会用工具"迈向"能做系统、能做优化",培养兼具系统底层与AI工程化能力的复合型人才。
他认为,我国在互联网与AI数据库领域已与国际"并跑",部分开源生态甚至领先,基础软件发展迎来关键机遇期。
这场汇聚全国高校技术精英的赛事,不仅展现了青年学子在基础软件领域的创新潜力,更折射出AI时代数据基础设施建设的紧迫性。
当数据库从幕后走向前台,成为智能经济的核心支柱,如何通过产学研深度融合培育更多"既见树木又见森林"的复合型人才,将是我国实现技术自主可控的关键命题。