我国首款农业领域开源大语言模型"司农"在南京问世 填补智慧农业技术空白

问题——农业现代化进程加快,对数字化、智能化工具的需求持续上升,但农业知识高度分散、场景差异显著、数据标准不一,导致技术在基层落地难、研发成本高、应用效果不稳定。

尤其在作物育种、病虫害防控、畜禽健康管理、农业资源与环境监测、经营管理决策等环节,既需要体系化的专业知识支撑,也需要可迁移、可扩展的技术底座。

当前,通用模型在农业专业语境、政策标准理解、跨学科知识融合等方面仍存在适配不足,制约了“能用、好用、用得起”的智慧农业解决方案规模化推广。

原因——农业领域具有强专业性与强实践性:一方面,知识体系横跨作物学、园艺学、植物保护、动物科学、动物医学、农业经济管理、农业资源与环境、智慧农业等多个分支,术语多、规范多、更新快;另一方面,农业生产受地域、气候、土壤、品种和管理方式影响显著,同一问题在不同区域表现不同,对模型的知识广度与推理稳健性提出更高要求。

同时,农业与政策法规、技术标准紧密相关,指导性文件、标准规范的理解与引用直接关系到生产安全与合规成本。

缺少统一、可信、可追溯的基础数据集,容易造成模型“懂大概、不懂细节”“会表达、不够严谨”等问题,难以满足科研和产业应用对准确性与可解释性的要求。

影响——南京农业大学主导研发并发布的开源垂直大语言模型“司农”,通过构建体系相对完整、质量过硬的农业基础数据集,为解决上述痛点提供了重要抓手。

据介绍,该模型数据覆盖动物科学、农业经济管理、农业资源与环境、园艺学、智慧农业、动物医学、植物保护、作物育种等细分学科,汇聚近9000册书籍、24万余篇学术论文以及近2万份政策、标准等资料。

其意义不仅在于提供面向通用农业领域的专业模型能力,更在于为行业形成“可复用的知识底座”和“可协同的创新平台”创造条件。

对科研端而言,有望提升文献综述、知识检索、实验方案梳理、标准条文理解等工作的效率,促进跨学科研究协同;对产业端而言,可为农业技术服务、农业经营管理、农产品质量安全、农村数字化治理等应用提供更贴近业务语境的能力支撑;对开发者与中小企业而言,开源开放策略可降低试错成本,缩短从概念验证到产品化落地的周期,推动更多贴近生产一线的应用出现。

对策——推动智慧农业从“单点工具”走向“体系能力”,关键在于以高质量数据和开放协作为牵引,形成“数据—模型—应用—反馈”的闭环。

首先,要坚持数据治理与知识体系建设并重,强化数据来源权威性、更新机制和标注规范,推动政策、标准、技术规程与科研成果的结构化整理,提高可用性与可追溯性。

其次,要坚持“开源开放+安全合规”的双轮驱动,在开放共享的同时,明确适用边界和使用规范,尤其在涉及生产安全、动植物疫病防控、农药兽药合规等关键领域,强化审核、校验与风险提示机制,避免不当引用与误用。

再次,要坚持场景牵引,以粮食安全、绿色发展和乡村全面振兴等国家战略需求为导向,优先在病虫害预测预警、耕地质量保护与改良、节水节肥、畜禽健康管理、农机作业调度、农产品质量安全追溯等场景开展联合攻关,通过示范带动形成可复制、可推广的解决方案。

最后,要完善产学研用协同机制,鼓励科研机构、企业、行业组织共同参与二次开发与评测,建立公开透明的评测体系,推动模型能力在真实生产环境中持续迭代。

前景——“司农”已发布8B和32B两种参数规模版本,为不同算力条件和应用需求提供了选择空间。

面向未来,随着农业数据持续沉淀、标准体系不断完善、应用反馈加速回流,垂直领域模型有望在精准农业、智能育种、农业经营决策支持、农业公共服务等方面释放更大潜力。

业内人士认为,决定其长期价值的核心在于“高质量数据集的持续维护”“面向关键场景的能力评测与工程化落地”“与行业规范和生产流程的深度融合”。

如果能在开放生态中形成稳定的共建共享机制,将有助于把分散的农业知识转化为可调用、可验证、可扩展的公共能力,进一步提升农业科技供给效率,促进创新要素向田间地头加速集聚。

科技创新是推动农业现代化的根本动力。

"司农"大语言模型的发布,既是高等院校服务国家战略需求的生动实践,也是开源协作推动行业进步的有力证明。

从知识沉淀到技术赋能,从封闭研发到开放共享,这一转变折射出我国农业科技创新理念的深刻变革。

期待更多科研力量投身智慧农业建设,让数字技术真正成为端稳中国饭碗、绘就乡村振兴新图景的有力支撑。