南京农业大学发布"司农"开源大语言模型为智慧农业发展注入科技新动能

（问题）当前，我国农业现代化进程加速推进，生产经营对数据、知识与决策的依赖程度显著提高。

然而，从田间管理到疫病防控、从品种选育到农产品质量安全，农业知识链条长、学科交叉多、场景差异大。

现实中，不少农业智能应用仍面临“模型难适配、知识难沉淀、成本难控制”等共性瓶颈：一方面，农业专业语料分散在论文、教材、标准与政策文件中，结构化程度不一；另一方面，基层推广、企业应用对工具的可用性和可解释性要求更高，通用模型在专业问答、专业术语理解与规范引用方面仍需增强。

（原因）造成上述瓶颈的关键在于数据与知识底座建设不均衡。

农业领域既有大量科研成果，也有政策标准、生产规程等实践性文本，但长期以来分布在不同渠道与体系，难以形成可持续更新、可追溯的统一语料与知识框架。

与此同时，农业细分学科众多，动物科学、作物育种、植物保护、园艺学、农业资源与环境等领域各自形成术语体系与方法体系，若缺乏跨学科的高质量数据融合，模型难以在综合场景中稳定输出。

此外，农业应用往往强调“因地因时因作物”的差异化，单一数据来源难以覆盖多样化需求，模型训练与落地之间存在“最后一公里”鸿沟。

（影响）在此背景下，南京农业大学主导研发的面向通用农业领域开源垂直大语言模型“司农”发布，具有现实针对性与示范意义。

据介绍，“司农”汇聚动物科学、农业经济管理、农业资源与环境、园艺学、智慧农业、动物医学、植物保护、作物育种等细分学科数据，覆盖近9000册书籍、24万余篇学术论文和近2万份政策、标准等资料，构建相对完整的农业基础数据集，并推出8B与32B两种参数规模版本。

业内人士认为，面向农业的专用模型与数据集建设，有助于提升农业知识的组织化水平与可复用性，在政策解读、规范检索、科研辅助、技术问答等场景形成更贴近行业的能力底盘。

更重要的是，开源开放策略为科研机构、企业与开发者提供“可复用的起点”，有望降低试错成本，推动更多面向区域、作物与产业链环节的应用创新。

（对策）要让开源模型真正转化为生产力，还需在“数据治理—场景验证—生态协同”上持续发力。

其一，持续完善农业数据治理机制，强化来源可追溯、质量可评估、更新可持续，推动政策标准、科研成果与生产经验在合法合规前提下更好汇聚，形成可迭代的数据底座。

其二，强化面向应用的评测与验证，以农技推广、病虫害识别与处置建议、饲养管理与疫病防控、农经管理与风险分析等典型场景为抓手，建立贴近实际的评价体系，提升输出的准确性、规范性与可解释性。

其三，推动产学研用协同，鼓励企业围绕农机装备、设施农业、农业物联网、农资服务与供应链管理等方向开展二次开发，并与地方农业部门、科研单位共同构建“模型—数据—工具—服务”联动的应用闭环。

其四，重视安全与规范边界，在涉及重大疫病、农药兽药使用、食品安全与政策执行等领域，加强引用依据、风险提示与责任界定，避免“泛化建议”误导实际生产。

（前景）从发展趋势看，农业数字化、智能化将从单点应用走向系统集成，未来竞争焦点不仅在算法能力，更在数据底座、行业知识与生态协作。

“司农”作为面向通用农业领域的开源垂直模型，若能与区域特色数据、作物模型、遥感与物联网数据等进一步融合，有望在农情监测、精准施肥用药、灾害预警、农产品品质管理、农业金融风控等方面释放更大价值。

随着更多机构加入共建共享，农业知识的标准化、结构化和可调用化水平有望提升，进而支撑从科研到生产、从管理到服务的多层次创新，加快智慧农业应用生态培育。

从“靠天吃饭”到“知天而作”，“司农”模型的诞生不仅是技术突破，更是我国农业现代化进程中的关键一跃。

在粮食安全战略与数字中国建设的双重背景下，这场由科技创新引领的农业变革，正为乡村振兴注入全新动能。

南京农业大学发布"司农"开源大语言模型 为智慧农业发展注入科技新动能