南京农业大学正式推出司农大语言模型(sinong)。该模型是我国首个聚焦通用农业场景的开源垂直大语言模型,也是由南京农业大学牵头研发的首套农业领域专属大语言模型。

据悉,“司农”之名源自中国古代主管财政与农政的重要官职,其专业实力根植于南京农业大学雄厚的农业学科积淀以及海量、高质的农业领域语料资源。研究团队充分发挥学校在农业学科群中的领先优势,系统整合涵盖动物科学、农业经济管理、农业资源与环境、园艺学、智慧农业、动物医学、植物保护、作物育种等方向的专业数据,累计构建超40亿token的农业领域高质量语料库,内容覆盖近9,000部专著、24万余篇学术论文、近2万份政策文件与行业标准,并融合大量权威网络农业知识,最终形成结构完备、质量可靠、覆盖全面的农业基础数据集。
| 数据类型 | 数据样例 |
|---|---|
| QA | "instruction": "在人多地少、耕地后备资源不足的背景下,如何借鉴中国古代‘精耕细作’传统提升单位面积粮食产量,且避免过度投入导致的生态退化?","output": "应采取‘三才’统筹的精耕细作模式:一是因地制宜优化耕作制度,..." |
| COT-QA | "instruction": "宋代南方水田农业中出现了哪些新型农具?这些农具如何促进了水稻种植效率的提升?",“output”: \\n好的,我现在需要回答用户的问题:“宋代南方水田农业中出现了哪些新型农具?这些农具如何促进了水稻种植效率的提升?”……\\n宋代南方水田农业中出现的新型农具包括:……" |
| Incontext-QA | "instruction": ""小麦纹枯病的发生与温湿度、栽培措施及品种抗性如何交互影响,导致其在不同生育阶段呈现动态发展规律?\\n\\n小麦和大麦种子萌发后……",“output”:小麦纹枯病的发生与温湿度、栽培措施及品种抗性三者交互影响,共同决定其在不同生育阶段的动态发展规律,具体表现为:\\n\\n1. 温湿度主导病害发展节律: \\n 病菌侵染和扩展受温度显著调控。冬前(10℃以下)病害发展缓慢,仅零星发生;翌春气温回升至15℃以上时,病害加速扩展,20~25℃为最适发展温度,此时病株率与严重度急剧上升,尤其在拔节至孕穗期达高峰;30℃以上病害基本停滞。同时,春季低温多雨…… |
| Incontext-COT-QA | “instruction”: “中国百强农业对外投资企业在投资规模、区域分布与行业结构上呈现出哪些显著特征,反映了我国农业“走出去”战略的何种优先导向?\\n\\n2015年,中国对外农业投资100强企业(以下简称百强企业”)对外投资30.61亿美元,占投资流量总额的84% ;截至2015年底,累计投资达111.96亿美元,占比86.6% ;在58个国家和地区共设立农业企业194家,占境外农业企业总数的25.4% ;营业收入达418.38亿美元,占所有企业营业收入的 94.6%。可见,尽管百强企业数量占比不高,但在投资规模、经营效益等方面……",“output”:"\\n好的,我现在需要回答用户的问题,关于中国百强农业对外投资企业在投资规模、区域分布与行业结构上的显著特征,以及这些特征反映的农业“走出去”战略的优先导向。首先,我需要仔细阅读用户提供的参考材料,从中提取关键数据,并进行归纳总结。\\n\\n首先看投资规模部分。2015年百强企业对外……\\n中国百强农业对外投资企业在投资规模、区域分布与行业结构上的显著特征及其反映的农业“走出去”战略优先导向如下:\\n\\n---\\n\\n### 一、显著特征\\n1. \*\*投资规模集中化……" |
模型开源与获取方式
魔塔社区开源页面:https://www.php.cn/link/352c158de620027ff0452ad48dd2c3b2
GitHub开源仓库:https://www.php.cn/link/6a307655ba6a4f31e4f2da46d7516c84
源码下载地址:点击下载










