中國教育報-中國教育新聞網(wǎng)訊(記者 阿妮爾)日前,南京農(nóng)業(yè)大學正式發(fā)布司農(nóng)大語言模型(Sinong)。該模型是國內(nèi)首個面向通用農(nóng)業(yè)領(lǐng)域的開源垂直大語言模型,也是南京農(nóng)業(yè)大學主導研發(fā)的首個農(nóng)業(yè)領(lǐng)域大語言模型,其發(fā)布標志著南京農(nóng)業(yè)大學在農(nóng)業(yè)領(lǐng)域人工智能基礎(chǔ)模型研究與應(yīng)用上的新突破。
據(jù)悉,“司農(nóng)”命名取自中國古代財政與農(nóng)業(yè)管理官職體系,該大語言模型重點服務(wù)農(nóng)業(yè)領(lǐng)域。研究團隊依托學校農(nóng)業(yè)領(lǐng)域頂尖學科優(yōu)勢,收集了包括動物科學、農(nóng)業(yè)經(jīng)濟管理、農(nóng)業(yè)資源與環(huán)境、園藝學、智慧農(nóng)業(yè)、動物醫(yī)學、植物保護、作物育種等細分學科數(shù)據(jù),涵蓋了近9000冊書籍、24萬余篇學術(shù)論文和近2萬份政策、標準以及海量網(wǎng)絡(luò)知識,構(gòu)建了體系相對完整、質(zhì)量過硬的農(nóng)業(yè)基礎(chǔ)數(shù)據(jù)集。
針對大語言模型在專業(yè)領(lǐng)域應(yīng)用中常見的“幻覺問題”和知識滯后性,團隊進行了全方位技術(shù)攻堅。在模型訓練階段,除傳統(tǒng)指令微調(diào)外,引入思維鏈和上下文參考等多維訓練數(shù)據(jù),顯著提升模型對于農(nóng)業(yè)專業(yè)知識的理解與生成能力。此外,針對領(lǐng)域文獻知識利用效率問題,推出多智能體檢索增強框架。該框架通過優(yōu)化知識庫構(gòu)建、智能查詢改寫、混合檢索等策略,使模型能夠精準調(diào)用專業(yè)知識,有效保障了生成內(nèi)容的準確性與時效性,為模型在科研、教育、生產(chǎn)等場景的可靠應(yīng)用提供了保障。
目前,司農(nóng)大語言模型已在魔塔社區(qū)和GitHub社區(qū)全面開源,發(fā)布了8B和32B兩種參數(shù)規(guī)模版本。這一開源開放策略,旨在降低農(nóng)業(yè)AI應(yīng)用門檻,助力廣大科研機構(gòu)、企業(yè)和開發(fā)者基于司農(nóng)大語言模型進行二次開發(fā)與創(chuàng)新應(yīng)用,共同培育智慧農(nóng)業(yè)的應(yīng)用生態(tài)。
工信部備案號:京ICP備05071141號
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120170024
中國教育報刊社主辦 中國教育新聞網(wǎng)版權(quán)所有,未經(jīng)書面授權(quán)禁止下載使用
Copyright@2000-2022 www.xhg3.com All Rights Reserved.