9月22日,度小滿宣布“軒轅70B”金融大模型開源,所有用戶均可自由下載和試用,并公布了“軒轅70B”在C-eval、CMMLU兩大權(quán)威大語言模型評測基準的成績。數(shù)據(jù)顯示,在C-eval榜單上,XuanYuan-70B的總成績達到71.9分;在CMMLU榜單中,以71.05分的高分位居榜首,在兩大權(quán)威榜單上的所有開源模型中排名第一,也是國內(nèi)首個同時在兩大權(quán)威榜單排名第一的金融大模型。
C-eval榜單是由清華大學、上海交通大學和愛丁堡大學合作構(gòu)建的綜合性考試評測集,幾乎囊括了所有國內(nèi)外的主流模型,覆蓋人文、社科、理工、其他專業(yè)四個大方向的52個學科,共有13948個多項選擇題和中學、本科、研究生、職業(yè)等四個難度級別,是目前對模型潛力判斷最具權(quán)威性的大模型榜單之一。
CMMLU 數(shù)據(jù)集是一個綜合性的中文評估基準,由MBZUAI、上海交通大學、微軟亞洲研究院共同推出,專門用于評估語言模型在中文語境下的知識和推理能力,共涵蓋了67個主題,涉及自然科學、社會科學、工程、人文以及常識等。
金融行業(yè)場景豐富,數(shù)字化程度高,是大模型落地應用的最佳場景之一。但金融又是一個高合規(guī)要求的行業(yè),業(yè)務決策復雜,大模型真正在金融業(yè)務中做到實際應用還面臨不少挑戰(zhàn)。
度小滿CTO許冬亮表示,“相比通用大模型,‘軒轅70B’金融大模型經(jīng)過度小滿業(yè)務場景中沉淀的海量金融數(shù)據(jù)訓練,對金融知識理解更專業(yè)、更精準,可控性、安全性更高。我們把大模型開源,希望能夠降低大模型在金融行業(yè)的部署和應用門檻,促進金融行業(yè)服務效率和服務體驗的突破性革新”。
“軒轅70B”將在社區(qū)同時開源金融大模型和50G高質(zhì)量金融語料,開源下載地址:https://github.com/Duxiaoman-DI/XuanYuan
今年5月份,度小滿開源了國內(nèi)首個千億參數(shù)的金融大模型,已經(jīng)有上百家金融機構(gòu)申請試用。本次發(fā)布的新版大模型相較于上一個版本能力全面提升:在增量預訓練和指令微調(diào)階段,加入了度小滿業(yè)務場景中的海量金融數(shù)據(jù),對金融問題回復更專業(yè),金融知識理解能力提升明顯;同時在預訓練階段,“軒轅70B”的模型上下文長度擴充到8k,能夠處理更長的金融報告、研究和分析。(金言)
免責聲明:本網(wǎng)轉(zhuǎn)載自其它媒體的文章,目的在于弘揚科技創(chuàng)新精神,傳遞更多科技創(chuàng)新信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責,在此我們謹向原作者和原媒體致以敬意。如果您認為本站文章侵犯了您的版權(quán),請與我們聯(lián)系,我們將第一時間刪除。