北京(jing)2021年10月29日(ri) /美通(tong)社/ -- 10月26日(ri),在北京(jing)舉(ju)行(xing)的2021人工智(zhi)能(neng)(neng)計(ji)(ji)算大會(hui)(AICC 2021)上,浪潮(chao)人工智(zhi)能(neng)(neng)研究院正式(shi)發(fa)布“源1.0”開源開放(fang)計(ji)(ji)劃(hua),這(zhe)一全(quan)球最大中(zhong)文巨量模(mo)型將以開放(fang)API、開放(fang)數據(ju)集、開源代(dai)碼等多種(zhong)形式(shi)為業界提供開放(fang)合(he)作,人工智(zhi)能(neng)(neng)相(xiang)關高校(xiao)和(he)科(ke)研機構、產業伙伴及智(zhi)能(neng)(neng)計(ji)(ji)算中(zhong)心(xin)用戶可(ke)通(tong)過“源1.0”官網提出申請(qing),經(jing)審(shen)核授權(quan)后即可(ke)基(ji)于“源1.0”模(mo)型探索(suo)算法創新以及開發(fa)各類智(zhi)能(neng)(neng)化應用。
浪潮宣布全球(qiu)最大(da)中文(wen)AI巨量模(mo)型"源1.0”開源開放計劃
“源(yuan)1.0” 開(kai)源(yuan)開(kai)放計(ji)(ji)劃將(jiang)首先(xian)面向三類(lei)群(qun)體(ti)(ti)(ti),一(yi)是(shi)(shi)高校或科研機(ji)構的(de)人(ren)工智能(neng)(neng)研究團隊(dui),二(er)(er)是(shi)(shi)元腦(nao)生態合作(zuo)伙伴(ban),三是(shi)(shi)智能(neng)(neng)計(ji)(ji)算中心。面向第一(yi)類(lei)群(qun)體(ti)(ti)(ti),“源(yuan)1.0”將(jiang)主(zhu)要支(zhi)撐(cheng)在(zai)語言(yan)智能(neng)(neng)前沿領域的(de)算法(fa)創新和方向探索;面向第二(er)(er)類(lei)群(qun)體(ti)(ti)(ti),“源(yuan)1.0”將(jiang)主(zhu)要支(zhi)撐(cheng)元腦(nao)生態伙伴(ban)開(kai)發行業示范(fan)性應用,如智能(neng)(neng)文本服務(wu)、語言(yan)翻譯服務(wu)、內容生產(chan)服務(wu)等(deng)等(deng),探索語言(yan)智能(neng)(neng)產(chan)業落地的(de)“殺(sha)手級應用”;面向第三類(lei)群(qun)體(ti)(ti)(ti),“源(yuan)1.0”將(jiang)作(zuo)為算法(fa)基礎(chu)設施,與智能(neng)(neng)計(ji)(ji)算中心算力基礎(chu)設施高效協同,支(zhi)撐(cheng)AI產(chan)業化(hua)和產(chan)業AI化(hua)發展(zhan)。
“源(yuan)1.0”開(kai)放(fang)開(kai)源(yuan)計劃項目包(bao)含開(kai)放(fang)模型API,開(kai)放(fang)高(gao)質(zhi)量中文數(shu)據集(ji),開(kai)源(yuan)模型訓練代(dai)(dai)碼、推理代(dai)(dai)碼和應用代(dai)(dai)碼等(deng)。同(tong)時(shi),浪潮人工智能研究院將和合作(zuo)伙伴一起,共同(tong)開(kai)展針對國產AI芯(xin)片的“源(yuan)1.0”模型移植開(kai)發工作(zuo)。
為更(geng)好的(de)(de)支撐“源1.0”的(de)(de)開(kai)源開(kai)放計劃,浪潮(chao)人(ren)工(gong)智能研究(jiu)院將(jiang)(jiang)加強模型(xing)API和平臺生態構建,開(kai)發支持高并(bing)(bing)發、高速推理的(de)(de)多種(zhong)API接口(kou),以支持各類用戶(hu)對模型(xing)或功能的(de)(de)不同請求方式。同時,浪潮(chao)人(ren)工(gong)智能研究(jiu)院也(ye)將(jiang)(jiang)大力運營“源1.0”開(kai)源開(kai)放社區,建立完善的(de)(de)開(kai)發反饋機制并(bing)(bing)加快模型(xing)迭(die)代(dai)。
浪潮信息副(fu)總(zong)裁(cai)、AI&HPC產(chan)(chan)品線總(zong)經理劉軍表示:“巨量(liang)(liang)(liang)模型(xing)應(ying)該(gai)成為普惠(hui)性的科(ke)技進步力量(liang)(liang)(liang),讓行業(ye)用戶(hu)甚至是中小(xiao)用戶(hu)也能使用巨量(liang)(liang)(liang)模型(xing)尋求(qiu)深(shen)度(du)創新,促(cu)進業(ye)務可持續健康發展,這是浪潮開源開放‘源1.0’的初衷。我(wo)們希望與更多(duo)的產(chan)(chan)、學、研、用單位(wei)和開發者一(yi)起,從技術創新、場景(jing)融合(he)、應(ying)用開發等各個維度(du),共同促(cu)進巨量(liang)(liang)(liang)模型(xing)的健康發展與產(chan)(chan)業(ye)落(luo)地。”
“源(yuan)1.0”是全球最大規(gui)模的(de)中文AI巨量(liang)模型,其參數(shu)(shu)規(gui)模高(gao)達2457億(yi),訓(xun)練采用的(de)中文數(shu)(shu)據(ju)集達5000GB,相比GPT-3模型1750億(yi)參數(shu)(shu)量(liang)和570GB訓(xun)練數(shu)(shu)據(ju)集,“源(yuan)1.0”參數(shu)(shu)規(gui)模領(ling)先(xian)40%,訓(xun)練數(shu)(shu)據(ju)集規(gui)模領(ling)先(xian)近10倍。 “源(yuan)1.0”在語言智能方面(mian)表現優異,獲(huo)得(de)中文語言理解評測基準(zhun)CLUE榜(bang)單的(de)零樣(yang)本學(xue)習(xi)(xi)和小樣(yang)本學(xue)習(xi)(xi)兩類總榜(bang)冠軍,測試(shi)結果顯(xian)示,人群能夠準(zhun)確分辨(bian)人與“源(yuan)1.0”作(zuo)品差別(bie)的(de)成(cheng)功率(lv)已低(di)于50%。
在AICC 2021大會現(xian)場,參會人員與“源1.0”進(jin)行實(shi)時互動,根據互動者(zhe)給出的主題或(huo)(huo)者(zhe)上聯,“源1.0”會迅速作(zuo)出詩(shi)(shi)歌(ge)或(huo)(huo)者(zhe)對(dui)出下聯。眾多參會者(zhe)在現(xian)場體驗(yan)“源1.0”的詩(shi)(shi)詞創(chuang)作(zuo)能(neng)力,體驗(yan)者(zhe)表示,如果不是親身體驗(yan),肯定看不出來詩(shi)(shi)歌(ge)是AI模型(xing)創(chuang)作(zuo)的,“重要的不僅能(neng)押(ya)好韻(yun),而且更能(neng)寫出中文詩(shi)(shi)的美妙(miao)意境。”
AICC參(can)會者排隊體驗“源1.0”巨量模型的文(wen)學創作(zuo)能力
浪潮(chao)人工智能研究(jiu)院透露已啟動新的(de)巨(ju)量模型(xing)“源2.0”的(de)開(kai)發(fa)工作,“源2.0”的(de)開(kai)發(fa)會更注重(zhong)協同創新,將(jiang)與業內合作伙(huo)伴(ban)聯合展開(kai)前沿探索。