北(bei)京2022年12月19日(ri) /美通社/ -- 在當前數字經(jing)濟時代,隨著5G、AI、云(yun)計(ji)(ji)(ji)算(suan)(suan)等新興領域對(dui)計(ji)(ji)(ji)算(suan)(suan)量的需求(qiu)增長,傳統的體(ti)系架構(gou)(gou)面臨(lin)性能(neng)(neng)和功耗瓶頸,已無法處理更復雜(za)、更多(duo)樣的數據,難以滿足(zu)日益高漲的算(suan)(suan)力需求(qiu),異構(gou)(gou)計(ji)(ji)(ji)算(suan)(suan)應需而生。作為算(suan)(suan)力突破的新抓(zhua)手,異構(gou)(gou)計(ji)(ji)(ji)算(suan)(suan)能(neng)(neng)夠提高算(suan)(suan)力和性能(neng)(neng),降低(di)功耗和成本,并具備多(duo)類型任(ren)務(wu)處理能(neng)(neng)力,在智算(suan)(suan)中心(xin)、云(yun)數據中心(xin)、邊緣計(ji)(ji)(ji)算(suan)(suan)等場(chang)景有著廣泛應用(yong)。
12月16日,由(you)高效能(neng)服(fu)務器(qi)和(he)存儲技術國家(jia)重(zhong)點實驗室和(he)開放計(ji)算中國社區聯合(he)主辦的(de) “異(yi)(yi)(yi)構(gou)(gou)計(ji)算研究與實踐”第七期(qi)開放計(ji)算技術沙(sha)龍(long)在(zai)線(xian)上成(cheng)功舉行,由(you)CSDN直播,浪潮信息、央鏈等(deng)平臺轉播,超(chao)1.7萬人次(ci)觀看。本期(qi)沙(sha)龍(long)由(you)高效能(neng)服(fu)務器(qi)和(he)存儲技術國家(jia)重(zhong)點實驗室首席研究員(yuan)葉毓睿主持,匯集來自南開大學(xue)、鴻鈞微電子(zi)、遇賢、數渡科(ke)(ke)技、矩向科(ke)(ke)技、澎(peng)峰科(ke)(ke)技等(deng)產學(xue)研用領域相關專家(jia)教授,圍繞智能(neng)異(yi)(yi)(yi)構(gou)(gou)計(ji)算系統(tong)、芯片、超(chao)異(yi)(yi)(yi)構(gou)(gou)計(ji)算架構(gou)(gou)、互連技術(PCIe)、異(yi)(yi)(yi)構(gou)(gou)計(ji)算軟(ruan)件棧等(deng)話題,共(gong)同探討異(yi)(yi)(yi)構(gou)(gou)計(ji)算的(de)發展現狀與趨勢。
首先(xian),主持人(ren)葉毓睿研究員(yuan)在開場分享了高效能(neng)服務器和(he)(he)存儲技(ji)(ji)術(shu)國家重(zhong)點(dian)實驗室最(zui)近(jin)的(de)一些思考和(he)(he)觀點(dian)。他表示,我(wo)們面(mian)臨著算(suan)力多(duo)元化,需求(qiu)猛增的(de)情(qing)形,隨著摩爾定(ding)律(lv)的(de)放緩,以及(ji)功耗墻、登(deng)納德縮放定(ding)律(lv)和(he)(he)阿姆達(da)爾定(ding)律(lv)遭遇瓶頸,多(duo)元算(suan)力、異構(gou)計(ji)算(suan)、邊(bian)緣(yuan)計(ji)算(suan)、散熱技(ji)(ji)術(shu)和(he)(he)一切皆計(ji)算(suan)機的(de)硬(ying)件重(zhong)構(gou)方向等趨勢和(he)(he)相(xiang)關技(ji)(ji)術(shu)的(de)研究和(he)(he)實踐,成為近(jin)些年來的(de)熱點(dian)。
在主(zhu)題(ti)演講環節,南開大學(xue)教授、博士(shi)生(sheng)導(dao)師李濤分享了“智(zhi)能(neng)異(yi)構(gou)計(ji)(ji)算(suan)(suan)系統(tong)研(yan)究及應用(yong)”。他指出(chu),異(yi)構(gou)計(ji)(ji)算(suan)(suan)已經成(cheng)為云(yun)計(ji)(ji)算(suan)(suan)和邊緣計(ji)(ji)算(suan)(suan)等(deng)各(ge)種場景(jing)中的(de)主(zhu)流(liu)計(ji)(ji)算(suan)(suan)模(mo)式(shi),GPU的(de)出(chu)現已經使得這一模(mo)式(shi)得到快速發展和成(cheng)功應用(yong)。以深度學(xue)習為代(dai)表(biao)的(de)人(ren)工智(zhi)能(neng)技術及其應用(yong)發展如火如荼,對以GPU為代(dai)表(biao)的(de)異(yi)構(gou)加速技術以及算(suan)(suan)力設備產(chan)生(sheng)了更大的(de)需(xu)求,并形(xing)成(cheng)良(liang)性循環。隨著特定領域架構(gou)和RISC-V開源硬件(jian)等(deng)技術生(sheng)態日漸完善,異(yi)構(gou)計(ji)(ji)算(suan)(suan)模(mo)式(shi)將會(hui)更好(hao)地實現“專(zhuan)業的(de)硬件(jian)干專(zhuan)業的(de)計(ji)(ji)算(suan)(suan)任務”,為新時代(dai)的(de)智(zhi)能(neng)社會(hui)和數字(zi)經濟建(jian)設提供更好(hao)的(de)算(suan)(suan)力支撐。
鴻鈞微電子(zi)產(chan)品工程部(bu)副總(zong)裁(cai)潘國振就“數(shu)據中心異(yi)(yi)構計算(suan)探索”進(jin)行主題(ti)分享。他(ta)表示,異(yi)(yi)構計算(suan)技術來(lai)自于(yu)真真切切的業(ye)務(wu)(wu)(wu)場景(jing)需(xu)求、為(wei)了(le)解(jie)決(jue)某個算(suan)力問題(ti)而存(cun)在,而業(ye)務(wu)(wu)(wu)需(xu)求是復雜(za)的,計算(suan)熱(re)點經常是不(bu)明確(que)的,軟硬(ying)件(jian)之間的分割線(xian)更是模糊的,數(shu)據流的方向往往會(hui)出乎硬(ying)件(jian)人所料。所以需(xu)要深入一(yi)(yi)線(xian)業(ye)務(wu)(wu)(wu)調研軟件(jian)棧細節,從全業(ye)務(wu)(wu)(wu)鏈路來(lai)找(zhao)熱(re)點、定方案、做產(chan)品。如(ru)果只是具備某種硬(ying)件(jian)技術,硬(ying)往業(ye)務(wu)(wu)(wu)環境(jing)里面去套,可(ke)能會(hui)水土不(bu)服。 當然(ran)最好的辦法(fa)是從兩頭往中間走,一(yi)(yi)邊(bian)調研業(ye)務(wu)(wu)(wu)軟件(jian)棧,一(yi)(yi)邊(bian)深度打(da)磨異(yi)(yi)構產(chan)品,最終找(zhao)到最佳的結(jie)合點。
隨著異(yi)構(gou)(gou)計(ji)(ji)算(suan)(suan)(suan)在云計(ji)(ji)算(suan)(suan)(suan)、智(zhi)能(neng)(neng)計(ji)(ji)算(suan)(suan)(suan)、邊緣(yuan)計(ji)(ji)算(suan)(suan)(suan)等領域(yu)的(de)(de)(de)應(ying)用(yong)(yong)不(bu)斷深(shen)入,復(fu)雜多(duo)變的(de)(de)(de)應(ying)用(yong)(yong)場(chang)景和多(duo)樣化(hua)的(de)(de)(de)算(suan)(suan)(suan)力(li)形態(tai)也(ye)對異(yi)構(gou)(gou)計(ji)(ji)算(suan)(suan)(suan)系(xi)統(tong)(tong)(tong)提出了更高(gao)(gao)(gao)的(de)(de)(de)要求。數(shu)渡科(ke)技合(he)作(zuo)部總(zong)監許勝分享了“異(yi)構(gou)(gou)計(ji)(ji)算(suan)(suan)(suan)中的(de)(de)(de)互聯(lian)技術(shu)應(ying)用(yong)(yong)與(yu)探討”。他(ta)表示,為了獲取高(gao)(gao)(gao)性能(neng)(neng)和高(gao)(gao)(gao)效(xiao)率(lv)的(de)(de)(de)計(ji)(ji)算(suan)(suan)(suan)能(neng)(neng)力(li),利(li)用(yong)(yong)CPU、GPU、NPU、FPGA等類型計(ji)(ji)算(suan)(suan)(suan)單元構(gou)(gou)建(jian)出具有多(duo)元化(hua)計(ji)(ji)算(suan)(suan)(suan)能(neng)(neng)力(li)的(de)(de)(de)算(suan)(suan)(suan)力(li)平臺(tai),這些計(ji)(ji)算(suan)(suan)(suan)單元之間通過(guo)異(yi)構(gou)(gou)融合(he)和協(xie)同(tong)工(gong)作(zuo),來共同(tong)滿(man)足(zu)復(fu)雜場(chang)景下對計(ji)(ji)算(suan)(suan)(suan)的(de)(de)(de)差異(yi)化(hua)需求。而統(tong)(tong)(tong)一的(de)(de)(de)高(gao)(gao)(gao)速異(yi)構(gou)(gou)互聯(lian)和高(gao)(gao)(gao)效(xiao)的(de)(de)(de)異(yi)構(gou)(gou)資(zi)源管理(li)系(xi)統(tong)(tong)(tong),將有助于提升不(bu)同(tong)算(suan)(suan)(suan)力(li)單元之間的(de)(de)(de)協(xie)同(tong)優化(hua),降低多(duo)樣性算(suan)(suan)(suan)力(li)綜合(he)應(ying)用(yong)(yong)的(de)(de)(de)開發難度,充分發揮(hui)異(yi)構(gou)(gou)計(ji)(ji)算(suan)(suan)(suan)系(xi)統(tong)(tong)(tong)架構(gou)(gou)在靈(ling)活性、高(gao)(gao)(gao)效(xiao)性等方(fang)面的(de)(de)(de)特點優勢(shi)。
對(dui)(dui)(dui)于異(yi)(yi)(yi)(yi)構(gou)(gou)(gou)(gou)計(ji)算而(er)言(yan),“碎片(pian)(pian)化(hua)”是非常(chang)大的(de)(de)(de)(de)(de)挑戰。遇(yu)賢副總裁、首席架構(gou)(gou)(gou)(gou)師陳爭勝發表了“打(da)破(po)邊(bian)界,從(cong)芯(xin)片(pian)(pian)異(yi)(yi)(yi)(yi)構(gou)(gou)(gou)(gou)到(dao)系(xi)統(tong)(tong)異(yi)(yi)(yi)(yi)構(gou)(gou)(gou)(gou)”主(zhu)題(ti)演講,他指(zhi)出,面(mian)對(dui)(dui)(dui)異(yi)(yi)(yi)(yi)構(gou)(gou)(gou)(gou)會(hui)帶來(lai)(lai)的(de)(de)(de)(de)(de)“碎片(pian)(pian)化(hua)”挑戰,需要更多精心設計(ji)的(de)(de)(de)(de)(de)抽(chou)象層(ceng)級,使(shi)得有(you)效算力能夠(gou)最(zui)大化(hua)。從(cong)CPU的(de)(de)(de)(de)(de)視角(jiao)來(lai)(lai)看,存在多個(ge)層(ceng)面(mian)的(de)(de)(de)(de)(de)異(yi)(yi)(yi)(yi)構(gou)(gou)(gou)(gou),首先是Die內的(de)(de)(de)(de)(de)異(yi)(yi)(yi)(yi)構(gou)(gou)(gou)(gou),比如大小核的(de)(de)(de)(de)(de)異(yi)(yi)(yi)(yi)構(gou)(gou)(gou)(gou);再就是Chiplet或者說封(feng)裝內的(de)(de)(de)(de)(de)異(yi)(yi)(yi)(yi)構(gou)(gou)(gou)(gou),比如CPU+GPGPU MCM封(feng)裝;還(huan)有(you)系(xi)統(tong)(tong)層(ceng)面(mian)的(de)(de)(de)(de)(de)異(yi)(yi)(yi)(yi)構(gou)(gou)(gou)(gou),如通過CXL總線構(gou)(gou)(gou)(gou)建(jian)一個(ge)多xPU、多級存儲的(de)(de)(de)(de)(de)“對(dui)(dui)(dui)等”計(ji)算系(xi)統(tong)(tong)。此外(wai),如何(he)打(da)破(po)多個(ge)層(ceng)級的(de)(de)(de)(de)(de)邊(bian)界進行聯合優化(hua),如何(he)降(jiang)低硬(ying)件異(yi)(yi)(yi)(yi)構(gou)(gou)(gou)(gou)對(dui)(dui)(dui)軟件架構(gou)(gou)(gou)(gou)的(de)(de)(de)(de)(de)影響(xiang),也是一個(ge)值得關(guan)注的(de)(de)(de)(de)(de)問(wen)題(ti)。以芯(xin)片(pian)(pian)原廠及系(xi)統(tong)(tong)廠商共同(tong)主(zhu)導(dao)的(de)(de)(de)(de)(de)異(yi)(yi)(yi)(yi)構(gou)(gou)(gou)(gou)生(sheng)態,帶來(lai)(lai)了一次產業鏈價值重(zhong)構(gou)(gou)(gou)(gou)的(de)(de)(de)(de)(de)機會(hui)。
關于未來計(ji)算(suan)(suan)(suan)(suan)架(jia)構(gou)(gou)的(de)(de)演進(jin),矩向(xiang)科技CEO黃朝(chao)波進(jin)行(xing)(xing)(xing)(xing)了“新一代計(ji)算(suan)(suan)(suan)(suan)架(jia)構(gou)(gou):超(chao)(chao)(chao)異構(gou)(gou)計(ji)算(suan)(suan)(suan)(suan)”的(de)(de)主題(ti)分享。隨著人(ren)工(gong)智能(neng)(neng)(neng)和元宇(yu)宙等創新應用的(de)(de)爆發,底層的(de)(de)計(ji)算(suan)(suan)(suan)(suan)能(neng)(neng)(neng)力(li)需(xu)要千倍萬倍的(de)(de)提(ti)(ti)升。計(ji)算(suan)(suan)(suan)(suan)架(jia)構(gou)(gou)從最開始(shi)的(de)(de)單核串行(xing)(xing)(xing)(xing),走(zou)到多核并(bing)行(xing)(xing)(xing)(xing);又進(jin)一步從同構(gou)(gou)并(bing)行(xing)(xing)(xing)(xing)走(zou)到異構(gou)(gou)并(bing)行(xing)(xing)(xing)(xing);未來,會(hui)進(jin)一步走(zou)向(xiang)超(chao)(chao)(chao)異構(gou)(gou)并(bing)行(xing)(xing)(xing)(xing)。黃朝(chao)波指出,串行(xing)(xing)(xing)(xing)編程(cheng)符合人(ren)類的(de)(de)思維,并(bing)行(xing)(xing)(xing)(xing)編程(cheng)難(nan)度(du)較大,異構(gou)(gou)并(bing)行(xing)(xing)(xing)(xing)編程(cheng)難(nan)度(du)更大,超(chao)(chao)(chao)異構(gou)(gou)并(bing)行(xing)(xing)(xing)(xing)編程(cheng)更是(shi)地獄級(ji)難(nan)度(du)。如何駕馭超(chao)(chao)(chao)異構(gou)(gou),是(shi)成敗的(de)(de)關鍵,也是(shi)需(xu)要重點投入的(de)(de)方(fang)向(xiang)。未來,大算(suan)(suan)(suan)(suan)力(li)芯片需(xu)要實(shi)現(xian)算(suan)(suan)(suan)(suan)力(li)的(de)(de)多個數量級(ji)提(ti)(ti)升,是(shi)現(xian)有三大芯片CPU、GPU、DPU功能(neng)(neng)(neng)的(de)(de)部(bu)分或(huo)全部(bu)融合,成為通(tong)用的(de)(de)超(chao)(chao)(chao)異構(gou)(gou)處(chu)(chu)理器(qi)。超(chao)(chao)(chao)異構(gou)(gou)處(chu)(chu)理器(qi)為算(suan)(suan)(suan)(suan)力(li)網(wang)絡提(ti)(ti)供超(chao)(chao)(chao)高算(suan)(suan)(suan)(suan)力(li)密度(du)的(de)(de)基礎單元,是(shi)面向(xiang)云計(ji)算(suan)(suan)(suan)(suan)、邊緣計(ji)算(suan)(suan)(suan)(suan)以及自動駕駛(shi)終端等復雜計(ji)算(suan)(suan)(suan)(suan)場景(jing)的(de)(de)通(tong)用、綜合、融合的(de)(de)單芯片解決方(fang)案。
在軟件棧方面,澎(peng)峰科(ke)技CEO張先軼分享(xiang)了“異構(gou)計(ji)(ji)算軟件棧的(de)(de)國產自主(zhu)(zhu)與國際化愿景(jing)”。他指(zhi)出,異構(gou)計(ji)(ji)算軟件棧作為底層硬件和上層應用的(de)(de)橋梁,可以(yi)擴展芯(xin)片(pian)(pian)的(de)(de)應用范(fan)圍,提升計(ji)(ji)算性(xing)能。國際主(zhu)(zhu)流芯(xin)片(pian)(pian)公司(si)都投入大(da)量(liang)資源建(jian)設異構(gou)計(ji)(ji)算軟件棧,例(li)如Intel oneAPI,NVIDIA CUDA-X等。國內(nei)異構(gou)計(ji)(ji)算芯(xin)片(pian)(pian)公司(si),要(yao)么在構(gou)建(jian)自主(zhu)(zhu)的(de)(de)語(yu)言、工具鏈(lian),要(yao)么采取兼容CUDA語(yu)言的(de)(de)方式。從用戶(hu)角度說,要(yao)么學習成(cheng)本高,要(yao)么性(xing)能不佳。針對用戶(hu)期望的(de)(de)性(xing)能高、兼容多(duo)、使用便(bian)(bian)利等需求,澎(peng)峰科(ke)技采用開源共建(jian)的(de)(de)模(mo)式,推出高性(xing)能計(ji)(ji)算庫PerfMPL庫解(jie)決性(xing)能問題,跨平臺(tai)API編(bian)程PerfXAPI兼容更(geng)多(duo)硬件,PerfXPy科(ke)學計(ji)(ji)算平臺(tai)平衡(heng)便(bian)(bian)利和性(xing)能。
在最后(hou)的圓桌(zhuo)討論環節,遇(yu)賢副總(zong)裁(cai)、首席(xi)架構(gou)師(shi)陳(chen)爭勝(sheng),數(shu)(shu)渡(du)科(ke)技合作部總(zong)監許勝(sheng),矩向(xiang)科(ke)技CEO黃(huang)朝波等嘉賓(bin),共同就異構(gou)計算軟硬件協同設計、如何實(shi)現不同加速(su)器之(zhi)間數(shu)(shu)據高(gao)效交(jiao)互、超異構(gou)計算架構(gou)發展(zhan)展(zhan)望、如何發揮算力多(duo)元化的優勢等議題進行(xing)了熱烈探討與交(jiao)流,并和聽眾(zhong)進行(xing)了深入的互動問答。