亚洲在线日韩伦理片,96精品国产AⅤ一区二区,青鸟影视网,yy黄色频道,国内精品久久久精品AV电影院

解析浪潮AI計算產品GX4:性能強大,隨需擴展

2017-10-15 12:00 7259
在9月底舉辦的GTC China 2017大會上,浪潮展示了基于Tesla? V100的AI計算產品GX4 Box,成為現場的“明星”產品。

北京2017年10月15日電 /美通社/ -- 在9月底舉辦的(de)GTC China 2017大會上(shang),浪潮展示了基于Tesla® V100的(de)AI計算產(chan)品GX4 Box,成為現場的(de)“明星”產(chan)品。

浪潮(chao)GX4并不是一(yi)臺傳統意義上的(de)服務器產品,而是一(yi)臺2U高度(du)的(de)AI box,其中沒(mei)有CPU、內存(cun),由4塊GPU計算加(jia)速卡,擴展主(zhu)板其他支撐部(bu)件組成。用戶也可(ke)部(bu)署(shu)16塊NVMe SSD硬(ying)盤替代(dai)計算加(jia)速卡,作為高密度(du)熱數據存(cun)儲(chu)使用。

GX4承(cheng)襲了浪潮SR-AI整機柜的(de)(de)(de)設(she)計(ji)理念(nian),實現了CPU和GPU的(de)(de)(de)物理解耦,使(shi)得計(ji)算(suan)加速(su)單(dan)元能夠以(yi)(yi)獨立模塊的(de)(de)(de)形式進(jin)行靈活擴展(zhan)。這(zhe)種設(she)計(ji)的(de)(de)(de)好(hao)處顯而(er)易(yi)見,它能在保證高效的(de)(de)(de)GPU跨節(jie)點通信效率的(de)(de)(de)同(tong)時,以(yi)(yi)靈活的(de)(de)(de)擴展(zhan)形式敏捷支持不同(tong)級別的(de)(de)(de)AI模型(xing)訓練。有效降(jiang)低IO冗余和系統購買成本,非常適(shi)合深(shen)度學習模型(xing)訓練、科學計(ji)算(suan)、工程計(ji)算(suan)與研究(jiu)領(ling)域的(de)(de)(de)應用。

隨著訓練樣本(ben)量的指(zhi)數級增長以及訓練模型(xing)的復雜(za)度不(bu)斷提(ti)升,AI計算(suan)正(zheng)面臨的三大困擾。首先,不(bu)同應用(yong)(yong)需(xu)要不(bu)同硬件(jian),帶來采(cai)購和運(yun)維成本(ben)提(ti)升;其次(ci),多機(ji)集群(qun)的延遲更高;第三,資源擴展不(bu)靈活、成本(ben)高。針(zhen)對于此,GX4采(cai)用(yong)(yong)了一些創(chuang)新的設(she)計來解決這些困擾AI用(yong)(yong)戶的難題。

靈活拓撲支持多類型AI應用需求

GPU與CPU計(ji)算(suan)資源(yuan)的解耦和重構(gou),讓GX4擁有了更加(jia)多樣的拓(tuo)撲(pu)結構(gou),可以(yi)通過靈(ling)活調(diao)整GPU拓(tuo)撲(pu),滿(man)足AI云、深度學習模型(xing)訓(xun)練和線上推理等各(ge)種AI應(ying)用場景(jing),使計(ji)算(suan)架構(gou)與上層應(ying)用更匹配,發揮出(chu)AI計(ji)算(suan)集群的較大性能。

目(mu)前,GX4可支持Balanced、Common、Cascaded三(san)種(zhong)不同的(de)GPU拓撲(pu)結構。其中,云服務的(de)用戶需(xu)(xu)要(yao)做(zuo)虛(xu)擬化,每個VM需(xu)(xu)要(yao)分配對應(ying)的(de)GPU資源(yuan),為了保證VM的(de)分配GPU的(de)性能(neng)均衡性,需(xu)(xu)要(yao)采用Balance方(fang)式(shi)(shi)(shi)(shi)保證VM下GPU資源(yuan)的(de)性能(neng)均衡;Common模(mo)式(shi)(shi)(shi)(shi)和(he)Cascaded模(mo)式(shi)(shi)(shi)(shi)均適合于深(shen)度學習模(mo)型訓練使用,區別在于Common上行有(you)兩條(tiao)X16鏈(lian)路,Cascade只(zhi)有(you)1條(tiao),但是Cascade P2P更優化,以上三(san)種(zhong)模(mo)式(shi)(shi)(shi)(shi)可以通過線纜來(lai)靈(ling)活調整(zheng)拓補。

集群延遲降低50%以上

浪潮(chao)AI計算產品GX4能夠實現極(ji)低(di)的(de)(de)(de)延遲(chi)。在傳統的(de)(de)(de)GPU集群中,比如單機4卡(ka)服務器(qi)組成(cheng)的(de)(de)(de)16卡(ka)集群,跨節點(dian)間的(de)(de)(de)GPU通(tong)信會經過不同協議的(de)(de)(de)轉換,CPU、PCIe間的(de)(de)(de)UPI或(huo)QPI以及網絡的(de)(de)(de)延遲(chi),至少較早造成(cheng)2us的(de)(de)(de)數(shu)據(ju)傳輸延遲(chi)。而(er)浪潮(chao)GX4能夠實現16塊GPU之(zhi)間僅依賴PCI-E進行通(tong)信,延遲(chi)可降低(di)50%以上,并且(qie)借助GPU Direct RDMA技(ji)術,使(shi)跨節點(dian)GPU與GPU實現直接的(de)(de)(de)數(shu)據(ju)交互(hu),而(er)不再需要經由(you)CPU的(de)(de)(de)跳(tiao)轉,大幅降低(di)跨節點(dian)GPU間的(de)(de)(de)通(tong)信延遲(chi),最終使(shi)GPU計算集群的(de)(de)(de)延遲(chi)下降到ns級。

兼具高性價比和高擴展性

GX4組成(cheng)的AI計(ji)算(suan)(suan)集群(qun),由負責邏輯運(yun)算(suan)(suan)的SA5212M5機架式服務(wu)器(qi)和(he)包含4塊GPU卡的box組成(cheng),且單臺(tai)SA5212M5能夠掛接至少4臺(tai)box。當業務(wu)需要更大(da)的AI計(ji)算(suan)(suan)資源時(shi),可(ke)以(yi)單獨采購(gou)box來完成(cheng)高性價比(bi)和(he)高靈(ling)活性的擴展,較大(da)可(ke)實現單物理(li)集群(qun)16卡的資源擴展,單精度(du)浮點運(yun)算(suan)(suan)能力較高可(ke)達192TFlops,成(cheng)本可(ke)節省$15,000以(yi)上(shang)。

資源調配靈活

浪潮GX4組成的(de)AI集(ji)群(qun)中(zhong),SA5212M5可以(yi)調用一臺box中(zhong)的(de)1-4塊GPU,也(ye)可以(yi)任意掛(gua)接1-4臺box。當不同的(de)業(ye)務部門有(you)不同的(de)配置需求時候(hou),可以(yi)通過軟件定(ding)義的(de)形(xing)式靈活改(gai)變單物理(li)集(ji)群(qun)的(de)GPU卡數量,將(jiang)資源調度最小顆粒度從(cong)服務器(qi)級升級為GPU卡級別。

支持多種數據中心環境

由于沒有(you)傳統(tong)服務器架構(gou)中(zhong)的(de)(de)(de)(de)CPU和(he)硬盤等(deng)熱(re)源,浪潮GX4可以運(yun)行在不(bu)同的(de)(de)(de)(de)數(shu)據(ju)中(zhong)心環境(jing),并且冷風(feng)直接透過(guo)GPU散熱(re),同樣性能下功耗更(geng)低。此外(wai)(wai),GX4 740mm的(de)(de)(de)(de)深(shen)度和(he)傳統(tong)的(de)(de)(de)(de)高密GPU服務器相(xiang)比,外(wai)(wai)形更(geng)加小巧,為后部(bu)操(cao)作和(he)維護提供(gong)足夠(gou)的(de)(de)(de)(de)空間,而所有(you)CPU和(he)GPU通過(guo)箱子(zi)后部(bu)的(de)(de)(de)(de)線纜相(xiang)連(lian),也極大的(de)(de)(de)(de)方(fang)便計算空間的(de)(de)(de)(de)操(cao)作和(he)運(yun)維。

總而言之,浪潮GX4是一款具有很(hen)強(qiang)靈活(huo)性和擴展性的(de)高性能GPU AI計算新(xin)品,能夠很(hen)好的(de)適應(ying)不(bu)同規模的(de)深度學習模型(xing)(xing)訓(xun)練和線上推理的(de)需(xu)求以(yi)及(ji)不(bu)同類型(xing)(xing)AI應(ying)用對底層(ceng)架(jia)構的(de)要求,可(ke)謂是隨需(xu)擴展神通廣大(da)的(de)“金箍棒”產品。

消息來源:浪潮集團
全球TMT
微信公眾號“全球TMT”發布全球互聯網、科技、媒體、通訊企業的經營動態、財報信息、企業并購消息。掃描二維碼,立即訂閱!
collection