北京2022年10月19日(ri) /美通社/ -- 作為一(yi)(yi)種軟硬一(yi)(yi)體化(hua)的基(ji)礎設施架構(gou),超融(rong)合具備易(yi)運維、易(yi)部署等(deng)優勢(shi),在(zai)多種行(xing)業(ye)(ye)(ye)與(yu)場景中(zhong)得到(dao)了廣泛應用。在(zai)金(jin)融(rong)、醫(yi)療等(deng)行(xing)業(ye)(ye)(ye)的部署中(zhong),面(mian)向數(shu)據(ju)庫等(deng)場景的超融(rong)合一(yi)(yi)體機面(mian)臨著(zhu)巨大的存儲性能(neng)挑戰,用戶需要提(ti)升數(shu)據(ju)吞吐能(neng)力并降(jiang)低(di)時延,以支(zhi)撐(cheng)關鍵型業(ye)(ye)(ye)務的高(gao)效運行(xing)。
為(wei)提升(sheng)存儲(chu)(chu)子系統(tong)的(de)性能(neng)(neng)(neng),浪(lang)潮使用(yong)了(le)(le)存儲(chu)(chu)性能(neng)(neng)(neng)開(kai)發套(tao)件(jian)(SPDK),并通過NVMe over Fabrics(NVMe-oF)協(xie)(xie)議(yi)進行加速。NVMe-oF協(xie)(xie)議(yi)作為(wei)iSCSI協(xie)(xie)議(yi)的(de)替代者,可以(yi)(yi)讓主機以(yi)(yi)使用(yong)本機 NVMe協(xie)(xie)議(yi)方式(shi)訪(fang)問(wen)分布式(shi)存儲(chu)(chu),提供低延(yan)(yan)時(shi)、高吞(tun)吐(tu)的(de)塊存儲(chu)(chu)設備,解決了(le)(le)內核(he)態驅(qu)動讀寫NVMe磁盤(pan)時(shi)可能(neng)(neng)(neng)會出現(xian)的(de)內核(he)上(shang)下文切換和CPU中(zhong)斷(duan)問(wen)題。優(you)化后的(de)方案(an)能(neng)(neng)(neng)夠為(wei)客戶(hu)虛擬機提供高性能(neng)(neng)(neng)的(de)分布式(shi)存儲(chu)(chu),降低總體(ti)時(shi)延(yan)(yan)和減少時(shi)延(yan)(yan)差(cha)異。
金融與醫療行業面臨存儲性能瓶頸
近(jin)年來(lai),越(yue)來(lai)越(yue)多的(de)金(jin)融與(yu)醫(yi)療機(ji)構(gou)開始擁抱(bao)超融合(he)(he),希望(wang)通過(guo)部署超融合(he)(he)一(yi)體(ti)機(ji)等方(fang)式(shi),對硬件加以(yi)重(zhong)構(gou),以(yi)軟件定義的(de)方(fang)式(shi)打造(zao)靈活高效的(de)IT基(ji)礎設施。在擁抱(bao)超融合(he)(he)的(de)同時,金(jin)融與(yu)醫(yi)療機(ji)構(gou)也非常關注超融合(he)(he)能否(fou)提供(gong)強大的(de)存儲能力。
如今(jin)NVMe SSD的IOPS已經遠遠高出HDD磁盤,時延從毫秒壓縮到微秒,系統的性能瓶(ping)頸(jing)也由存儲硬件(jian)本(ben)身逐漸轉移到網絡(luo)及處理器上。傳統文件(jian)系統和調(diao)度器等方法由于(yu)無(wu)法充分發揮新(xin)存儲介質的性能,成為存儲系統的新(xin)瓶(ping)頸(jing),具(ju)體(ti)包括:
浪潮云海超融合一體機 InCloud Rail實現多維創新
作(zuo)為新一代超融合(he)解決(jue)方案,浪潮云海(hai)超融合(he)一體機InCloud Rail通過(guo)軟件(jian)定義(yi)的計算(suan)、存(cun)儲(chu)和(he)網絡(luo)技術實現了服務器的資(zi)源池(chi)化(hua),使整個IT環(huan)境比單獨的物理硬件(jian)具有更(geng)高(gao)的可用性、安全性和(he)擴展(zhan)性,能夠有效滿足企業對于降低成本、簡化(hua)管理、提高(gao)安全性和(he)擴展(zhan)性的需(xu)求,助力企業向云計算(suan)遷移核心業務、構建企業云數(shu)據中心。
InCloud Rail實現了存儲(chu)資(zi)源(yuan)(yuan)的(de)池(chi)化和(he)統一(yi)(yi)管理,并通過全閃存架構(gou)(gou)的(de)軟(ruan)件定義存儲(chu)SmartONE支持異構(gou)(gou)算(suan)力的(de)融合。SmartONE采用etcd組件作為集群(qun)管理,負責(ze)分(fen)布式存儲(chu)的(de)節(jie)(jie)點(dian)(dian)的(de)關系(xi)、節(jie)(jie)點(dian)(dian)之間的(de)元(yuan)數據傳(chuan)遞(di)及一(yi)(yi)致性等。在(zai)資(zi)源(yuan)(yuan)管理方面SmartONE提供了qemu、iSCSI和(he)NVMe-oF的(de)服務入口(kou)(kou),對(dui)接VDI卷(juan)管理入口(kou)(kou),對(dui)外提供存儲(chu)資(zi)源(yuan)(yuan)。在(zai)對(dui)象(xiang)存儲(chu)方面,SmartONE主要接收(shou)VDI的(de)IO請(qing)求,根據數據分(fen)布算(suan)法調(diao)度(du)到相關節(jie)(jie)點(dian)(dian),根據副(fu)本(ben)策略和(he)EC規(gui)則調(diao)用Gateway分(fen)發到分(fen)布式存儲(chu)的(de)存儲(chu)節(jie)(jie)點(dian)(dian)。
圖(tu)1. 浪潮(chao)云海超融合一體機InCloud Rail架(jia)構
圖2. 浪潮SmartONE軟件(jian)架構
為了滿(man)足(zu)數據庫等實時讀寫、隨機(ji)訪問超大規模數據集等場景對于存(cun)(cun)儲(chu)性能的嚴苛要求(qiu), InCloud Rail除了探索使用新一代存(cun)(cun)儲(chu)介質之外(wai),在SmartONE分布(bu)式存(cun)(cun)儲(chu)的單機(ji)存(cun)(cun)儲(chu)引擎、NVMe-oF存(cun)(cun)儲(chu)服務(wu)等模塊(kuai)中(zhong),采(cai)用了SPDK進(jin)行優化。
單機存(cun)儲引(yin)擎(qing)方面,浪潮SmartONE分(fen)布式(shi)存(cun)儲基(ji)于(yu)SPDK的(de)NVMe驅動實現了高性能底座,支持(chi)和NVMe磁(ci)盤(pan)(pan)設備(bei)直接(jie)交互,同時采用無(wu)鎖設計,并行(xing)處理IO命令。此(ci)外(wai),NVMe上層實現了專屬NVMe的(de)單機存(cun)儲引(yin)擎(qing)系統(tong)(tong),該引(yin)擎(qing)系統(tong)(tong)通過基(ji)于(yu)內存(cun)的(de)元數(shu)據(ju)和日(ri)志(zhi)管理系統(tong)(tong),有(you)效避(bi)免了傳統(tong)(tong)文件系統(tong)(tong)的(de)雙寫(xie)問題。測試數(shu)據(ju)顯示(shi),浪潮SmartONE分(fen)布式(shi)存(cun)儲的(de)單機存(cun)儲引(yin)擎(qing)幾乎(hu)達(da)到了NVMe物理硬盤(pan)(pan)支持(chi)的(de)性能上限。
圖3 專屬 NVMe 的單機存(cun)儲引擎(qing)系統(tong)
NVMe-oF 分布(bu)式(shi)存儲服(fu)務(wu)(wu)方(fang)面,NVMe-oF分布(bu)式(shi)存儲服(fu)務(wu)(wu)為超(chao)融合平臺提(ti)(ti)供(gong)兩(liang)種塊服(fu)務(wu)(wu)解決(jue)方(fang)案,其(qi)一是采用(yong)vhost-user技術(shu)方(fang)案,可以(yi)為虛(xu)擬(ni)機提(ti)(ti)供(gong)更短的(de)IO路(lu)徑;其(qi)二是作為存儲服(fu)務(wu)(wu),為服(fu)務(wu)(wu)器提(ti)(ti)供(gong)NVMe-oF的(de)TCP/RDMA的(de)塊服(fu)務(wu)(wu)。SmartONE利用(yong)SPDK vhost-user技術(shu),直(zhi)接(jie)消(xiao)除Guest虛(xu)擬(ni)機通過PCIE方(fang)式(shi)訪問NVMe設備,避免內核更新PCI配(pei)置空間;同時直(zhi)接(jie)在用(yong)戶態捕獲(huo)QEMU虛(xu)擬(ni)IO,以(yi)零(ling)拷貝方(fang)式(shi)將數(shu)據傳輸到存儲系統(tong)中。
SmartONE支(zhi)持以(yi)NVMe-oF存(cun)(cun)儲協(xie)議方式(shi)(shi)提(ti)供塊存(cun)(cun)儲服(fu)務,它可以(yi)提(ti)供TCP和RDMA兩種形式(shi)(shi)的(de)外(wai)部訪(fang)問(wen)。NVMe-oF存(cun)(cun)儲協(xie)議作為iSCSI協(xie)議的(de)替代者,可以(yi)讓主機(ji)以(yi)使用本(ben)機(ji)NVMe協(xie)議的(de)方式(shi)(shi)訪(fang)問(wen)分布(bu)式(shi)(shi)存(cun)(cun)儲,提(ti)供低延時(shi)、高吞吐的(de)塊存(cun)(cun)儲設備。
圖4 SmartONE NVMe-oF分布式存儲服務
消除性能瓶頸,打造高性能存儲
浪潮SmartONE分布式存儲系統能(neng)夠(gou)充分發(fa)揮NVMe固態盤的性能(neng)潛力,應對在IOPS和(he)時延方面有(you)著較高要(yao)求(qiu)的數據(ju)庫應用場景。
未來(lai),浪(lang)潮還將(jiang)堅持以用戶(hu)為中心(xin),緊密結合前沿技術發展(zhan)趨勢與市場需(xu)求,持續創新引領、迭(die)代優化(hua),打造集融合至簡(jian)、性(xing)能不凡、強(qiang)大可(ke)靠、開(kai)放生態特性(xing)于一身的超融合一體機,持續為用戶(hu)業務上云、數字(zi)化(hua)轉型升級貢獻力量。