北京2021年8月12日 /美通社/ -- 日前,SPEC(Standard Performance Evaluation Corporation,即國際標準性能評測組織)公布了最新 Cloud IaaS 2018 Benchmark 測試成績,在同規模測試場景下浪潮數據核心產品浪潮云海OS再次刷新世界紀錄,性能得分全球第一,并在應用實例復制數、可擴展性和平均實例配置時間方面表現優異,均達到全球領先水平。
SPEC Cloud測試到底是啥?
SPEC CloudIaaS 2018 Benchmark是SPEC開發的(de)(de)評估基于大數據場景下的(de)(de)云基準(zhun)標準(zhun)測(ce)試(shi)(SPEC Cloud IaaS 2018是SPEC的(de)(de)第二個基準(zhun)測(ce)試(shi)套件來(lai)衡(heng)量(liang)云計算的(de)(de)性(xing)能,以原始2016版本為基礎,具有各種增強功能和新的(de)(de)主(zhu)要指標),采用Yahoo的(de)(de)YCSB與(yu)HiBench的(de)(de)K-Means模擬實際的(de)(de)工(gong)作負(fu)載(zai)。
Benchmark基準測試模(mo)型(xing)
主要(yao)測試(shi)的(de)是(shi)IaaS云(yun)平臺性(xing)(xing)能(neng),選用兩(liang)類最重(zhong)要(yao)的(de)和最具(ju)代(dai)表性(xing)(xing)的(de)負(fu)載:云(yun)平臺上運行(xing)IO密集型(xing)和計(ji)算密集型(xing)負(fu)載,通過加壓測試(shi)數據面性(xing)(xing)能(neng)、可(ke)擴(kuo)展(zhan)性(xing)(xing)以及(ji)控制面性(xing)(xing)能(neng)來得(de)到測試(shi)結果,具(ju)體來說:
IO密集型負載測試:YCSB是Yahoo公司的一個用(yong)來對(dui)云服務進行基礎測(ce)試的工(gong)具,SPEC CloudIaaS 2018通過創建NoSQL(Cassandra)實例實現YCSB架構。其(qi)測(ce)試項包括吞吐量、插(cha)入響應時(shi)(shi)間(jian)、讀取(qu)響應時(shi)(shi)間(jian)、平均應用(yong)實例(Application Instance)配(pei)置時(shi)(shi)間(jian)。
計算密集型負載測試:K-Means算法(fa)是機器學(xue)習中(zhong)常用(yong)(yong)(yong)的一種聚類算法(fa)。SPEC CloudIaaS 2018基準測試(shi)使用(yong)(yong)(yong)HiBench K-Means實(shi)現計(ji)算密集型(xing)測試(shi),其測試(shi)項包括完成時間(jian)、每個(ge)應用(yong)(yong)(yong)實(shi)例(li)運行(xing)的Hadoop迭(die)代計(ji)數、平均應用(yong)(yong)(yong)實(shi)例(li)配置(zhi)時間(jian)。
應用實例基(ji)準測(ce)試模型(xing)
此外,SPEC Cloud IaaS 2018具有完善技術測試框架,是云計算性能測試的基準,作為企業級客戶云產品選型的重要參考標準,測試框架主要指標包含如下四個方面:
應用實例復制數:復(fu)(fu)制的(de)應(ying)用實例(li)數(shu)表示在測試結(jie)束時已完成(cheng)至少一(yi)個(ge)有(you)效應(ying)用的(de)實例(li)總(zong)數(shu)。總(zong)復(fu)(fu)制數(shu)是K-Means與(yu)YCSB的(de)應(ying)用實例(li)總(zong)和,但(dan)二者(zhe)任何一(yi)項(xiang)的(de)有(you)效應(ying)用實例(li)不能(neng)超過(guo)總(zong)數(shu)的(de)60%。
性能得分:性能(neng)得分是所有有效應用(yong)實例的得分總(zong)和,代表了所有應用(yong)在云環境的總(zong)體表現。它是SPEC CloudIaaS 2018規范的YCSB和K-Means性能(neng)得分的總(zong)和,分數越高代表性能(neng)越好。
相對可擴展性:SPEC Cloud測試執行包括(kuo)兩個(ge)階段——baseline基(ji)準數(shu)據收集和scale-out擴(kuo)展性(xing)能數(shu)據收集。可(ke)擴(kuo)展性(xing)是scale-out過程中每個(ge)應用實例(li)能提供與(yu)baseline階段的應用實例(li)相(xiang)同性(xing)能輸出的百(bai)分比,結果越(yue)高代表可(ke)擴(kuo)展性(xing)越(yue)好,當百(bai)分比大(da)于(yu)等于(yu)80%,即認為是優秀。
平均實例配置時間:所(suo)有(you)有(you)效(xiao)應用實(shi)(shi)例的平均配(pei)(pei)置時(shi)間(jian)。每個實(shi)(shi)例的配(pei)(pei)置時(shi)間(jian)都是(shi)從創建實(shi)(shi)例請求開始到(dao)cbtool驅(qu)動可以(yi)SSH到(dao)實(shi)(shi)例的時(shi)間(jian)間(jian)隔。
本次測試的數據指標有何驚艷之處?
“Copy數”:眾多周知,Copy數(shu)受制于測試(shi)(shi)時(shi)(shi)設計(ji)的(de)(de)匯(hui)報Copy數(shu)、Copy上限、失(shi)敗率、YCSB與KMeans各(ge)占比(bi)例及(ji)(ji)服務器硬件的(de)(de)負載能(neng)力;初(chu)次提交(jiao)時(shi)(shi)還可能(neng)出現(xian)受限于當時(shi)(shi)的(de)(de)磁盤性能(neng)以及(ji)(ji)調度策略的(de)(de)情況;甚(shen)至當Copy數(shu)增加時(shi)(shi),測試(shi)(shi)時(shi)(shi)間內會出現(xian)部分AI無法達成測試(shi)(shi)標準進而轉為失(shi)敗。
對此浪潮云海優化了調度策略、虛擬機創建流程以及測試硬件,降低了失敗率。目前,“39 Copies”的數據指標雖然已經達(da)到匯報Copy數的(de)(de)基本要求并作為以下指標測試(shi)的(de)(de)基本前提來使用,但并不代(dai)表當前集群(qun)所(suo)能創(chuang)建應(ying)用實例的(de)(de)上限。
“性能得分”:性(xing)能(neng)(neng)得分作為SPEC制定的(de)(de)標準分值,其值為基(ji)準測(ce)加權平均后(hou)(hou)算(suan)出的(de)(de)絕對(dui)值。我們了解到,虛(xu)擬(ni)(ni)機(ji)后(hou)(hou)端存儲讀寫能(neng)(neng)力、內存大(da)小、CPU及針對(dui)虛(xu)擬(ni)(ni)化的(de)(de)調優動(dong)作都會對(dui)性(xing)能(neng)(neng)得分產生影響,所以在保障性(xing)能(neng)(neng)衰減速率更低的(de)(de)條件下能(neng)(neng)夠在服(fu)務器上虛(xu)擬(ni)(ni)更多虛(xu)擬(ni)(ni)機(ji),這是廠(chang)商們的(de)(de)普遍(bian)目標。
對此浪潮云海通過分析業務場景,有針對性地對測試環境進行配置優化。結果顯示,本次基準測試的性能得分比基準提高了40%,保障了單(dan)位密度(du)虛擬機數量(liang)增加且服務器配(pei)置不變條件下性(xing)能(neng)的穩定性(xing)。
性(xing)能得分的數據對比
與其他廠商相較,浪潮云海OS產品同樣出色。對比當前業界性能得分最佳的廠商,云平臺綜合性能提升35.8%,YCSB性能提高33.9%,KMeans性能提升37.4%。
“平均實例的配置時間”:“平均實例配置時間”被定義為所有有效應用實例的平均配置時間,是實例部署請求提交到實例啟動并被測試管控節點接管的時間間隔。浪潮云海最新提交的平均實例配置時間為41s,與某廠商最新測試結果相對比,在單臺服務器虛擬機數等量的情況下平均實例配置時間提高5s,體現了對(dui)集群(qun)控制平面的深(shen)度優化效果,包括(kuo)對(dui)虛擬(ni)機的請(qing)求(qiu)發放、主機調度和(he)啟(qi)動時(shi)間在內(nei)的能力提升。
“相對可擴展性”:通常相對可擴展性受限于CPU核心數、內存剩余及磁盤。依據SPEC官方標準,80%以上均為優秀;在本次測試中浪潮云海OS產品的可擴展性得分為85.1%,達到優秀級別。
解密調優!浪潮云海OS在測試中有哪些升級實踐?
為了達成(cheng)性(xing)能再升級(ji),提(ti)升虛擬(ni)機的(de)(de)創建速(su)度及穩定性(xing),浪潮云海選(xuan)用了鏡像(xiang)加速(su)的(de)(de)調優手段,即啟動自研智能鏡像(xiang)緩存淘汰算法,智能管理本地(di)緩存目錄(lu),在有限的(de)(de)本地(di)緩存空間內盡可能提(ti)高(gao)鏡像(xiang)緩存命中率。
此外(wai)還(huan)通過支持配(pei)置項預設鏡(jing)(jing)像(xiang)緩(huan)存(cun)目錄大(da)小、彈性伸縮(suo)以及可根據鏡(jing)(jing)像(xiang)的(de)使用頻率自動調整本地存(cun)儲空間等操作(zuo),節約(yue)了鏡(jing)(jing)像(xiang)下載(zai)到本地所消耗的(de)時(shi)間,甚至可以達到80%以上。這波系列操作(zuo)不(bu)但(dan)提(ti)升了應用虛(xu)擬機的(de)創建(jian)速度與穩定性,還(huan)提(ti)高(gao)了鏡(jing)(jing)像(xiang)創建(jian)卷的(de)速度,保障了用戶在大(da)規(gui)模(mo)業務場景下的(de)工(gong)作(zuo)效率。
鏡像緩(huan)存算法實(shi)現原理
“通過針對磁盤IO監控,我們發現在負載情況下虛擬機的磁盤IO性能有所降低。根據多次定位分析,了解虛擬機后端與宿主機系統盤處于相同存儲情況下會導致IO性能降低,因此為了保證讀寫不受宿主機系統盤干擾,選擇將虛擬機后端與宿主機系統盤分離部署。”
為了(le)保證應用(yong)(yong)在云(yun)(yun)環(huan)境的(de)整體表現,浪(lang)潮云(yun)(yun)海還對虛(xu)擬機(ji)(ji)規格(CPU、內(nei)存、硬盤(pan))進(jin)行多(duo)次(ci)調(diao)整且(qie)關閉了(le)KVM的(de)內(nei)存共(gong)享(xiang)。有效防止因(yin)搶占導致性能(neng)(neng)降低關閉了(le)CPU預留和CPU綁(bang)定(ding),進(jin)一步(bu)“預防”CPU不能(neng)(neng)被充分利(li)用(yong)(yong)的(de)情況(kuang),最終(zhong)實現負載情況(kuang)下虛(xu)擬機(ji)(ji)的(de)CPU、內(nei)存、硬盤(pan)都(dou)能(neng)(neng)保持較高的(de)利(li)用(yong)(yong)率,提升了(le)大規模場景下虛(xu)擬機(ji)(ji)性能(neng)(neng)的(de)穩定(ding)性以及資源的(de)利(li)用(yong)(yong)率。
某(mou)一(yi)節點(dian)內存共享關閉示例
在SPEC測試過程中,浪潮云海選擇(ze)通過增大Nova并發任(ren)務數(shu)上限并實現鏡(jing)像緩存(cun)機(ji)制,降低(di)了平均(jun)實例的(de)配(pei)置(zhi)時間。即增大Nova并發任(ren)務個數(shu)來減少虛擬(ni)機(ji)創建時的(de)排隊時間,憑借(jie)鏡(jing)像緩存(cun)的(de)技術(shu)手段解決同一(yi)個鏡(jing)像在創建多臺虛擬(ni)機(ji)的(de)過程中頻繁下載(zai)(zai)、刪除、再下載(zai)(zai)鏡(jing)像導(dao)致耗時嚴重的(de)問題。
為了(le)改善(shan)并(bing)(bing)發場景(jing),還(huan)一并(bing)(bing)優化了(le)haproxy線程數(shu)(shu),包含優化連(lian)接(jie)(jie)池中最大(da)SQL連(lian)接(jie)(jie)數(shu)(shu)、最大(da)允許(xu)超出的連(lian)接(jie)(jie)數(shu)(shu)等關(guan)鍵信(xin)息。這在(zai)OpenStack云(yun)平臺大(da)規模落地實踐中極具參考價值,能夠有效(xiao)提高(gao)創(chuang)建虛擬的成功率,同(tong)時更好滿足用戶(hu)快速(su)、批(pi)量(liang)創(chuang)建虛擬機(ji)的迫切需求。
增加Nova-conductor的worker數,提(ti)高(gao)Nova處理(li)能力示例
鏡像緩(huan)存(cun)配置示例(li)
作為全(quan)(quan)球性(xing)能、擴展(zhan)性(xing)等綜合技(ji)術水(shui)平領先的云平臺軟件,浪潮(chao)數(shu)據(ju)為未(wei)來智算中心(xin)建設提供了全(quan)(quan)球領先水(shui)平的 “云操作系(xi)(xi)統”,未(wei)來定將圍繞智算操作系(xi)(xi)統核(he)心(xin)引擎(qing)的產品定位,持續打造云海(hai)OS硬核(he)技(ji)術實(shi)力,推動企業數(shu)字化、智能化迅速轉(zhuan)型(xing)。