北京(jing)2021年(nian)8月5日 /美通(tong)社/ -- 瀝青被太陽照(zhao)過后(hou)會變硬(ying),而(er)沒(mei)有變硬(ying)的(de)(de)(de)部分(fen),可以用(yong)一(yi)些特殊的(de)(de)(de)溶(rong)劑,把(ba)它(ta)給溶(rong)解掉。觀察到(dao)這一(yi)現(xian)象的(de)(de)(de)法國(guo)人(ren)約瑟夫·涅普斯開始(shi)思(si)考(kao),“我能(neng)不(bu)能(neng)用(yong)同樣的(de)(de)(de)方法來試試看(kan),能(neng)不(bu)能(neng)把(ba)現(xian)實(shi)世(shi)界(jie)當中(zhong)的(de)(de)(de)景色給放進版畫里?”他想到(dao)后(hou),就去做了(le)。
涅普斯(si)不會想到(dao),他在(zai)1826年(nian)用瀝青曬(shai)干“鼓搗”出來的人類歷史上(shang)第一張(zhang)照片,會在(zai)無意間開啟了人類通(tong)往影像(xiang)世(shi)界的大門。
經歷(li)近兩個(ge)(ge)世紀蝶變,影(ying)(ying)像(xiang)技術與數字技術不(bu)斷融(rong)合,數字影(ying)(ying)像(xiang)占據(ju)(ju)了行(xing)業(ye)(ye)(ye)主導(dao)。特別是隨(sui)著(zhu)大數據(ju)(ju)和(he)深度學習等(deng)新技術加持,影(ying)(ying)像(xiang)大數據(ju)(ju)產業(ye)(ye)(ye)發展(zhan)不(bu)斷提速(su)(su),IDC研究表明,未(wei)來行(xing)業(ye)(ye)(ye)80%的(de)行(xing)業(ye)(ye)(ye)數據(ju)(ju)將以照片、音(yin)頻、視(shi)頻等(deng)非結構化影(ying)(ying)像(xiang)數據(ju)(ju)方式呈現。海(hai)量影(ying)(ying)像(xiang)數據(ju)(ju)的(de)“存”和(he)“用”就像(xiang)賽車兩個(ge)(ge)驅動輪,影(ying)(ying)響著(zhu)各個(ge)(ge)行(xing)業(ye)(ye)(ye)在數字賽道上飛馳的(de)速(su)(su)度。作為(wei)新存儲首倡者和(he)引領者,浪潮存儲憑借五(wu)年五(wu)次霸榜(bang)的(de)極致“造車”技術,持續(xu)為(wei)行(xing)業(ye)(ye)(ye)影(ying)(ying)像(xiang)大數據(ju)(ju)處(chu)理(li)提速(su)(su)。
浪潮分布式存儲性能全(quan)球第一
行業影像數據大爆發 如何才能“接得住、存得快”
隨著(zhu)行業(ye)(ye)數(shu)(shu)字化轉(zhuan)型不斷(duan)深入,企(qi)業(ye)(ye)數(shu)(shu)據(ju)資產從(cong)關(guan)鍵業(ye)(ye)務產生的結構(gou)化數(shu)(shu)據(ju)為主逐漸演變為非結構(gou)化影像(xiang)數(shu)(shu)據(ju)為主,同(tong)時企(qi)業(ye)(ye)IT業(ye)(ye)務重心從(cong)數(shu)(shu)據(ju)管理變為數(shu)(shu)據(ju)運(yun)營。如何提(ti)升數(shu)(shu)據(ju)存儲性(xing)能,快速(su)從(cong)巨量影像(xiang)數(shu)(shu)據(ju)中獲取數(shu)(shu)據(ju)價值,成為企(qi)業(ye)(ye)提(ti)升競(jing)爭力的關(guan)鍵。
以金融(rong)行業為例,在Bank4.0趨(qu)勢下隨著銀(yin)(yin)行網點(dian)向營銷型(xing)、體(ti)驗(yan)型(xing)智慧網點(dian)轉變,各大銀(yin)(yin)行正(zheng)全(quan)面推進無紙化(hua)辦公,票(piao)據、單證、電(dian)子驗(yan)印(yin)、影(ying)像(xiang)審批等(deng)業務(wu)處(chu)理過程漸趨(qu)電(dian)子化(hua),帶來了(le)影(ying)像(xiang)數(shu)據實時存儲和處(chu)理的需求井噴式增長。
浪潮存儲方案架構師Howar表示,“金融(rong)影(ying)(ying)像(xiang)(xiang)大(da)數(shu)據就像(xiang)(xiang)螞蟻(yi)軍(jun)團,特點是(shi)‘個(ge)頭小’、‘數(shu)量多’,海(hai)量金融(rong)影(ying)(ying)像(xiang)(xiang)并發處理是(shi)典型的(de)性(xing)能密集型場景”。Howar給算了筆賬,票據影(ying)(ying)像(xiang)(xiang)經過壓縮后,每個(ge)影(ying)(ying)像(xiang)(xiang)大(da)小約在(zai)在(zai)幾(ji)十K至幾(ji)百K之間(jian),多見的(de)是(shi)100K左右(you)的(de)影(ying)(ying)像(xiang)(xiang),但影(ying)(ying)像(xiang)(xiang)規模極(ji)為龐(pang)大(da),依據銀行規模與業務(wu)上線(xian)時(shi)間(jian)不同(tong),單套存儲系統需要處理的(de)影(ying)(ying)像(xiang)(xiang)規模達到數(shu)千(qian)萬至數(shu)億份。同(tong)時(shi)隨著金融(rong)監管要求日趨嚴格,大(da)量錄音、錄像(xiang)(xiang)、圖片(pian)也需要實時(shi)保存并高效訪問(wen)。
不僅金融如(ru)此,在通(tong)(tong)信(xin)、能源(yuan)、交(jiao)通(tong)(tong)、媒資、科研、醫療(liao)等諸多(duo)行(xing)業,也同(tong)樣(yang)面臨影像(xiang)大數(shu)據(ju)(ju)處(chu)理(li)(li)的挑(tiao)(tiao)戰(zhan),這(zhe)個行(xing)業用戶(hu)的共性需(xu)求(qiu)可以稱(cheng)之為“性能現象級(ji)”。其中在通(tong)(tong)信(xin)行(xing)業,隨著14億人將衣食(shi)住行(xing)搬上網絡,移(yi)動互聯網2020年數(shu)據(ju)(ju)流量高達1656億GB;在互聯網行(xing)業,快(kuai)(kuai)手(shou)每(mei)天產(chan)生1.2億個內容(rong)標簽與用戶(hu)畫像(xiang)實(shi)時匹配(pei),內容(rong)精準推送(song)背后是海(hai)量數(shu)據(ju)(ju)關聯碰(peng)撞(zhuang)的結果;在交(jiao)通(tong)(tong)領域,網紅城市成(cheng)(cheng)都(dou)有(you)超6000路(lu)交(jiao)通(tong)(tong)視(shi)頻流實(shi)時匯入,每(mei)天需(xu)要(yao)處(chu)理(li)(li)1億張圖(tu)片、10次搜索。這(zhe)些實(shi)時數(shu)據(ju)(ju)如(ru)同(tong)長(chang)江大河源(yuan)源(yuan)不斷、晝(zhou)夜(ye)不息地注入后端數(shu)據(ju)(ju)基礎設(she)施,如(ru)何“接得住、存得快(kuai)(kuai)、用得快(kuai)(kuai)”成(cheng)(cheng)為數(shu)據(ju)(ju)存儲(chu)面對的挑(tiao)(tiao)戰(zhan)。
智慧交通產生海量實時數(shu)據
一道“性能”考題 引出三種范式
雖然大部(bu)分(fen)行(xing)業都面臨大數(shu)據處理挑戰,但不(bu)同行(xing)業、不(bu)同業務、不(bu)同數(shu)據生(sheng)命(ming)周期的性能需(xu)(xu)求存在三種范(fan)式:以(yi)媒資4K/8K、腦(nao)成(cheng)像研究等(deng)應(ying)用(yong)(yong)場(chang)景(jing)為代表(biao),數(shu)據處理屬于“帶寬密集(ji)型(xing)”范(fan)式;以(yi)金融(rong)影像應(ying)用(yong)(yong)場(chang)景(jing)為代表(biao),影像數(shu)據以(yi)海量(liang)小數(shu)據為主(zhu),屬于“IO密集(ji)型(xing)”范(fan)式。最后(hou)是混合型(xing),在智(zhi)慧交(jiao)通(tong)、能源勘探等(deng)場(chang)景(jing),在前(qian)期數(shu)據采集(ji)階(jie)段,海量(liang)數(shu)據流實時匯入給(gei)存儲帶寬提出了(le)挑戰,到了(le)后(hou)期人工智(zhi)能分(fen)析階(jie)段,企業需(xu)(xu)要(yao)(yao)處理十(shi)億(yi)級(ji)乃至百億(yi)級(ji)小文件,需(xu)(xu)要(yao)(yao)極致IO能力來支(zhi)撐。
Howar告(gao)訴(su)我們,浪潮(chao)分布式(shi)(shi)存(cun)儲(chu)能夠以一套存(cun)儲(chu)滿足上述三(san)種性(xing)能范式(shi)(shi)需求。浪潮(chao)存(cun)儲(chu)開發了業界(jie)首個“塊、文件、對象、大數(shu)據(ju)多合一”極簡架構和iTurbo智能加速引擎,此(ci)存(cun)儲(chu)系統(tong)能夠統(tong)籌管理數(shu)千個節點,實(shi)現性(xing)能線(xian)性(xing)擴展。
浪(lang)潮存儲(chu)
在帶寬密集型應用(yong)(yong)中,浪潮(chao)存(cun)(cun)儲(chu)通(tong)過聚(ju)合帶寬技術,能(neng)夠支撐數據流(liu)高(gao)速(su)吞吐,確保海(hai)量影像洪流(liu)“接得(de)住(zhu)、存(cun)(cun)得(de)快”。同時,浪潮(chao)存(cun)(cun)儲(chu)還能(neng)進行(xing)場(chang)景(jing)化定制,比如(ru)在石(shi)油勘探場(chang)景(jing),浪潮(chao)存(cun)(cun)儲(chu)通(tong)過對去(qu)躁、振幅補(bu)償等(deng)多項作(zuo)業的優(you)化配置,提升了石(shi)油勘探批量作(zuo)業的處理能(neng)力,增強了易用(yong)(yong)性,確保系統高(gao)速(su)穩定運行(xing)。
在IO密集(ji)型場(chang)景,面(mian)對(dui)(dui)億(yi)(yi)級(ji)影(ying)像(xiang)(xiang)小文件(jian)并發處理的(de)挑(tiao)戰,傳統(tong)集(ji)中(zhong)式NAS存(cun)(cun)儲有些力不(bu)從(cong)心。NAS文件(jian)系統(tong)架構(gou)采(cai)用(yong)(yong)(yong)樹形目錄結構(gou),遍歷影(ying)像(xiang)(xiang)文件(jian)需要(yao)極大的(de)資源(yuan)消耗(hao),當影(ying)像(xiang)(xiang)文件(jian)達(da)到上(shang)億(yi)(yi)級(ji)別時,就(jiu)會出現(xian)性能(neng)嚴(yan)重(zhong)下(xia)降的(de)問(wen)(wen)題。對(dui)(dui)此,浪潮分布式存(cun)(cun)儲一套存(cun)(cun)儲支持文件(jian)、對(dui)(dui)象(xiang)(xiang)等多種數據類型的(de)優勢(shi)就(jiu)顯示出來了:當用(yong)(yong)(yong)戶影(ying)像(xiang)(xiang)業(ye)務規(gui)模較小時,可以(yi)采(cai)用(yong)(yong)(yong)文件(jian)存(cun)(cun)儲方(fang)式,這種方(fang)式比較常見(jian),占到中(zhong)國分布式存(cun)(cun)儲約50%的(de)市場(chang)份(fen)額(e),企業(ye)大部分運維人員都能(neng)輕(qing)松上(shang)手(shou);隨著業(ye)務成長,一旦影(ying)像(xiang)(xiang)規(gui)模達(da)到億(yi)(yi)級(ji),可以(yi)采(cai)用(yong)(yong)(yong)對(dui)(dui)象(xiang)(xiang)方(fang)式進行扁平化管理。在對(dui)(dui)象(xiang)(xiang)存(cun)(cun)儲模式下(xia),每個(ge)桶和對(dui)(dui)象(xiang)(xiang)都有一個(ge)全局唯一的(de)ID,根據ID可快速實現(xian)對(dui)(dui)象(xiang)(xiang)的(de)查(cha)找和數據的(de)訪問(wen)(wen),性能(neng)大幅(fu)提升。
影像大數據場(chang)景解決方案
浪潮存儲的極(ji)簡架構做(zuo)得(de)比較人性化,用戶可以根(gen)據業務需求,在(zai)多種數(shu)據服務之間(jian)進行資源切(qie)換,Howar表示(shi)。這(zhe)項功能就(jiu)好比浪潮存儲是(shi)一個工廠,用戶今天想(xiang)(xiang)開轎車就(jiu)按(an)轎車尺寸裝,過段時間(jian)想(xiang)(xiang)開SUV就(jiu)把轎車拆了進行改裝,雖然在(zai)物理世界這(zhe)個實現(xian)起來很有(you)挑戰(zhan),但在(zai)數(shu)字世界還是(shi)被浪潮存儲實現(xian)了。
不僅(jin)如(ru)此,浪潮存(cun)儲(chu)還針(zhen)對性能開發了iTurbo智能加(jia)速引擎,通過(guo)智能IO均(jun)衡、智能資源調(diao)度(du)、智能元數據(ju)管理(li)等創新技術,與自研NVMe SSD閃存(cun)盤進(jin)行系(xi)統級別聯(lian)調(diao)優化,讓百(bai)萬級IO均(jun)衡落盤且路徑更短,將存(cun)儲(chu)系(xi)統性能發揮到極致,有效(xiao)地提升(sheng)了從海量影像中(zhong)“大海撈針(zhen)”的效(xiao)率。
五年五次飆榜 浪潮存儲將性能優勢轉化為市場競爭力
基于對行(xing)業“性能現(xian)(xian)象級”的洞察和存(cun)(cun)(cun)(cun)儲(chu)(chu)(chu)(chu)技術持續打(da)磨,浪(lang)潮(chao)存(cun)(cun)(cun)(cun)儲(chu)(chu)(chu)(chu)實現(xian)(xian)五(wu)(wu)(wu)年五(wu)(wu)(wu)次(ci)(ci)性能飆榜。早在2017年浪(lang)潮(chao)存(cun)(cun)(cun)(cun)儲(chu)(chu)(chu)(chu)以超(chao)150萬IOPS創下了8控存(cun)(cun)(cun)(cun)儲(chu)(chu)(chu)(chu)的業界最高成績,時(shi)隔3年浪(lang)潮(chao)存(cun)(cun)(cun)(cun)儲(chu)(chu)(chu)(chu)以5倍的性能再獲16控、8控、單位(wei)成本(ben)性能三項冠軍(jun)。今年浪(lang)潮(chao)存(cun)(cun)(cun)(cun)儲(chu)(chu)(chu)(chu)在分布式存(cun)(cun)(cun)(cun)儲(chu)(chu)(chu)(chu)領域(yu)再次(ci)(ci)突(tu)破(po),實現(xian)(xian)五(wu)(wu)(wu)年五(wu)(wu)(wu)次(ci)(ci)霸榜,成為全球唯一(yi)(yi)一(yi)(yi)家在分布式存(cun)(cun)(cun)(cun)儲(chu)(chu)(chu)(chu)和集中式全閃存(cun)(cun)(cun)(cun)儲(chu)(chu)(chu)(chu)兩大賽(sai)道領跑的存(cun)(cun)(cun)(cun)儲(chu)(chu)(chu)(chu)廠商。
性(xing)能賽道的強大(da)競爭優勢,促使浪潮存(cun)儲(chu)市(shi)場競爭力獲得提升,當前浪潮存(cun)儲(chu)已經(jing)進(jin)階全球(qiu)前五,成(cheng)為全球(qiu)增長最為強勁的存(cun)儲(chu)廠商。在影像(xiang)大(da)數(shu)據處理領域,浪潮存(cun)儲(chu)已經(jing)在中(zhong)國(guo)天眼天文大(da)數(shu)據、清華大(da)學(xue)頂級腦成(cheng)像(xiang)研(yan)究、中(zhong)石油三維勘探、中(zhong)國(guo)人壽內容(rong)管理等(deng)數(shu)百個行業新應用中(zhong)規(gui)模化(hua)部署(shu)。未來(lai)伴隨云、大(da)數(shu)據、人工智(zhi)能等(deng)新技術發(fa)展智(zhi)算(suan)中(zhong)心將(jiang)迎來(lai)高速(su)發(fa)展,浪潮存(cun)儲(chu)將(jiang)持續(xu)賦能行業用戶,釋放數(shu)據價值加速(su)數(shu)字化(hua)轉(zhuan)型。