北京(jing)2017年4月14日(ri)電 /美通社/ -- 2017年3月,英特(te)爾發布的面向臺式機的英特(te)爾® 傲(ao)騰? 內(nei)存模塊(16GB和32GB),將(jiang)從(cong)4月24日(ri)起上市。在半導體技術(shu)驅(qu)動下(xia),計算機性能沿著摩爾定路突(tu)飛猛進(jin),然(ran)而(er),仍舊(jiu)逃離(li)不開“存儲(chu)”的瓶頸(jing)制約,拖(tuo)累整個系統(tong)性能提(ti)升緩慢(man)。使(shi)用閃存(NAND)加速的想(xiang)法一(yi)直都(dou)在,Wintel都(dou)有嘗試,今天,傲(ao)騰(Optane)將(jiang)有機會改(gai)變這一(yi)切。
雖(sui)然已經(jing)有了(le)數(shu)(shu)十年(nian)的(de)歷史,但是(shi)(shi)馮(feng)·諾依曼(man)1946年(nian)提(ti)出(chu)(chu)的(de)計(ji)算(suan)(suan)機體(ti)系架構,仍是(shi)(shi)現在乃至可見的(de)未來,計(ji)算(suan)(suan)機所遵循的(de)基本架構體(ti)系:存儲和計(ji)算(suan)(suan)。CPU是(shi)(shi)大家所熟(shu)悉的(de)計(ji)算(suan)(suan)核(he)心,但是(shi)(shi)并非(fei)馮(feng)·諾依曼(man)體(ti)系中的(de)計(ji)算(suan)(suan)核(he)心,按照大學計(ji)算(suan)(suan)機原理課老(lao)師所說,CPU非(fei)常(chang)笨(ben),它只會做“1+1”這一件事,而且只會從A、B寄(ji)(ji)存器取(qu)數(shu)(shu)、結果(guo)放(fang)到(dao)C寄(ji)(ji)存器,馮(feng)·諾依曼(man)體(ti)系中的(de)計(ji)算(suan)(suan)是(shi)(shi)指(zhi)ALU(數(shu)(shu)邏運算(suan)(suan)單元)而存儲是(shi)(shi)寄(ji)(ji)存器。當然,這是(shi)(shi)最狹義(yi)的(de)馮(feng)·諾依曼(man)體(ti)系理解,不過也從側面說出(chu)(chu)了(le)計(ji)算(suan)(suan)和存儲相依相存的(de)特殊關系。
速度快當然是(shi)王道(dao),但(dan)是(shi)非常遺憾,半導體技術發展到(dao)今天(tian),仍然不能(neng)解決容量和性(xing)能(neng)的(de)(de)根本矛盾,考慮到(dao)成本和實現因素(su),最終的(de)(de)產品(pin)都是(shi)性(xing)能(neng)向(xiang)成本的(de)(de)妥協(xie)。歷史上看,誰能(neng)將兩者的(de)(de)平衡(heng)點向(xiang)性(xing)能(neng)或容量任一(yi)端推動,定將帶來世界的(de)(de)巨大改(gai)變。SRAM到(dao)DRAM、閃存盤(pan)對軟盤(pan)/光(guang)盤(pan)、SSD對HDD,以及剛剛面世的(de)(de)Optane。
快慢設備的銜接
“多點潤滑、少(shao)點摩擦”,這(zhe)是海灣戰爭期(qi)間的著名潤滑油廣告。而對于計算機來說,高速和低俗(su)設備(bei)之(zhi)間,對獲取數據(ju)方面的摩擦一(yi)直(zhi)沒有停止過,解決這(zhe)種數據(ju)沖突的方式(shi)也在革新。
以速(su)(su)(su)度(du)(du)(du)較(jiao)快的(de)ALU為(wei)例,與之進(jin)行(xing)數(shu)(shu)(shu)據交換的(de)寄(ji)存(cun)(cun)(cun)(cun)器(qi)有(you)著(zhu)相同速(su)(su)(su)度(du)(du)(du)的(de)寄(ji)存(cun)(cun)(cun)(cun)器(qi),除去在相鄰周(zhou)期(qi)里(li)循環存(cun)(cun)(cun)(cun)取(qu)的(de)時間周(zhou)期(qi)不算(suan),兩者實際上是(shi)同頻同步(bu)工(gong)作(zuo)的(de)。寄(ji)存(cun)(cun)(cun)(cun)器(qi)有(you)著(zhu)動輒(zhe)數(shu)(shu)(shu)GHz的(de)運行(xing)速(su)(su)(su)度(du)(du)(du),只(zhi)(zhi)能集(ji)成(cheng)在離ALU最近(jin)的(de)地方,但代價是(shi)成(cheng)本高昂、容量(liang)(liang)以字節為(wei)單位(wei)精(jing)打(da)細算(suan),這就是(shi)為(wei)什么如(ru)AVX 2.0中的(de)256位(wei)指令/數(shu)(shu)(shu)據寄(ji)存(cun)(cun)(cun)(cun)器(qi),英(ying)特爾更(geng)壕一(yi)些,直接(jie)放入256位(wei)長(chang),而AMD摳門些,旗艦的(de)Ryzen 7 1800X只(zhi)(zhi)有(you)128位(wei)寄(ji)存(cun)(cun)(cun)(cun)器(qi),256位(wei)數(shu)(shu)(shu)據需(xu)要兩個(ge)周(zhou)期(qi)讀(du)入和(he)寫出,性能折損極(ji)大。當然(ran),處理器(qi)廠商們早已注意到(dao)這個(ge)問(wen)題,n年前就大肆引(yin)入Cache結構(gou)作(zuo)為(wei)從(cong)寄(ji)存(cun)(cun)(cun)(cun)器(qi)到(dao)內(nei)存(cun)(cun)(cun)(cun)的(de)梯級(ji)緩沖,用數(shu)(shu)(shu)量(liang)(liang)和(he)逐(zhu)漸提高的(de)速(su)(su)(su)度(du)(du)(du)解決計算(suan)單元從(cong)內(nei)存(cun)(cun)(cun)(cun)獲取(qu)數(shu)(shu)(shu)據的(de)性能落差。L1、L2、L3 Cache容量(liang)(liang)通(tong)常為(wei)數(shu)(shu)(shu)十KB、數(shu)(shu)(shu)百KB和(he)數(shu)(shu)(shu)MB,對(dui)應容量(liang)(liang)提升一(yi)個(ge)級(ji)別,速(su)(su)(su)度(du)(du)(du)也降低一(yi)個(ge)級(ji)別,以匹配(pei)慢速(su)(su)(su)的(de)GB級(ji)別內(nei)存(cun)(cun)(cun)(cun)。為(wei)了保(bao)證速(su)(su)(su)度(du)(du)(du),Cache通(tong)常會(hui)采用SRAM(靜態(tai)內(nei)存(cun)(cun)(cun)(cun))制作(zuo),而內(nei)存(cun)(cun)(cun)(cun)雖然(ran)用了DRAM速(su)(su)(su)度(du)(du)(du)低了不少,但當年正(zheng)是(shi)DRAM的(de)出現,讓配(pei)有(you)64KB內(nei)存(cun)(cun)(cun)(cun)的(de)PC有(you)機會(hui)誕生,要知道同容量(liang)(liang)的(de)SRAM當時價格超過2500美(mei)元,而第(di)一(yi)臺PC的(de)不過1999美(mei)元。
類似的(de)(de)(de)情況也出現在(zai)“存儲”設備上(shang),雖然以硬盤(HDD)為代表的(de)(de)(de)存儲設備已經是(shi)外設“矬子里面的(de)(de)(de)將軍”,但(dan)是(shi)它和PC系(xi)統之間的(de)(de)(de)性(xing)能落差(cha)仍(reng)然很大,其性(xing)能包括了(le)帶(dai)寬和響(xiang)應(ying)延遲等(deng)兩(liang)(liang)個維度(du)的(de)(de)(de)速(su)(su)度(du)。于(yu)是(shi)另一種(zhong)緩(huan)(huan)存,Buffer出現了(le)。別看(kan)中文(wen)都是(shi)“緩(huan)(huan)存”,但(dan)是(shi)在(zai)計(ji)算機詞匯中,Cache和Buffer是(shi)兩(liang)(liang)個不同世界的(de)(de)(de)速(su)(su)度(du),相比多(duo)采用SRAM的(de)(de)(de)Cache,Buffer多(duo)使用廉價(jia)的(de)(de)(de)DRAM以緩(huan)(huan)解I/O接口兩(liang)(liang)側(ce)的(de)(de)(de)速(su)(su)度(du)不匹(pi)配,最(zui)常見的(de)(de)(de)情形是(shi)Buffer容量作(zuo)為HDD的(de)(de)(de)重要參(can)數標識產品檔次。無論(lun)是(shi)哪種(zhong)緩(huan)(huan)沖,都能在(zai)響(xiang)應(ying)時(shi)間和帶(dai)寬上(shang)同時(shi)匹(pi)配兩(liang)(liang)端性(xing)能,兩(liang)(liang)端都認為對(dui)方遷就(jiu)了(le)自(zi)己(ji)的(de)(de)(de)性(xing)能水準,而(er)沒有察覺(jue)到(dao)緩(huan)(huan)沖的(de)(de)(de)加(jia)入,此(ci)現象(xiang)就(jiu)叫透明。
容量與性能的分歧
經過多級緩沖,DRAM的(de)(de)(de)速度已(yi)(yi)經遠(yuan)遠(yuan)落后于(yu)CPU,但即便如此,它仍遠(yuan)遠(yuan)高于(yu)主流的(de)(de)(de)存儲(chu)設備。更具體點說,單(dan)通道(dao)DDR4-2400內(nei)存帶(dai)寬已(yi)(yi)近(jin)20GB/s、延(yan)遲為(wei)30ns左右,而容量已(yi)(yi)突破(po)10TB的(de)(de)(de)HDD,對應的(de)(de)(de)性能(neng)水(shui)準(zhun)只(zhi)略微增長(chang)到150MB/s~200MB/s帶(dai)寬,延(yan)遲則停留在3~4ms(接口(kou))+7~8ms(平(ping)均(jun)尋道(dao))的(de)(de)(de)10年前水(shui)平(ping),明顯(xian)不能(neng)滿足當下電腦系統的(de)(de)(de)需求。于(yu)是(shi)這才有了(le)近(jin)幾年較有效的(de)(de)(de)升級已(yi)(yi)經從增加內(nei)存變(bian)為(wei)了(le)更換HDD為(wei)SSD。SSD綜合(he)性能(neng)較HDD已(yi)(yi)經有了(le)質的(de)(de)(de)飛躍,主流產品接口(kou)帶(dai)寬突破(po)1GB/s水(shui)平(ping)、延(yan)遲下降到μs量級,但與(yu)之(zhi)伴隨的(de)(de)(de)就是(shi)10倍的(de)(de)(de)價格差異。
無論是容(rong)(rong)量(liang)(liang)還(huan)是性(xing)(xing)(xing)能,對使用體(ti)驗(yan)(yan)的(de)(de)(de)影響(xiang)都是顯而易見的(de)(de)(de)。在預(yu)算(suan)有(you)限的(de)(de)(de)前(qian)提下,考(kao)慮到時間可以換取性(xing)(xing)(xing)能而容(rong)(rong)量(liang)(liang)不行,更多數消費者都傾向于容(rong)(rong)量(liang)(liang)更大而非性(xing)(xing)(xing)能更高(gao),這也就是為(wei)(wei)何仍有(you)超過85%的(de)(de)(de)臺式電腦(nao)選擇HDD作為(wei)(wei)唯一存(cun)儲(chu)設(she)備(bei)的(de)(de)(de)原因。但凡預(yu)算(suan)寬(kuan)裕一些,或者性(xing)(xing)(xing)能的(de)(de)(de)需求(qiu)稍(shao)占上(shang)風,雙硬(ying)盤(pan)就成為(wei)(wei)更為(wei)(wei)理想的(de)(de)(de)搭(da)配。現(xian)實是很殘酷的(de)(de)(de),艱難的(de)(de)(de)預(yu)算(suan)增加,并不能帶來(lai)如(ru)一的(de)(de)(de)性(xing)(xing)(xing)能體(ti)驗(yan)(yan),頻繁使用的(de)(de)(de)數據固然可以手動放置到SSD中,但是相對較小的(de)(de)(de)容(rong)(rong)量(liang)(liang)被占滿后,越是大量(liang)(liang)的(de)(de)(de)數據,越會(hui)深刻(ke)體(ti)會(hui)到“慢”的(de)(de)(de)熬(ao)人,小容(rong)(rong)量(liang)(liang)SSD對此無能為(wei)(wei)力。
能夠彌合電腦與HDD性能落(luo)差、解決(jue)SSD與HDD容量落(luo)差的Optane來(lai)了。
橫空出世
SSD的(de)出現,可(ke)謂是近年來(lai)存儲領(ling)域較大(da)的(de)技術(shu)革新。以高速(su)旋轉的(de)磁碟片為基礎的(de)HDD,數十年來(lai)維持在溫徹斯特(te)架構(gou)下幾乎沒有(you)變化,無論(lun)是體積縮(suo)小(xiao)還是容量(liang)(liang)增加,都不(bu)能(neng)很好(hao)地解決速(su)度問題(ti)(ti),哪怕是即(ji)將到來(lai)的(de)熱輔助(zhu)磁存儲技術(shu),也只是幫助(zhu)容量(liang)(liang)大(da)幅提升而對性(xing)能(neng)的(de)提升仍(reng)是隔靴(xue)搔(sao)癢,機械原理限制了HDD性(xing)能(neng)質的(de)升級(ji)。SSD核心的(de)改變正在于以半導體取代機械,ms進入μs、MB/s提升到GB/s。按下葫蘆(lu)起(qi)來(lai)瓢,SSD讓成本(ben)和耐久性(xing)問題(ti)(ti)浮出水面,NAND的(de)存儲介(jie)質可(ke)謂“萬惡之源”。
NAND是(shi)閃存(Flash)中最(zui)主要的(de)類別,具(ju)有(you)讀寫耐久性隨制程(cheng)提(ti)升(sheng)(sheng)下降、性能隨制程(cheng)提(ti)升(sheng)(sheng)下降等固有(you)特(te)性,特(te)別是(shi)為了在(zai)(zai)有(you)限(xian)的(de)晶圓(yuan)(成本)上獲得更大容量,制程(cheng)和單元結(jie)構升(sheng)(sheng)級一直沒有(you)停止過,如今NAND已(yi)經進(jin)入10nm時代、TLC漸成主流,反(fan)觀(guan)其耐久性艱難維持在(zai)(zai)2000次(ci)左右(you),延遲和介質性能改進(jin)緩慢。
2015年(nian),英特(te)爾正(zheng)式發(fa)布了名為3D XPoint的(de)全新非易失性存儲技術,這就是橫(heng)空出世的(de)Optane傲騰;與英特(te)爾合作(zuo)生產相關(guan)產品的(de)美光,則(ze)將其命名為QuantX。3D XPoint或者說Optane與NAND/NOR等Flash完全不同,而(er)更(geng)接近于內存,延遲、耐擦寫(xie)性、介質速度等幾個關(guan)鍵指(zhi)標也(ye)優于NAND幾個數量級,未來發(fa)展潛力巨大,英特(te)爾的(de)目標是用其擴大僅有5%左(zuo)右的(de)SSD市場份(fen)額。
Optane的(de)非易失性(xing)和(he)性(xing)能優勢,使其可在(zai)計算機(ji)系統中扮演(yan)多(duo)種(zhong)甚至是(shi)任何(he)存(cun)(cun)儲角(jiao)色:內存(cun)(cun)、存(cun)(cun)儲和(he)緩(huan)存(cun)(cun),分別(bie)對應(ying)Optane DIMM、Optane SSD和(he)Optane Memory,從而(er)改變(bian)整個計算機(ji)存(cun)(cun)儲發(fa)展進(jin)程(cheng)。目(mu)前后兩類產品已(yi)經(jing)上市。
為(wei)了(le)獲得極速的存(cun)儲,一種(zhong)名為(wei)RAMDisk的產(chan)品已經問世多年。它采用(yong)(yong)(yong)(yong)單位容量昂貴的DRAM為(wei)存(cun)儲介質,使(shi)(shi)系統用(yong)(yong)(yong)(yong)訪(fang)問硬(ying)盤(pan)的方(fang)式訪(fang)問它,性能(neng)當然(ran)是(shi)內存(cun)水平的,而容量也是(shi)內存(cun)水平的數GB。顯然(ran),這樣(yang)(yang)的容量水平對PC都不夠(gou)用(yong)(yong)(yong)(yong),何況這樣(yang)(yang)的“硬(ying)盤(pan)”還要(yao)面臨掉電(dian)數據丟失(shi)(易(yi)失(shi)性)的問題,使(shi)(shi)用(yong)(yong)(yong)(yong)時先要(yao)從硬(ying)盤(pan)讀(du)取數據、關機前人(ren)工將數據寫回硬(ying)盤(pan),可用(yong)(yong)(yong)(yong)性不佳。今天,Optane SSD已經具有了(le)RAMDisk的性能(neng)卻有著數TB的超大容量和非易(yi)失(shi)性,后者(zhe)已經沒有繼續(xu)存(cun)在的意義。
Optane Memory則是(shi)比NAND更為理想(xiang)(xiang)的(de)(de)(de)(de)緩存材料,更高(gao)的(de)(de)(de)(de)耐(nai)久性(xing)和(he)(he)ns級的(de)(de)(de)(de)響應(ying)速(su)度,比當(dang)年(nian)英特(te)爾涉足(zu)緩存領(ling)域的(de)(de)(de)(de)TurboMemory所使用(yong)(yong)(yong)(yong)的(de)(de)(de)(de)SLC NAND表現優1~3個(ge)數量級,更別提如今漫天的(de)(de)(de)(de)TLC產品了(le)。性(xing)能改善(shan)之余(yu),32GB的(de)(de)(de)(de)超大(da)容量早(zao)已(yi)突破系統緩沖的(de)(de)(de)(de)需(xu)求(qiu),甚至作為超高(gao)性(xing)能的(de)(de)(de)(de)SSD也不為過(guo)(想(xiang)(xiang)想(xiang)(xiang)Optane SSD的(de)(de)(de)(de)表現),它更大(da)的(de)(de)(de)(de)作用(yong)(yong)(yong)(yong)是(shi)為Windows以外的(de)(de)(de)(de)更多應(ying)用(yong)(yong)(yong)(yong)和(he)(he)數據進行(xing)緩沖和(he)(he)優化,實用(yong)(yong)(yong)(yong)性(xing)遠超當(dang)年(nian)512MB的(de)(de)(de)(de)TurboMemory產品。只要(yao)用(yong)(yong)(yong)(yong)上英特(te)爾200系列的(de)(de)(de)(de)芯片組和(he)(he)7代酷(ku)睿(rui)處理器,Optane Memory的(de)(de)(de)(de)延遲(chi)水平(ping)(ping)直逼DRAM。想(xiang)(xiang)象一下有(you)否體驗過(guo)內存的(de)(de)(de)(de)延遲(chi)水平(ping)(ping)或速(su)度不足(zu),沒有(you)吧?未來“硬盤”也不會再有(you)今天煩(fan)人的(de)(de)(de)(de)等待(dai),與內存同(tong)速(su)。