北京2022年11月30日 /美通社/ -- 亞馬遜云科技在2022 re:Invent全球大會上宣布,推出三款分別由三種新的自研芯片支持的Amazon Elastic Compute Cloud(Amazon EC2)實(shi)例(li),為(wei)客戶廣(guang)泛的(de)(de)(de)(de)工作負載提供(gong)更高(gao)(gao)(gao)性(xing)價比(bi)。Hpc7g實(shi)例(li)配備了Amazon自研(yan)(yan)的(de)(de)(de)(de)最(zui)新 Graviton3E處理(li)器(qi),與(yu)當(dang)前一(yi)代(dai)(dai)C6gn實(shi)例(li)相(xiang)比(bi)浮點性(xing)能(neng)提高(gao)(gao)(gao)了2倍(bei)(bei),與(yu)當(dang)前一(yi)代(dai)(dai)Hpc6a實(shi)例(li)相(xiang)比(bi)性(xing)能(neng)提高(gao)(gao)(gao)了20%,為(wei)亞馬遜云科技上的(de)(de)(de)(de)高(gao)(gao)(gao)性(xing)能(neng)計算工作負載提供(gong)了超高(gao)(gao)(gao)性(xing)價比(bi)。配備了新一(yi)代(dai)(dai)Amazon Nitro的(de)(de)(de)(de)C7gn實(shi)例(li),與(yu)當(dang)前一(yi)代(dai)(dai)網絡優化型(xing)(xing)實(shi)例(li)相(xiang)比(bi),為(wei)每個CPU提供(gong)了多(duo)(duo)達2倍(bei)(bei)的(de)(de)(de)(de)網絡帶寬,同時(shi)將每秒數(shu)據包轉發(fa)性(xing)能(neng)提升50%,為(wei)網絡密集型(xing)(xing)工作負載提供(gong)了超高(gao)(gao)(gao)的(de)(de)(de)(de)網絡帶寬、數(shu)據包轉發(fa)性(xing)能(neng)和性(xing)價比(bi)。Inf2實(shi)例(li)配備了Amazon自研(yan)(yan)的(de)(de)(de)(de)最(zui)新Inferentia2機器(qi)學(xue)習加(jia)速推(tui)理(li)芯(xin)片,是專門(men)為(wei)運行(xing)多(duo)(duo)達1,750億(yi)個參數(shu)的(de)(de)(de)(de)大型(xing)(xing)深度學(xue)習模型(xing)(xing)而構建的(de)(de)(de)(de),與(yu)當(dang)前一(yi)代(dai)(dai)Inf1實(shi)例(li)相(xiang)比(bi)可提供(gong)高(gao)(gao)(gao)達4倍(bei)(bei)的(de)(de)(de)(de)吞吐量,降低多(duo)(duo)達10倍(bei)(bei)的(de)(de)(de)(de)延遲,以最(zui)低的(de)(de)(de)(de)成本為(wei)Amazon EC2上的(de)(de)(de)(de)機器(qi)學(xue)習推(tui)理(li)提供(gong)最(zui)低延遲。
亞馬遜云(yun)(yun)科(ke)技(ji)擁有十多(duo)年(nian)芯(xin)(xin)(xin)片(pian)(pian)(pian)設(she)計經(jing)驗,在云(yun)(yun)中以更(geng)(geng)低成(cheng)本(ben)實現更(geng)(geng)高的(de)(de)(de)(de)性能(neng)和(he)可擴(kuo)展(zhan)性。十多(duo)年(nian)來,亞馬遜云(yun)(yun)科(ke)技(ji)推(tui)(tui)(tui)出了多(duo)種(zhong)定制化(hua)(hua)(hua)的(de)(de)(de)(de)芯(xin)(xin)(xin)片(pian)(pian)(pian)設(she)計,幫助客戶(hu)運行(xing)要求更(geng)(geng)高的(de)(de)(de)(de)工作(zuo)負(fu)載(zai),包括(kuo)更(geng)(geng)快(kuai)的(de)(de)(de)(de)處理速(su)(su)(su)度、更(geng)(geng)高的(de)(de)(de)(de)內存容量、更(geng)(geng)快(kuai)的(de)(de)(de)(de)存儲輸(shu)入/輸(shu)出(I/O)和(he)更(geng)(geng)高的(de)(de)(de)(de)網絡帶寬。亞馬遜云(yun)(yun)科(ke)技(ji)自(zi)2013年(nian)推(tui)(tui)(tui)出Amazon Nitro系統以來,已經(jing)開發了多(duo)個自(zi)研芯(xin)(xin)(xin)片(pian)(pian)(pian),包括(kuo)五代(dai)Nitro系統、致力(li)于為(wei)各(ge)種(zhong)工作(zuo)負(fu)載(zai)提(ti)升性能(neng)和(he)優化(hua)(hua)(hua)成(cheng)本(ben)的(de)(de)(de)(de)三代(dai)Graviton芯(xin)(xin)(xin)片(pian)(pian)(pian)、用于加速(su)(su)(su)機(ji)器(qi)學習(xi)推(tui)(tui)(tui)理的(de)(de)(de)(de)兩代(dai)Inferentia芯(xin)(xin)(xin)片(pian)(pian)(pian),以及用于加速(su)(su)(su)機(ji)器(qi)學習(xi)訓練(lian)的(de)(de)(de)(de)Trainium芯(xin)(xin)(xin)片(pian)(pian)(pian)。亞馬遜云(yun)(yun)科(ke)技(ji)在芯(xin)(xin)(xin)片(pian)(pian)(pian)設(she)計和(he)驗證的(de)(de)(de)(de)敏捷(jie)開發周期中使用基于云(yun)(yun)的(de)(de)(de)(de)電子設(she)計自(zi)動(dong)化(hua)(hua)(hua),這使團隊能(neng)夠更(geng)(geng)快(kuai)地創(chuang)新(xin),更(geng)(geng)快(kuai)地將芯(xin)(xin)(xin)片(pian)(pian)(pian)提(ti)供給客戶(hu)。實踐證明(ming),亞馬遜云(yun)(yun)科(ke)技(ji)更(geng)(geng)現代(dai)化(hua)(hua)(hua)、更(geng)(geng)節能(neng)的(de)(de)(de)(de)半導體處理確保(bao)了芯(xin)(xin)(xin)片(pian)(pian)(pian)的(de)(de)(de)(de)快(kuai)速(su)(su)(su)迭(die)代(dai)及交(jiao)付。每推(tui)(tui)(tui)出一款新(xin)的(de)(de)(de)(de)芯(xin)(xin)(xin)片(pian)(pian)(pian),亞馬遜云(yun)(yun)科(ke)技(ji)都進(jin)一步提(ti)升了這些(xie)芯(xin)(xin)(xin)片(pian)(pian)(pian)支持的(de)(de)(de)(de)Amazon EC2實例的(de)(de)(de)(de)性能(neng)、效率以及更(geng)(geng)優化(hua)(hua)(hua)的(de)(de)(de)(de)成(cheng)本(ben),為(wei)客戶(hu)提(ti)供了更(geng)(geng)多(duo)的(de)(de)(de)(de)芯(xin)(xin)(xin)片(pian)(pian)(pian)和(he)實例組(zu)合選擇,針(zhen)對他們(men)獨特的(de)(de)(de)(de)工作(zuo)負(fu)載(zai)進(jin)行(xing)了優化(hua)(hua)(hua)。
亞馬遜云(yun)科技Amazon EC2副(fu)總裁David Brown表示(shi):"從(cong)Graviton到(dao)Trainium、Inferentia再到(dao)Nitro,亞馬遜云(yun)科技每一代自研芯片都為客(ke)戶的(de)(de)(de)各種工(gong)(gong)作(zuo)(zuo)負載(zai)提供(gong)更(geng)(geng)(geng)高的(de)(de)(de)性能、更(geng)(geng)(geng)優化(hua)的(de)(de)(de)成本和(he)(he)更(geng)(geng)(geng)高的(de)(de)(de)能效。我們不斷推陳出新讓客(ke)戶獲得卓越的(de)(de)(de)性價比(bi),這也(ye)一直驅動著我們的(de)(de)(de)持續創新。我們今天推出的(de)(de)(de)Amazon EC2實例為高性能計算、網(wang)絡密(mi)集型工(gong)(gong)作(zuo)(zuo)負載(zai)和(he)(he)機器學(xue)習(xi)推理工(gong)(gong)作(zuo)(zuo)負載(zai)提供(gong)了(le)顯著的(de)(de)(de)性能提升,客(ke)戶有(you)了(le)更(geng)(geng)(geng)多的(de)(de)(de)實例選擇來(lai)滿足(zu)他們的(de)(de)(de)特(te)定(ding)需求(qiu)。"
Hpc7g實例專為在Amazon EC2上大規模運行高性能計算工作負載提供超高性價比
很多(duo)領域的(de)(de)(de)組織(zhi)需要依靠高(gao)(gao)性(xing)能(neng)(neng)(neng)計(ji)(ji)算(suan)來解決復雜(za)的(de)(de)(de)學術、科學和(he)(he)(he)商業問題(ti)。當(dang)前,眾多(duo)客戶(hu)如阿(a)斯利康(kang)、F1一級方程式賽車(che)、Maxar Technologies等在亞馬遜云科技上借助其提供的(de)(de)(de)卓越的(de)(de)(de)安全(quan)性(xing)、可擴展(zhan)性(xing)和(he)(he)(he)彈性(xing),運(yun)行傳統(tong)的(de)(de)(de)高(gao)(gao)性(xing)能(neng)(neng)(neng)計(ji)(ji)算(suan)工作(zuo)負(fu)載,包(bao)括(kuo)基因(yin)組學處(chu)理(li)、計(ji)(ji)算(suan)流體動力學和(he)(he)(he)天氣預報模擬等。工程師、研究人(ren)員和(he)(he)(he)科學家(jia)使用Amazon EC2網絡優化型(xing)實例(li)(如C5n、R5n、M5n和(he)(he)(he)C6gn)運(yun)行高(gao)(gao)性(xing)能(neng)(neng)(neng)計(ji)(ji)算(suan)工作(zuo)負(fu)載,這些實例(li)提供了近(jin)乎無限的(de)(de)(de)計(ji)(ji)算(suan)能(neng)(neng)(neng)力和(he)(he)(he)服務器之間的(de)(de)(de)高(gao)(gao)網絡帶寬(kuan),實現數(shu)千個(ge)內核(he)處(chu)理(li)和(he)(he)(he)交換(huan)數(shu)據。雖然這些實例(li)的(de)(de)(de)性(xing)能(neng)(neng)(neng)足(zu)(zu)以(yi)滿足(zu)(zu)目前大多(duo)數(shu)高(gao)(gao)性(xing)能(neng)(neng)(neng)計(ji)(ji)算(suan)場景,但人(ren)工智能(neng)(neng)(neng)和(he)(he)(he)自動駕(jia)駛汽車(che)等新興應用需要高(gao)(gao)性(xing)能(neng)(neng)(neng)計(ji)(ji)算(suan)優化實例(li),可以(yi)擴展(zhan)到數(shu)萬個(ge)甚至(zhi)更多(duo)的(de)(de)(de)內核(he),進一步解決難(nan)度系(xi)數(shu)持(chi)續增加的(de)(de)(de)問題(ti)并降低高(gao)(gao)性(xing)能(neng)(neng)(neng)計(ji)(ji)算(suan)工作(zuo)負(fu)載的(de)(de)(de)成本。
Hpc7g實例由新的Amazon Graviton3E芯片提供支持,為客戶在Amazon EC2上的高性能計算工作負載(如計算流體動力學、天氣模擬、基因組學和分子動力學等)提供了超高的性價比。與采用Graviton2處理器的當前一代C6gn實例相比,Hpc7g實例的浮點性能提高了2倍,與當前一代Hpc6a實例相比性能提高了20%,讓客戶能夠在多達數萬個內核的高性能計算集群中進行復雜的計算。Hpc7g實例還提供高內存帶寬和200Gbps的EFA (Elastic Fabric Adapter,彈性結構適配器)網絡帶寬,可以更快的運行并完成高性能計算應用。客戶可以通過開源的集群管理工具Amazon ParallelCluster使用Hpc7g實例,與其它實例類型一起配置Hpc7g實例,這讓客戶在同一個高能性計算集群中靈活運行不同的工作負載類型。有關高性能計算(HPC)實例的更多信息,請訪問aws.amazon.com/cn/hpc/。
C7gn實例為網絡密集型工作負載提供極佳性能,具有更高的網絡帶寬、更高的數據包轉發性能和更低的延遲
客(ke)戶(hu)(hu)使用(yong)Amazon EC2網絡優(you)化型實例運行其要求極其嚴苛的(de)(de)(de)(de)(de)網絡密集型工作負載(zai)(zai),如網絡虛擬化設備(包括(kuo)防火墻(qiang)、虛擬路由(you)器和負載(zai)(zai)均衡器等)和數據(ju)加(jia)密業務(wu)等。客(ke)戶(hu)(hu)需(xu)要為這些工作負載(zai)(zai)擴(kuo)展性能,以處(chu)理(li)不斷增加(jia)的(de)(de)(de)(de)(de)網絡流量來應對業務(wu)高峰,或(huo)者縮(suo)短處(chu)理(li)時間(jian)為最終用(yong)戶(hu)(hu)提供更(geng)好(hao)的(de)(de)(de)(de)(de)體驗。當前(qian),為獲得更(geng)多(duo)的(de)(de)(de)(de)(de)網絡吞吐量,客(ke)戶(hu)(hu)采用(yong)更(geng)大型號(hao)的(de)(de)(de)(de)(de)實例,部署(shu)遠(yuan)高于需(xu)求的(de)(de)(de)(de)(de)計算資(zi)源,導致成本增加(jia)。這些客(ke)戶(hu)(hu)為減少數據(ju)處(chu)理(li)時間(jian),需(xu)要更(geng)高的(de)(de)(de)(de)(de)數據(ju)包轉發性能、更(geng)高的(de)(de)(de)(de)(de)網絡帶寬以及更(geng)快的(de)(de)(de)(de)(de)加(jia)密性能。
C7gn實例采用新的、具有網絡加速功能的第五代Nitro,在Amazon EC2網絡優化型實例中具有最高的網絡帶寬和數據包處理性能,而且功耗更低。Nitro卡將主機CPU的I/O功能卸載到專門的硬件并進行加速,將Amazon EC2實例的所有資源幾乎都提供給客戶的工作負載,從而以更低的CPU利用率實現更穩定的性能。新款Amazon Nitro卡使C7gn實例的每個CPU提供高達2倍的網絡帶寬,將每秒數據包處理性能提升50%,與當前一代網絡優化型Amazon EC2實例相比,進一步降低了EFA網絡延遲。與C6gn實例相比,C7gn實例提高了多達25%的計算性能及多達2倍的加密性能。第五代Nitro比第四代Nitro效能功耗比提升40%,進一步降低了客戶工作負載的能量消耗。C7gn實例通過擴展網絡性能和吞吐量以及減少網絡延遲,優化了客戶在Amazon EC2上要求最嚴苛的網絡密集型工作負載的成本。C7gn實例目前提供預覽版,欲了解更多信息,請訪問aws.amazon.com/cn/ec2/instance-types/c7g/。
Inf2實例專為部署當今最嚴苛的深度學習模型而設計,支持分布式推理和隨機舍入算法
為提供(gong)更(geng)(geng)好的(de)(de)應用(yong)(yong)(yong)或(huo)者更(geng)(geng)加定(ding)制的(de)(de)個性(xing)化(hua)體驗(yan),數(shu)(shu)據科學(xue)(xue)家和機(ji)器(qi)學(xue)(xue)習(xi)(xi)(xi)工(gong)程(cheng)師正(zheng)在(zai)構建更(geng)(geng)大(da)(da)(da)、更(geng)(geng)復雜的(de)(de)深(shen)(shen)(shen)度(du)(du)學(xue)(xue)習(xi)(xi)(xi)模型(xing)。例(li)如,越來(lai)越普(pu)遍的(de)(de)超過1,000億個參數(shu)(shu)的(de)(de)大(da)(da)(da)型(xing)語(yu)言(yan)模型(xing)(LLM),由于(yu)(yu)它們需要巨量的(de)(de)數(shu)(shu)據進(jin)行訓(xun)練(lian),這推(tui)動了(le)(le)對(dui)計算需求的(de)(de)空前增(zeng)(zeng)長(chang)。雖然訓(xun)練(lian)備受大(da)(da)(da)家關注,但(dan)在(zai)生產中運行機(ji)器(qi)學(xue)(xue)習(xi)(xi)(xi),大(da)(da)(da)部(bu)分的(de)(de)復雜性(xing)和成(cheng)本卻(que)在(zai)推(tui)理上(shang)(例(li)如,每花1美(mei)(mei)元用(yong)(yong)(yong)于(yu)(yu)訓(xun)練(lian),將有(you)(you)多(duo)達9美(mei)(mei)元用(yong)(yong)(yong)于(yu)(yu)推(tui)理),這限制了(le)(le)推(tui)理的(de)(de)使(shi)(shi)用(yong)(yong)(yong)并阻礙了(le)(le)客戶創(chuang)新。客戶希(xi)望在(zai)其(qi)(qi)應用(yong)(yong)(yong)中大(da)(da)(da)規(gui)模使(shi)(shi)用(yong)(yong)(yong)先(xian)進(jin)的(de)(de)深(shen)(shen)(shen)度(du)(du)學(xue)(xue)習(xi)(xi)(xi)模型(xing),但(dan)卻(que)受限于(yu)(yu)高(gao)(gao)額的(de)(de)計算成(cheng)本。當(dang)亞(ya)馬遜云科技在(zai)2019年(nian)推(tui)出Inf1實例(li)時,深(shen)(shen)(shen)度(du)(du)學(xue)(xue)習(xi)(xi)(xi)模型(xing)具(ju)有(you)(you)數(shu)(shu)百萬個參數(shu)(shu)。此后,深(shen)(shen)(shen)度(du)(du)學(xue)(xue)習(xi)(xi)(xi)模型(xing)的(de)(de)規(gui)模和復雜性(xing)呈指數(shu)(shu)級增(zeng)(zeng)長(chang),甚(shen)至有(you)(you)些深(shen)(shen)(shen)度(du)(du)學(xue)(xue)習(xi)(xi)(xi)模型(xing)的(de)(de)參數(shu)(shu)增(zeng)(zeng)長(chang)了(le)(le)500倍,超過了(le)(le)數(shu)(shu)千(qian)億。致力(li)于(yu)(yu)使(shi)(shi)用(yong)(yong)(yong)最(zui)先(xian)進(jin)的(de)(de)深(shen)(shen)(shen)度(du)(du)學(xue)(xue)習(xi)(xi)(xi)技術,開發下一(yi)代應用(yong)(yong)(yong)的(de)(de)客戶,希(xi)望擁(yong)有(you)(you)高(gao)(gao)性(xing)價比、高(gao)(gao)能效的(de)(de)硬件(jian),實現低延(yan)遲、高(gao)(gao)吞吐量的(de)(de)推(tui)理以及靈(ling)活的(de)(de)軟(ruan)件(jian)的(de)(de)支持,讓(rang)工(gong)程(cheng)團隊能夠快速大(da)(da)(da)規(gui)模地部(bu)署其(qi)(qi)業務(wu)創(chuang)新。
Inf2實例,配備了Amazon自研的最新款Inferentia2機器學習加速推理芯片,可以運行高達1,750億個參數的大型深度學習模型(如LLM、圖像生成和自動語音檢測),同時在Amazon EC2上提供最低的單次推理成本。Inf2是第一個支持分布式推理的推理優化型Amazon EC2實例,該技術將大型模型分布在多個芯片上,為參數超過1,000億的深度學習模型提供極佳性能。Inf2實例支持隨機舍入,這種以概率方式進行四舍五入的方式與傳統的四舍五入相比,能夠提供更高的性能和更高的精度。Inf2實例支持廣泛的數據類型,包括可提高吞吐量并降低了每次推理功耗的CFP8,和可提升尚未利用到低精度數據類型模塊性能的FP32。客戶可以通過用于機器學習推理的統一軟件開發工具包Amazon Neuron開始使用Inf2實例。Amazon Neuron與PyTorch和TensorFlow等流行的機器學習框架集成,幫助客戶僅需少量代碼改動就能將現有模型部署到Inf2實例。由于大型模型需要多個芯片支持,芯片之間需要實現快速通信,Inf2實例支持亞馬遜云科技的實例內部高速互連技術NeuronLink,提供192GB/s的環形連接。與當前一代Inf1實例相比,Inf2實例提供了高達4倍的吞吐量,降低多達10倍的延遲,與基于GPU的實例相比,它的每瓦性能提升高達45%。Inf2實例目前提供預覽版,欲了解更多信息,請訪問aws.amazon.com/ec2/instance-types/inf2。
Arup(奧雅納)是一(yi)家由設計師、工(gong)程與可(ke)持(chi)續(xu)發展咨詢師、顧問和(he)專家組成(cheng)的(de)(de)(de)全(quan)球性(xing)公(gong)司,致力于(yu)踐行可(ke)持(chi)續(xu)發展,并利用想象力、技(ji)術和(he)嚴謹的(de)(de)(de)態度來建造一(yi)個(ge)更(geng)美(mei)好的(de)(de)(de)世界。 "我(wo)們使用亞馬遜云(yun)科技(ji)的(de)(de)(de)服(fu)務(wu)來運行高度復(fu)雜的(de)(de)(de)模擬,幫助(zhu)我(wo)們的(de)(de)(de)客戶建造下(xia)一(yi)代高層建筑、體(ti)育場館、數(shu)據中(zhong)心(xin)和(he)關(guan)鍵基礎設施(shi),同時對(dui)影(ying)響大家生活的(de)(de)(de)城市微(wei)氣(qi)候(hou)、全(quan)球變暖和(he)氣(qi)候(hou)變化進(jin)行評估并提供(gong)洞察。" 奧雅納高級工(gong)程師Sina Hassanli博(bo)士(shi)說,"我(wo)們的(de)(de)(de)客戶希望能以更(geng)低的(de)(de)(de)成(cheng)本(ben)進(jin)行更(geng)快(kuai)、更(geng)準確(que)的(de)(de)(de)模擬,以便(bian)在開發的(de)(de)(de)早(zao)期階(jie)段(duan)為其(qi)設計提供(gong)信息。我(wo)們期待借(jie)助(zhu)更(geng)高性(xing)能的(de)(de)(de)Amazon EC2 Hpc7g實(shi)(shi)例,幫助(zhu)我(wo)們的(de)(de)(de)客戶實(shi)(shi)現更(geng)快(kuai)、更(geng)有效的(de)(de)(de)創(chuang)新。"
Aerospike公司的(de)(de)實時(shi)數(shu)(shu)(shu)據平臺旨在幫助(zhu)組(zu)織(zhi)構(gou)建(jian)應用(yong)(yong)程(cheng)(cheng)序(xu),以(yi)打擊欺詐、支(zhi)持全球數(shu)(shu)(shu)字(zi)支(zhi)付、為(wei)數(shu)(shu)(shu)千萬客戶提(ti)供超個性(xing)化的(de)(de)用(yong)(yong)戶體驗(yan)等。 "Aerospike 實時(shi)數(shu)(shu)(shu)據平臺是一(yi)個無(wu)共享(shared-nothing)、多線程(cheng)(cheng)、多模態的(de)(de)數(shu)(shu)(shu)據平臺,旨在通過服務器集(ji)群高(gao)效(xiao)運行,利用(yong)(yong)現代硬件(jian)和網絡技(ji)術,為(wei)PB級數(shu)(shu)(shu)據以(yi)亞(ya)毫(hao)秒的(de)(de)速度提(ti)供可靠(kao)地高(gao)性(xing)能 。"Aerospike 首席(xi)產品官 Lenley Hensarling表(biao)示, "在我們(men)最近(jin)的(de)(de)實時(shi)數(shu)(shu)(shu)據庫(ku)讀取(qu)測試(shi)中,我們(men)很(hen)高(gao)興看到,采用(yong)(yong)新一(yi)代Amazon Nitro的(de)(de) Amazon EC2 C7gn 實例(li)與 C6gn 實例(li)相比(bi),每(mei)秒交(jiao)易量顯著(zhu)提(ti)升。我們(men)期待(dai)著(zhu)C7gn 實例(li)以(yi)及未來更多亞(ya)馬(ma)遜云科技(ji)基礎設施提(ti)升帶給我們(men)的(de)(de)諸多優(you)勢。"
Qualtrics是一家設計和開發體驗管理軟件公司。"Qualtrics的重點是借助技術創新,縮小客戶、員工、品牌和產品之間的體驗差距。為實現這一目標,我們正在開發復雜的多任務、多模態的深度學習模型,包括文本分類、序列標記、話語分析、關鍵短語提取、主題提取、聚類以及端到端對話理解等。"Qualtrics 核心機器學習負責人 Aaron Colak 表示,"隨著(zhu)我們(men)(men)在更(geng)多(duo)應用程序(xu)中使用這(zhe)些復(fu)雜的(de)(de)(de)(de)模型以及非結(jie)構化(hua)數據(ju)量不(bu)斷增長,為給客(ke)戶提(ti)供(gong)最佳(jia)體驗,我們(men)(men)需(xu)(xu)要(yao)像(xiang)Inf2 實(shi)例這(zhe)樣(yang)性能(neng)更(geng)高(gao)的(de)(de)(de)(de)推理優化(hua)解決方案,來(lai)滿(man)(man)足我們(men)(men)的(de)(de)(de)(de)需(xu)(xu)求。我們(men)(men)很高(gao)興(xing)看(kan)到新(xin)一代(dai) Inf2 實(shi)例的(de)(de)(de)(de)推出(chu),它不(bu)僅讓(rang)我們(men)(men)實(shi)現更(geng)高(gao)的(de)(de)(de)(de)吞吐(tu)量,顯著(zhu)降(jiang)低延遲,而(er)且還引入了(le)分布(bu)式推理和(he)支(zhi)持(chi)增強(qiang)的(de)(de)(de)(de)動態(tai)形狀輸入等功能(neng)。隨著(zhu)我們(men)(men)部署更(geng)大、更(geng)復(fu)雜的(de)(de)(de)(de)模型,這(zhe)將能(neng)進(jin)一步滿(man)(man)足我們(men)(men)對(dui)部署的(de)(de)(de)(de)更(geng)高(gao)要(yao)求。"