3月15日,AMD公司發(fā)布了采用臺積電7nm工藝制造的全新EPYC 7003系列處理器(代號“米蘭”),其中包括了代表著服務(wù)器CPU性能新高的AMD EPYC 7763處理器。在最多可達64顆的“Zen 3”核心、全新級別的每核心高速緩存、PCIe 4連接、更多I/O和內(nèi)存吞吐量等先進科技的加持下,EPYC 7003系列處理器每時鐘指令集(IPC)性能提升高達19%。KVXesmc
AMD方面表示,EPYC 7003系列是目前全球最好的數(shù)據(jù)中心芯片,超越了競爭對手英特爾。預(yù)計到2021年底,EPYC處理器將會與包括AWS、思科、戴爾科技、谷歌云、HPE、聯(lián)想、微軟Azure、甲骨文云基礎(chǔ)架構(gòu)、Supermicro和騰訊云等在內(nèi)的眾多合作伙伴攜手合作,為其生態(tài)系統(tǒng)帶來超過400個云實例以及超過100個新OEM平臺。KVXesmc
KVXesmc
KVXesmc
AMD圍繞EPYC處理器構(gòu)建的生態(tài)系統(tǒng)KVXesmc
被AMD搶了風頭的英特爾自然不甘落于人后。KVXesmc
4月7日,英特爾宣布推出第三代至強(Xeon)可擴展處理器(代號Ice Lake),其主要亮點包括:采用Intel最新的10nm工藝,單個芯片最多包含40核。與上一代20核Cascade Lake相比,IPC性能提升20%;在主流數(shù)據(jù)中心工作負載上性能平均提升46%;74%的AI推理性能增加;與5年前的老系統(tǒng)相比,平均性能提升2.65倍。KVXesmc
值得一提的是,第三代至強可擴展處理器是Intel首個主流雙插槽并啟用SGX軟件防護擴展技術(shù)的數(shù)據(jù)中心處理器,也是Intel唯一一個內(nèi)置AI加速的數(shù)據(jù)中心處理器。此外,作為多代策略的延續(xù),第三代至強內(nèi)置有Intel密碼操作硬件加速。KVXesmc
KVXesmc
而為了應(yīng)對數(shù)據(jù)中心AI負載任務(wù)的增長,第三代至強處理器通過代際硬件平臺改進、軟件優(yōu)化,在機器學習用例中,比如XGBoost算法、Kmeans算法等方面,實現(xiàn)了1.3-1.6倍的性能提升;面向深度學習應(yīng)用中常見的圖像識別、圖像分類、語言處理等,DL Boost指令實現(xiàn)了1.45-1.74倍的性能提升。KVXesmc
KVXesmc
Intel官方提供的數(shù)據(jù)顯示,自2017年推出第一款至強可擴展處理器以來,英特爾不但向全球客戶交付了超過5000萬顆至強處理器,部署了超過10億顆至強核心,還成功的將用戶每臺虛擬機的基礎(chǔ)設(shè)施成本降低了25%,且性能保持不變,并將超過80%的TOC轉(zhuǎn)化為已有實際收益的部署。目前,超過800家云服務(wù)提供商部署了基于至強可擴展處理器的服務(wù)器,超過1000個客戶進行了TOC認證。KVXesmc
不打“核”戰(zhàn)
Intel方面認為,單純比拼“核”數(shù)的做法既不可行,也不科學。因為雖然大多數(shù)行業(yè)標準的基準測試都是最大吞吐量,但是對于數(shù)據(jù)中心計算機架構(gòu)來說,不僅需要提高吞吐量,同時也需要具備最佳的響應(yīng)能力,這樣才能更好地處理數(shù)據(jù)中心普遍的工作負載。為了實現(xiàn)這一點,處理器既需要應(yīng)對傳統(tǒng)的工作負載,也要能夠應(yīng)對新興的數(shù)據(jù)工作負載,性能需要在處理器內(nèi)部和外部進行良好拓展,無論是節(jié)點內(nèi)部還是節(jié)點外部。KVXesmc
Intel官方給出了與AMD米蘭在緩存時延、內(nèi)存時延等方面的參數(shù)對比:KVXesmc
在包括L1、L2、L3層級的緩存時延方面,最關(guān)鍵的是L3層面的緩存時延。第三代至強可以直接訪問這一層緩存,從而獲得一致的響應(yīng)時間。米蘭包括8個不同的硅芯片進行計算,每個都有獨立的緩存,當數(shù)據(jù)在本地緩存中,即核所在的位置旁邊,響應(yīng)時間會很短;但如果數(shù)據(jù)不在本地緩存,需要通過I/O請求,到另一個計算硅芯片來檢索數(shù)據(jù),再通過I/O回到發(fā)出申請的內(nèi)核,因此本地緩存訪問和遠程訪問之間響應(yīng)的時間差別很大。KVXesmc
KVXesmc
內(nèi)存時延方面,Intel方面強調(diào)了最大的DIMM能力和速度能力。第三代至強有8個內(nèi)存通道,可以在最高的內(nèi)存頻率下達到3200 DIMM性能,而米蘭只有一個內(nèi)存通道可以以最快的速度運行,到第二個DIMM時,速度下降會降低內(nèi)存的吞吐量。KVXesmc
在DRAM時延方面,在本地插槽的情況下,從內(nèi)存中獲取數(shù)據(jù)最快需要多長時間?從第二個遠程插槽中獲取數(shù)據(jù)又需要多長時間?Intel方面強調(diào)了第三代至強組合產(chǎn)品的優(yōu)勢,硅芯片旁邊就是直接內(nèi)存控制器,因此本地插槽延時更短,遠程插槽延時性能更優(yōu),最高可以快30%。KVXesmc
內(nèi)存總能力上,Intel的持久內(nèi)存可以實現(xiàn)每個插槽6TB內(nèi)存,這一能力幾乎可以讓用戶在盡可能靠近處理器的位置隨時提取數(shù)據(jù),做到快速訪問。Intel技術(shù)專家表示,以上這些好處不一定在吞吐量上能顯示出來,但實際響應(yīng)時間在應(yīng)用中非常關(guān)鍵。KVXesmc
KVXesmc
在深度學習和推理性能方面,第三代至強比AMD米蘭提高25倍。在20個最常見的機器學習、深度學習模型的訓練和推理比較中,第三代至強性能是米蘭的1.5倍,是英偉達A100 GPU的1.3倍。KVXesmc
KVXesmc
面對數(shù)據(jù)中心應(yīng)用將AI加速任務(wù)卸載到專用處理器上的趨勢,Intel借第三代至強發(fā)布之際再次表明:第一,至強CPU是AI加速的絕佳選擇,加速發(fā)生在CPU,可以將工作負載提升到新的水平;第二,數(shù)據(jù)中心基礎(chǔ)架構(gòu)的高利用率非常關(guān)鍵,決定了用戶在不同類型工作負載中能夠獲得的容量彈性,因此在最佳TCO基礎(chǔ)上的分布式服務(wù)最為重要,而不僅僅是在孤立的節(jié)點基準測試上做到最佳。KVXesmc
Intel市場營銷集團副總裁、中國區(qū)數(shù)據(jù)中心銷售總經(jīng)理陳葆立表示,整個產(chǎn)品的迭代做好平衡非常重要,不管是核數(shù)、還是不同工作負載的加速指令和配套產(chǎn)品。目前采用PCIe 4.0 64個通道,已經(jīng)可以顯著提高帶寬和性能。隨著分布式計算、微服務(wù)在大規(guī)模數(shù)據(jù)中心的應(yīng)用,I/O的時延和一致性對于大規(guī)模服務(wù)的實際交付非常關(guān)鍵。Intel通過對這些I/O流、在插槽中的處理情況,以及與CPU上其余服務(wù)交互方式的改進,從而保證能夠提供最佳的規(guī)模系統(tǒng)性能,滿足遍布大量節(jié)點和整個數(shù)據(jù)中心的需求。KVXesmc
Arm陣營“笑而不語”
對服務(wù)器領(lǐng)域的追逐從未停止的,不僅有X86架構(gòu),還有Arm陣營。KVXesmc
2018年10月,Arm首次宣布推出面向云到邊緣基礎(chǔ)設(shè)施產(chǎn)品Neoverse及其初步路線圖,并承諾平臺效能30%的年增長率指標將持續(xù)到2022年及以后。2020年9月,Neoverse再度進階,新增兩個全新的平臺—Neoverse V1平臺以及第二代的N系列平臺Neoverse N2。KVXesmc
KVXesmc
KVXesmc
Arm Neoverse平臺路線圖KVXesmc
根據(jù)Neoverse平臺PPA設(shè)計原則,N系列強調(diào)性能、功率、面積得到同等考量,擅長可擴展;E系列主要關(guān)注效率,對于網(wǎng)絡(luò)流量和數(shù)據(jù)應(yīng)用程序非常有效,在功耗和面積的縮減上進行優(yōu)化;V系列旨在提供最佳性能,需要添加更大的緩存、窗口和隊列,相對來說會消耗更多面積和功耗。KVXesmc
Arm方面認為,除了與工程團隊的努力和投入密不可分外,Arm自身軟件生態(tài)系統(tǒng)的逐漸成熟以及異構(gòu)計算的推動同樣功不可沒。KVXesmc
再一起看看其它廠商的最新動態(tài):
3月15日,隸屬于Arm陣營的安晟培半導體(Ampere Computing)公布了云原生服務(wù)器處理器Ampere Altra Max樣片的基準測試數(shù)據(jù)。Altra Max是Ampere繼2020年3月發(fā)布的80核Altra處理器后即將推出的重磅新品,內(nèi)核數(shù)量達到128核,專為云原生架構(gòu)打造。在軟件媒體編碼測試中,Ampere Altra的編碼性能已經(jīng)領(lǐng)先于當前的x86處理器(如下圖所示),而Ampere Altra Max則比Ampere Altra更強。KVXesmc
KVXesmc
KVXesmc
Ampere Altra媒體編碼性能與x86處理器對比KVXesmc
3月17日,高通公司宣布以14億美元的價格完成了對世界一流的CPU和技術(shù)設(shè)計公司NUVIA的收購。在被問及是否會繼續(xù)投資NUVIA最初進入的服務(wù)器和企業(yè)市場時,高通方面回應(yīng)稱,這不是收購的主要目標或動機,但是高通公司未來會對此保持開放的態(tài)度,讓NUVIA團隊探索這些可能性。KVXesmc
3月29日,亞馬遜云科技宣布,新一代內(nèi)存優(yōu)化實例Amazon Elastic Compute Cloud(Amazon EC2) X2gd實例已全面可用,它由亞馬遜云科技自研的基于Arm構(gòu)架的 Graviton2處理器提供支持。新的X2gd實例與當前基于x86的X1實例相比,性價比提升可高達55%;而與其它基于Graviton2的實例相比,每個vCPU配置的內(nèi)存容量更大,使客戶能夠更高效地運行內(nèi)存密集型工作負載,例如內(nèi)存數(shù)據(jù)庫、關(guān)系型數(shù)據(jù)庫、電子設(shè)計自動化(EDA)工作負載、實時分析和實時緩存服務(wù)器等。KVXesmc
結(jié)語
盡管受到新冠病毒疫情的影響,但來自數(shù)據(jù)中心的需求仍然源源不斷,同時,5G商用也促使全球消費者和企業(yè)數(shù)據(jù)訪問出現(xiàn)了快速變化。Canalys的數(shù)據(jù)顯示,2020年Q1全球云計算資本支出增長34%,達310億美元,創(chuàng)歷史新高。根據(jù)Omdia的數(shù)據(jù),2020年Q1全球服務(wù)器出貨量為330萬臺,同比增長超過30%,創(chuàng)下了有史以來第一季度的最高紀錄,而2020全年出貨量達1,290萬臺,比2019年增長8.3%。KVXesmc
很顯然,一些過去需要2至4年時間才能形成的趨勢,現(xiàn)在已經(jīng)被縮短到了幾個月。因此,越來越多的數(shù)據(jù)中心運營商不斷加大對數(shù)據(jù)中心的投資,以應(yīng)對經(jīng)濟領(lǐng)域數(shù)字化轉(zhuǎn)型的快速推進。可以預(yù)見的是,在數(shù)據(jù)中心領(lǐng)域,打造強有力的批量生產(chǎn)與交付的生態(tài)系統(tǒng)和供應(yīng)鏈,幫助用戶加速面市時間,簡化從邊緣到云基礎(chǔ)設(shè)施的部署,將成為芯片廠商未來競爭的焦點。KVXesmc
KVXesmc