ARM開發(fā)了一種向量指令集(vector instruction),旨在將64位的V8架構(gòu)推進高性能運算應(yīng)用領(lǐng)域;而日本廠商富士通(Fujitsu)采用ARM架構(gòu)所開發(fā)、設(shè)置于日本理研研究所(Riken Institute)的K Computer(原本采用Sparc架構(gòu))后續(xù)版本(Post-K),達到了8 petaflops的運算性能,成為2011年時全球最強的超級計算機系統(tǒng)。oX1esmc
K Computer讓ARM處理器首次進軍超級計算機領(lǐng)域,一個由Intel x86架構(gòu)稱霸的稀有市場;而ARM期望能進一步擴展在這個市場的版圖,慢慢取代如IBM或Cray等由超級計算機廠商自主開發(fā)的處理器。ARM的強項在于其相較于x86架構(gòu)更具省電效益的潛力,此特性對于實際上不太容易為想要打造的超大規(guī)模系統(tǒng)提供大量電力的超級計算機來說頗具幫助。oX1esmc
目前ARM支持的Neon SIMD指令集僅限于128位,鎖定客戶端系統(tǒng)的成像與視訊應(yīng)用;而其可伸縮向量擴充指令集(scalable vector extensions,SVE),支持在128位上128~2048位長度的增量(increment),使用者能寫入一次向量程序代碼,并能無須重新編譯、在任何尺寸的向量設(shè)計上執(zhí)行該程序代碼,而此功能號稱是其他架構(gòu)無法支持的。oX1esmc
SVE是一組新的指令集,鎖定科學(xué)研究任務(wù)而非以數(shù)字信號處理器(DSP)為基礎(chǔ)的多媒體加速應(yīng)用;富士通表示,該公司打算在2020年推出的K Computer后續(xù)版本采用SVE,讓系統(tǒng)性能比前一代提升五十倍、省電效益提升十五倍。oX1esmc
據(jù)了解,SVE是一種負載/儲存(load/store)架構(gòu),采用最多32個向量緩存器(register)以及16個述詞(predicate)暫存器,加上控制緩存器以及一個first-fault緩存器;所謂的述詞緩存器是用來管理關(guān)于控制回路的不同決策,ARM為其未來對SVE的擴展預(yù)留了編程空間。oX1esmc
SVE規(guī)格是由數(shù)個合作伙伴共同開發(fā),預(yù)定明年初公布,ARM才該開始研究將如何為該擴充指令集制作開放源碼Linux修補程序。
ARM展現(xiàn)了SVE上不同向量長度的可伸縮特性,圖中的結(jié)果是根據(jù)以不同向量長度編譯的程序代碼之模擬(來源:ARM)oX1esmc
所有的ARM 64位核心授權(quán)廠商都能取得SVE技術(shù);ARM院士暨主架構(gòu)師Nigel Stephens在近日于美國硅谷舉行的Hot Chips大會上表示,該公司已經(jīng)有多個合作伙伴正在進行開發(fā),但目前不能透露任何公司名稱。oX1esmc
而對富士通來說,K Computer的合作案,提供與開始進軍高性能運算領(lǐng)域的ARM建立更進一步伙伴關(guān)系的機會;負責(zé)開發(fā)K Computer后續(xù)版本處理器、目標是讓該系統(tǒng)在2020年達到exaflop性能等級的富士通主架構(gòu)師Toshio Yoshida 表示,Sparc目前仍是該公司商業(yè)用服務(wù)器偏好的架構(gòu),不過他們也看到一系列采用ARM芯片之技術(shù)與科學(xué)用新系統(tǒng)的商機。oX1esmc
Yoshida 透露,富士通的K Computer后續(xù)版本將采用512位SIMD向量單元,在I/O部分將采用該公司的某個版本Tofu互連以及其他加速器核心;不過他對于該處理器芯片目前鎖定采用哪種先進制程節(jié)點三緘其口。他表示,富士通選擇512位向量長度,是因為那正好是其前一代Sparc架構(gòu)系統(tǒng)256位SIMD的一 倍:“我們想在這個領(lǐng)域把步伐放慢一點?!?br>
SVE占據(jù)28位的編碼區(qū)域,而且只有ARM的64位核心能支持(來源:ARM)oX1esmc
補充:富士通基于新一代芯片研發(fā)的超級計算機預(yù)算1300億日元(折合人民幣86億元,太湖之光的投資是18億人民幣),運算性能是京電腦的100倍,但功耗只有3-4倍,也就是說其性能達到了100億億次級別,是中國太湖之光計算機的10倍多。雙方合作的新一代ARM處理器將使用TSMC的7nm工藝制造,預(yù)計將于2020年面世,不過具體細節(jié)還未知。
oX1esmc