美國加州大學(xué)戴維斯分校(University of California-Davis)電機(jī)系學(xué)生設(shè)計出一款號稱1000核心的處理器,其中包含6.21億個晶體管,支持每秒1.78兆次指令的運(yùn)算效能與終極傳輸速率。y8lesmc
這款1000核心的處理器名為“KiloCore”,據(jù)稱是今最節(jié)能的多核心處理器。它在日前于夏威夷檀香山舉辦的“2016 年超大型積體技術(shù)暨電路研討會”(Symposia on VLSI Technology & Circuits)上首度現(xiàn)身。y8lesmc
帶領(lǐng)該芯片架構(gòu)設(shè)計團(tuán)隊(duì)的該校電子與計算機(jī)工程系教授Bevan Baas表示:“據(jù)我們所知,它是世界上第一個1000核心的處理器芯片,具備最高速率的頻率?!?span style="display:none">y8lesmc
根據(jù)Baas研究團(tuán)隊(duì)進(jìn)行的分析指出,雖然業(yè)界持續(xù)開發(fā)出其他多核心處理器芯片,但沒有一款超過300核心。這些高核心數(shù)的處理器芯片中多半都是為了研究用途而開發(fā)的,很少真正能商用化上市。但KiloCore芯片已實(shí)際進(jìn)行制造與執(zhí)行了——它采用了IBM 32-nm PD-SOI CMOS技術(shù)制造。y8lesmc
KilCore的基本架構(gòu)是“多重指令/多重數(shù)據(jù)”(MIMD),每一個七階管線核心都是通用單元,包含72個指令集以及單一指令/周期。研究團(tuán)隊(duì)表示,有別于GPU級芯片不同,KilCore沒有一種指令集基于特定算法。y8lesmc
KilCore在1.1V下支持高達(dá)每秒1.78兆次指令的運(yùn)算效能、1.78GHz的頻率速度:在0.84V與1GHz時的功耗約13.1W,而在0.56V與115MHz時則可達(dá)到5.8 pJ/Op的峰值功率效率。y8lesmc
每個核心均能獨(dú)立供電,而且可以在無須執(zhí)行任務(wù)時斷電以降低漏電。相較于快取的架構(gòu),每一個處理器都能在不同的位置分層中儲存指令與數(shù)據(jù),包括本地內(nèi)存、一或多個鄰近處理器、芯片上獨(dú)立內(nèi)存模塊或外部內(nèi)存等。y8lesmc
每個處理器都經(jīng)由高通量電路交換網(wǎng)絡(luò)、分組交換網(wǎng)絡(luò)(芯片形式)進(jìn)行通信。研究團(tuán)隊(duì)表示,采用像‘蟲洞’(wormhole)的路徑,使其從芯片上的協(xié)同處 理器提供運(yùn)算的能量開銷較低。也就是說,從相鄰或附近核心而來的信息,將可透過‘電路’網(wǎng)絡(luò)路由;而從更遠(yuǎn)的處理器矩陣而來的信息,則透過封包網(wǎng)絡(luò)進(jìn)行傳送。y8lesmc
每個核心都有南北東西向的通信緩沖信道,以及用于主處理器通信的第五信道;在1.1V時的每路由器最大傳輸速率為45.5 Gbps,在1.1V時則可達(dá)9.1 Gbps的每端口傳輸速率。y8lesmc
在0.9V供電電壓下,3.36mW的最大傳輸率為27.1Gbps;而在0.67電壓時,429 μW的最大傳輸速率為8.1 Gbps。y8lesmc
KiloCore的1000核心處理器、1000封包路由器以及12個獨(dú)立的內(nèi)存,都經(jīng)由本地振蕩器進(jìn)行頻率控制,但無需使用PLL或改變頻率,可在1-5個頻率周期內(nèi)暫停以及在不到1頻率周期內(nèi)重新啟動,以降低功枆。該芯片尺寸約8mm2,搭載32排32顆處理器核心(共992顆核心),而剩下的8顆核心以及內(nèi)存則置于最后一排。y8lesmc
采用多核心數(shù)組的一項(xiàng)挑戰(zhàn)就是任務(wù)排程,以及保持所有的核心持續(xù)運(yùn)轉(zhuǎn)。研究團(tuán)隊(duì)打造出一款編程模型與編譯程序,透過多步驟過程進(jìn)行編程來分配所有的處理器任務(wù)。然而,為了利用現(xiàn)有的封裝技術(shù),研究人員在測試時僅用了中央的160顆核心,未來還必須進(jìn)一步測試完整的芯片性能。y8lesmc
高一些核心數(shù)組工作的一個主要挑戰(zhàn)是安排任務(wù),并保持所有內(nèi)核忙碌。該團(tuán)隊(duì)已經(jīng)創(chuàng)建了一個編程模型和編譯程序;他們說,編程是通過多步驟的過程,分配方案的處理器。然而,利用現(xiàn)有的包裝,只有中央160內(nèi)核在測試中被供電的,全芯片的性能數(shù)據(jù)被假定為推斷。y8lesmc
每個處理器核心可以獨(dú)立作業(yè),相較于GPU等處理器所使用的謂“單指令多數(shù)據(jù)”(SIMD)途徑,基本上可說是一種較更活的途徑;其想構(gòu)在于將應(yīng)用劃分成多個小單元,每一個應(yīng)用單元都能在不同的處理器上平行處理,從而以較低能耗實(shí)現(xiàn)高吞吐量。Baas并補(bǔ)充說,KiloCore是最節(jié)能的多核心芯片。y8lesmc
例如,1000核心處理器每秒可執(zhí)行1150億條指令,而功耗僅0.7W,低至足以用一顆AA電池就能供電。相較于目前的筆記本電腦處理器,KiloCore芯片的效能更高100倍,且更具能效。y8lesmc
研究人員已經(jīng)為該芯片開發(fā)出各種應(yīng)用,包括無線編碼/譯碼、處理、加密,以及其他有關(guān)大量平行資料運(yùn)算的應(yīng)用,例如科學(xué)數(shù)據(jù)應(yīng)用以及數(shù)據(jù)中心記錄處理。y8lesmc
y8lesmc