據(jù)Facebook一位高層證實(shí),該公司目前正在招聘晶片工程師,并展開至少一款A(yù)SIC設(shè)計(jì)。在日前于美國加州舉行的Facebook @Scale 2018大會(huì)上,這家社交網(wǎng)路巨擘宣布,預(yù)計(jì)將有五家晶片公司支援其Glow——一款開放來源的深度學(xué)習(xí)編譯器。13Oesmc
Facebook基礎(chǔ)架構(gòu)副總裁Jason Taylor說,F(xiàn)acebook「確實(shí)成立了一支專門與晶片供應(yīng)商合作的晶片團(tuán)隊(duì),同時(shí),我們也在打造自家晶片。不過這當(dāng)然不是我們的首要關(guān)注重點(diǎn)?!顾硎荆@款晶片「并不等同于Google TPU」深度學(xué)習(xí)加速器,但他并未提供與這款晶片有關(guān)的更多細(xì)節(jié)或時(shí)間表。13Oesmc
Facebook的新晶片部門工作重點(diǎn)之一在于與大約50家設(shè)計(jì)人工智慧(AI)加速器的公司合作。Taylor指出,「市場(chǎng)上將出現(xiàn)許多加速器晶片。但最大的問題在于他們針對(duì)的工作負(fù)載是否是當(dāng)前最重要的?!?/font>13Oesmc
在主題演講中,Taylor將Glow描述為一種通用編譯器,讓開發(fā)人員能夠針對(duì)云端或網(wǎng)路邊緣中任何新興深度學(xué)習(xí)加速器進(jìn)行推論任務(wù)。它并不針對(duì)智慧型手機(jī)等客戶端系統(tǒng)。13Oesmc
「我們預(yù)期[推論加速器]市場(chǎng)將會(huì)出現(xiàn)硬體零碎化的情況。我們開發(fā)Glow的目的在于協(xié)助機(jī)器學(xué)習(xí)專家設(shè)計(jì)神經(jīng)網(wǎng)路,而不必面對(duì)調(diào)整『每個(gè)特定晶片』所需的工作?!?/font>13Oesmc
「我們知道硬體零碎化即將發(fā)生,因?yàn)闆]有人知道哪一種[硬體]資源的組合——例如晶片上記憶體區(qū)塊和乘法累加陣列——將會(huì)勝出,因此我們讓開發(fā)人員專注于高層級(jí)的圖形,而無需為硬體規(guī)格手動(dòng)編碼?!?/font>13Oesmc
Facebook基礎(chǔ)架構(gòu)副總裁Jason Taylor形容Glow是一款為云端和邊緣網(wǎng)路進(jìn)行推論的編譯器(來源:Facebook)13Oesmc
Taylor解釋,Glow采用由TensorFlow或Caffe2等架構(gòu)產(chǎn)生的AI圖形,并將其渲染為硬體加速器的位元程式碼。根據(jù)Facebook的一篇部落格文章,該編譯器內(nèi)含幾種工具,包括為晶片特定記憶體配置產(chǎn)生有效程式碼的指令排程器、線性代數(shù)最佳化器與記憶體分配器,以及用于測(cè)試硬體精確度的CPU參考建置。13Oesmc
益華電腦(Cadence)、Esperanto Technologies、英特爾(Intel)、Marvell和高通(Qualcomm)等公司都表示未來的晶片將支援Glow。Taylor則表示希望進(jìn)一步擴(kuò)展支援名單。「這是Glow作為開放來源的優(yōu)點(diǎn)之一?!?/font>13Oesmc
一位資深晶片專家將Glow描述為在生產(chǎn)系統(tǒng)中部署神經(jīng)網(wǎng)路的架構(gòu)。其輸入是在TensorFlow或Caffe2等架構(gòu)中創(chuàng)建的圖形。13Oesmc
幾家既有的晶片制造商已經(jīng)提供了類似的軟體。例如,輝達(dá)(Nvidia)的Tensor RT自架構(gòu)中提取圖形,并為其GPU輸出Cuda程式碼。13Oesmc
傳統(tǒng)上,編譯器針對(duì)特定晶片進(jìn)行嚴(yán)密的最佳化。但是,Taylor說:「近來的編譯器范圍比過去的更加廣泛——Glow中的最佳化必須能辨識(shí)可以渲染到硬體加速器的大部份圖形。」13Oesmc
13Oesmc
轉(zhuǎn)型AI的前兆?13Oesmc
在快速發(fā)展的深度學(xué)習(xí)領(lǐng)域,Glow可說是致力于填補(bǔ)軟體和硬體之間差距的最新例證。例如,Nvidia Tensor RT雖然在一年多前才首次發(fā)布,至今已進(jìn)展到第五個(gè)版本了。但有些加速器新創(chuàng)公司對(duì)于支持各種軟體架構(gòu)及其變化所要求的工作程度也無能為力。13Oesmc
Facebook、微軟(Microsoft)和其他公司則都支援ONNX——一種以權(quán)重表現(xiàn)圖形的標(biāo)準(zhǔn)方法。去年12月,Khronos Group還發(fā)布了用于深度學(xué)習(xí)加速器的硬體抽象層NNEF。13Oesmc
Glow是Pytorch 1.0的一個(gè)組成部份。Pytorch 1.0是一個(gè)開放來源計(jì)劃組合,包括合并的Caffe2和Pytorch架構(gòu)。Pytorch 1.0的第一個(gè)開發(fā)者大會(huì)將于今年10月在舊金山舉行。13Oesmc
Facebook工程經(jīng)理Kim Hazelwood在另一場(chǎng)活動(dòng)中展示Facebook使用的十幾種不同深度學(xué)習(xí)工作負(fù)載,其中至少使用了四種不同類型的神經(jīng)網(wǎng)路。每天,該AI應(yīng)用程式(App)產(chǎn)生超過200兆個(gè)推論,翻譯超過50億個(gè)文本,同時(shí)也自動(dòng)刪除至少100萬個(gè)假帳戶。13Oesmc
她說,F(xiàn)acebook的一些推論任務(wù)需要的運(yùn)算量是其他任務(wù)的100倍。如今,F(xiàn)acebook在其設(shè)計(jì)的一小部份CPU和GPU伺服器上執(zhí)行這些任務(wù)。13Oesmc
Hazelwood在接受《EE Times》訪問時(shí)說,從通用硬體轉(zhuǎn)向客制硬體,必須為那些仍在定義中的工作負(fù)載量身打造晶片。但她拒絕透露Facebook對(duì)于使用任何自定義AI加速器的想法。13Oesmc
在至少十幾種深度學(xué)習(xí)app中,僅Facebook本身就采用了至少5種神經(jīng)網(wǎng)路13Oesmc
一位觀察家推測(cè),Glow可說是一款理想的工具,有助于讓公司采用適合其工作負(fù)載的加速器。Facebook的晶片團(tuán)隊(duì)還能協(xié)助精選晶片,或許還可以為其提出客制化晶片的建議。13Oesmc
此外,F(xiàn)acebook的一篇部落格文章描述它所開發(fā)的一款全新軟體工具,使用深度學(xué)習(xí)來除錯(cuò)程式碼。SapFix可以自動(dòng)產(chǎn)生針對(duì)特定錯(cuò)誤的修復(fù)程式,然后提交給工程師進(jìn)行審核并部署至生產(chǎn)中。13Oesmc
目前,F(xiàn)acebook已經(jīng)使用SapFix,加速為使用Facebook Android App的數(shù)百萬裝置發(fā)送程式碼更新的過程。Facebook表示將發(fā)布該工具的一個(gè)版本,但未具體說明時(shí)間表。13Oesmc
編譯:Susan Hong13Oesmc
(參考原文:Facebook Builds Chip Team, ASIC,by Rick Merritt)13Oesmc