最近,IBM透露了其全球首個四核的發(fā)展AI加速器采用7nm MOSFET技術(shù)。IBM開發(fā)的新芯片使用超低精度混合8位浮點算術(shù)單元在訓(xùn)練過程中使用,在推理(即執(zhí)行AI)過程中使用4位。IWmesmc
在典型的計算系統(tǒng)中,增加位寬可以提高計算能力并訪問更多內(nèi)存。但是,AI通常容忍低精度,并且系統(tǒng)的位寬越大,所需的內(nèi)存就越多。因此,人工智能系統(tǒng)的開發(fā)人員經(jīng)常嘗試盡可能地減少位寬,而IBM的新型四核AI加速器將推理精度降低到了4位。IWmesmc
最終的四核AI加速器實現(xiàn)了80%以上的利用率在訓(xùn)練期間(即正在使用多少處理器),以及在推理期間超過60%,明顯優(yōu)于通常低于30%的GPU性能。此外,IBM還集成了獨特的電源管理系統(tǒng),該系統(tǒng)通過在執(zhí)行大量計算任務(wù)時降低時鐘頻率來降低加速器的功耗。IWmesmc
在傳統(tǒng)處理器上運行AI任務(wù)非常耗電,對內(nèi)存的要求很高,并且整體效率極低。然而,事實證明,在受影響的行業(yè)所有領(lǐng)域中,日常應(yīng)用中的AI應(yīng)用都具有不可思議的優(yōu)勢。IWmesmc
盡管固定計算系統(tǒng)可以繼續(xù)負(fù)擔(dān)在高性能CPU和GPU上運行AI算法的費用,但嵌入式世界通常不得不依靠基于云的計算來執(zhí)行AI算法。 這種遠程計算的結(jié)果使人們越來越關(guān)注隱私,對互聯(lián)網(wǎng)基礎(chǔ)架構(gòu)的額外壓力以及請求和響應(yīng)之間的長時間延遲。IWmesmc
諸如IBM開發(fā)的AI加速器,不僅允許嵌入式應(yīng)用程序在本地運行AI,而且能夠高效地運行。此外,在本地運行AI通過將潛在的敏感信息保留在設(shè)備本地來改善對隱私的關(guān)注,并減少延遲。AI加速器的使用還將導(dǎo)致低功率設(shè)備中的實時AI響應(yīng),這是當(dāng)前無法實現(xiàn)的。IWmesmc