越來越重要的GPU
在傳統(tǒng)GPU市場中,永遠都存在著對更佳視覺用戶體驗的追求,包括更高的顯示分辨率、更新率和更佳的像素效果,所以很多設備都要求采用更佳的GPU。而在部分新興領域,GPU IP的應用同樣不可避免,比如VR/AR的成功就依賴于高質(zhì)量圖形性能,而且必須具備顯示功能。在這樣的領域中,沒有GPU是不行的,所以GPU應用延伸至這些行業(yè)也不足為奇。HPpesmc
但在Imagination業(yè)務開發(fā)高級工程經(jīng)理Rys Sommefeldt看來,更加有趣的話題是GPU在IoT和可穿戴設備等領域中的應用。這些應用雖然也可能具有顯示性能,但其分辨率需求低,CPU就足以實現(xiàn)相應的性能。有些設備甚至可能都沒有顯示功能,比如海量的IoT產(chǎn)品和服務器應用等。HPpesmc
GPU的利用往往取決于以下兩個關鍵因素:功耗以及CPU無法滿足的計算性能需求。Rys Sommefeldt認為,對于具備顯示功能的可穿戴設備(例如智能手表),使用GPU可在滿足性能需求的同時降低設備功耗,從而改善可穿戴設備中最重要的因素—電池壽命;而對于沒有顯示功能的應用來說,使用GPU基本意味著設備有相應的計算需求,而這些需求與GPU架構(gòu)和它的運行方式高度契合。在這些應用場景中,對像素的追求并不是使用GPU的主要目的。HPpesmc
“圖形密集的游戲、動畫和應用已經(jīng)成為消費者移動體驗中的重要部分,視覺互動是他們與所依賴的移動終端之間的主要聯(lián)系界面,而圖形正是該界面的核心?!盦ualcomm產(chǎn)品市場總監(jiān)王宇飛說,這正是為什么一體化設計的驍龍?zhí)幚砥髦邪珹dreno GPU的原因,因為它能加速復雜幾何結(jié)構(gòu)的渲染,從而在低功耗下提供相片級逼真的圖形和豐富的用戶體驗。
Qualcomm 產(chǎn)品市場總監(jiān)王宇飛HPpesmc
集成于驍龍820處理器中的Adreno 530是Qualcomm迄今為止所設計的性能最佳的GPU,可用于智能手機、無人機、機器人等眾多領域。例如,Qualcomm驍龍TM650 IP攝像頭參考設計是一款完整的4K聯(lián)網(wǎng)攝像頭,支持64位異構(gòu)計算,支持包括從以太網(wǎng)到X8 4G LTE的全面廣泛的連接,還支持先進的視頻分析,包括運動與面部檢測、面部識別、物體追蹤和Zeroth目標分類。HPpesmc
在另一個案例中,得益于驍龍800系列集成的Adreno視覺處理、Hexagon數(shù)字信號處理、Spectra計算機視覺和全新的慣性傳感器內(nèi)核,Qualcomm在一款由驍龍820處理器支持的頭戴式顯示器(HMD)上首次展示了六自由度(6DOF)運動追蹤。HPpesmc
ARM多媒體處理部門GPU產(chǎn)品經(jīng)理Espen Oybo對此給出的觀點是,此前,在設備中配置GPU并不認為是必需或是高性價比的,因為CPU本身可以處理一些簡單的圖形任務,而減少芯片體積和降低功耗顯得更加重要。然而,隨著GPU技術的不斷進步,人們發(fā)現(xiàn)GPU不僅能提供更佳的用戶體驗,也能釋放CPU的處理能力,使其更專注于關鍵任務,并顯著的減少了芯片體積、功耗和帶寬消耗。HPpesmc
Mali超低功耗GPU是ARM產(chǎn)品家族中的重要成員,能夠幫助設備在有限功耗條件下,完美的實現(xiàn)性能和功耗平衡,從而在可穿戴和物聯(lián)網(wǎng)市場獲得出色的圖形體驗。而全新推出的Mali-G71高性能GPU則采用新一代Bifrost架構(gòu),適用于AR/VR等需要高性能的領域。HPpesmc
除了圖形處理,GPU要不要嘗試一下通用計算?
Rys Sommefeldt在接受采訪時稱,承擔更多計算任務將是GPU發(fā)展的必然趨勢。相比于主要應用于通用目標計算上的傳統(tǒng)渲染場景,AR/VR帶來了更多整體渲染和視覺處理系統(tǒng)的需求。盡管它仍舊是圖形相關的通用目標計算,但已經(jīng)不屬于傳統(tǒng)光柵化。因此,具備在單一渲染框架中混合GPU和計算負荷的GPU微架構(gòu),來滿足不同水平的需求,這一點非常重要。HPpesmc
應用在PowerVR Wizard GPU中的光線追蹤技術是Imagination的“殺手锏”之一,尤其適合于AR/VR等非傳統(tǒng)應用場景的使用。它可以將渲染完成的圖像根據(jù)人眼效果進行調(diào)整,并將之扭曲提供恰當?shù)妮敵觯赃m應特定的視覺系統(tǒng)—無論是鏡頭還是人眼。相比于在單獨GPU上運行同樣的負載,該技術具備在硬件光線追蹤器上運行扭曲平臺,并與GPU一道形成獨特的優(yōu)勢。
ARM多媒體處理部門GPU產(chǎn)品經(jīng)理Espen OyboHPpesmc
每個產(chǎn)品對GPU的要求都不盡相同,一些只需顯示簡單的用戶界面,而另一些產(chǎn)品則需要支持高端3D游戲的運行。有鑒于此,ARM Mali系列GPU滿足了低功耗可穿戴設備、高端智能手機和要求高性能且獨立的虛擬現(xiàn)實頭盔這三大類產(chǎn)品的不同需求,并通過在核心數(shù)量和配置選項方面的可擴展性,賦予合作伙伴在設計特定產(chǎn)品時實現(xiàn)功耗和效率的平衡。HPpesmc
“AR/VR的復雜性確實對移動SoC組件提出了很高的要求,我們希望通過Brifrost GPU架構(gòu)來滿足這些要求?!盓spen Oybo說盡管目前數(shù)量有限,但ARM已經(jīng)看到一些采用通用圖形處理器(GPGPU)來進行任務處理的案例,這是因為在現(xiàn)有API和硬件條件下實現(xiàn)GPU和CPU之間的數(shù)據(jù)共享較為困難,很難淋漓盡致的發(fā)揮GPU的作用。但隨著OpenCL 2.0的出現(xiàn),在高性能Bifrost架構(gòu)中增加全系統(tǒng)一致性,將便于GPU和CPU通過高效的共享內(nèi)存實現(xiàn)彼此“溝通”,讓GPU和CPU在各種規(guī)模計算任務中的合作更加高效,避免了CPU緩存清理的間接費用。HPpesmc
性能與功耗,兩者必須得兼
上述這些細分領域有些屬于快速變化的高存量市場,有些屬于擁有很大創(chuàng)新空間的新興市場,但它們都依賴于高性能GPU在最低功耗下的性能表現(xiàn)。換句話說,如何在帶給用戶最佳性能體驗的同時更兼顧低功耗特性,正成為各家公司實力比拼的焦點。HPpesmc
根據(jù)多年來提供GPU授權(quán)設計的經(jīng)驗,Rys Sommefeldt說自己認識到很多時候市場所需要的與實際創(chuàng)造出來的產(chǎn)品并不一致?!懊總€人都希望看到一定的改變,即使只是很小的變化,但我們又無法準確預測客戶所期望的目標性能水平、功耗和領域,這就是這個行業(yè)的本質(zhì)。所以,可擴展的、模塊化的可調(diào)節(jié)GPU設計是必須的?!?span style="display:none">HPpesmc
對于GPU來說,最關鍵的可擴展因素永遠是性能,例如浮點數(shù)量和GPU可處理的像素數(shù)量。因此,通過在設計中提供多種水平的性能,用戶就有機會以最少的精力和時間來應對市場中新的配置需求,并使自己得以跳出原本的領域和產(chǎn)品計劃。HPpesmc
Imagination最新推出的塊狀延遲渲染微架構(gòu)是專為在渲染過程中降低工作量而設計的。該架構(gòu)不對隱藏的像素內(nèi)容進行著色內(nèi)容處理,意味著無需耗費電源來運行ALU和獲取寄存器組,從而帶來了功耗方面的大幅降低;也無需提供紋理模型和寫出用于中繼緩沖或最終圖形的像素,極大地節(jié)省了存儲需求。
Imagination業(yè)務開發(fā)高級工程經(jīng)理Rys SommefeldtHPpesmc
“就算是不靠電池供電工作的終端,也需要出于散熱和工業(yè)設計的考慮去盡量減小功耗。” 王宇飛表示,Adreno GPU的關注點一直是要提供每一份能量(每毫瓦)的絕對最佳性能,這也是所有移動市場細分領域的根本推動力。最新的Adreno 5xx GPU既支持Khronos最新圖形API Vulkan,能在CPU低消耗狀況下實現(xiàn)高級圖形內(nèi)容,也支持最新計算API OpenCL 2.0 FP的所有特性,以應對各種GPGPU應用。HPpesmc
幫助合作伙伴在功耗和效能間取得適宜其產(chǎn)品的最佳平衡,對于ARM而言是至關重要的。最初設計時,Mali-400是首款配置Mali-200 GPU的多核GPU,市場的反饋很快證明了這個策略是正確的。在隨后的設計中,基于高端Midgard架構(gòu)的GPU,諸如Mali-T880,可以從單核拓展至16核,而全新的Mali-G71基于Bifrost架構(gòu),更能夠支持32核。HPpesmc
當今最高端的智能手機已經(jīng)實現(xiàn)了12個內(nèi)核的配置,用以支持AR/VR等新興應用,它們的嚴苛要求正在不斷推動電源功耗突破極限。所以Espen Oybo認為,額外的可用核是非常有必要的,它不僅能輕松的支持高端應用,同時也為其應對日益增加的內(nèi)容復雜性預留了空間。除了數(shù)量外,內(nèi)核在配置方面還有很多靈活空間,如何在這一過程中實現(xiàn)功率、性能和效能的平衡,從而能夠提供另一個層面的可定制選項,幫助用戶根據(jù)自己的市場需求進行自由調(diào)整,也是非常關鍵的要素。HPpesmc
設計增值,才能活下去
GPU IP屬于設計復雜,離開生態(tài)系統(tǒng)就無法生存的IP類型,所有受訪者也均對此表示認可。王宇飛說,Qualcomm的主要目標之一就是為移動開發(fā)者提供盡可能多的價值。通過與生態(tài)系統(tǒng)中的合作伙伴密切合作,以保證中間件引擎是高效的,且針對Adreno實現(xiàn)優(yōu)化。高通還為開發(fā)者們開發(fā)資源,縮短他們在Adreno GPU上的開發(fā)時間:既有像驍龍Profiler這樣特性豐富的工具,在開發(fā)周期的所有方面提供幫助;也有SDK來幫助開發(fā)者獲得先進的技術,驍龍VR SDK就是一個例子,能讓開發(fā)者們利用它開發(fā)HMD和面向?qū)S肏MD的內(nèi)容。HPpesmc
近年來,Imagination在為客戶提供硬件、軟件和市場方面的產(chǎn)品支持上也取得了巨大的成就。包括提供專門的硬件設計團隊與客戶、晶圓代工長溝通合作,以確保實現(xiàn)最佳的片上性能;戰(zhàn)略軟件團隊與客戶和開發(fā)者共同創(chuàng)建可為PowerVR提供明確策略優(yōu)勢的軟件產(chǎn)品;細分市場營銷專家充分理解客戶的目標應用細節(jié),展示PowerVR在相應領域的巨大價值等。HPpesmc
ARM是一家依托龐大生態(tài)系統(tǒng)生存的公司,這一特點無論對于GPU還是CPU來說都至關重要。一方面,ARM與EDA合作伙伴和代工廠緊密協(xié)作,幫助芯片伙伴便捷的實施GPU。另一方面,通過軟件生態(tài)系統(tǒng)為程序員提供最好的Mali體驗?!罢蛭覀儞碛腥绱她嫶蟮纳鷳B(tài)系統(tǒng)(包括實施和軟件),ARM的合作伙伴們能在眾多生態(tài)系統(tǒng)所提供的不同選擇中自由選取,從而實現(xiàn)他們產(chǎn)品的差異化?!盓spen Oybo說。HPpesmc
HPpesmc