似乎在去年底、今年初,以ChatGPT為代表的生成式AI技術(shù)爆發(fā)以后,端側(cè)市場的各路參與者都在想辦法借生成式AI的東風(fēng),比如說PC領(lǐng)域內(nèi)的芯片企業(yè)、OEM廠商都在談輕薄本能跑生成式AI;就連嵌入式市場做SoC/MPU芯片的企業(yè)也在談生成式AI...
最近聯(lián)發(fā)科發(fā)布的天璣9300芯片,在宣傳上叫“天璣9300旗艦5G生成式AI移動芯片”——這個詞條剖析一下,5G是天璣9000系列的標配了,不用多談;“旗艦”和“生成式AI”在我們看來特別對應(yīng)于(1)全大核CPU架構(gòu)設(shè)計,(2)能跑生成式AI。Yqqesmc
Yqqesmc
這兩點之所以引人驚嘆,一方面在Android手機已經(jīng)持續(xù)了多年的CPU大小核或大中小核設(shè)計,Arm的Cortex-A7、A53、A55都是相當經(jīng)典的小核心設(shè)計,也是被市場驗證了有效性的方案,而現(xiàn)在去掉小核,對一向沿襲Arm IP的聯(lián)發(fā)科而言是個突破;Yqqesmc
另一方面,端側(cè)跑生成式AI這件事本身并不稀奇——真正讓人感覺到驚訝的是,聯(lián)發(fā)科表示自家的天璣9300跑70億、130億,甚至330億參數(shù)規(guī)模LLM不在話下。這對追求低功耗的手機芯片而言,的確是很驚艷的成績,也讓生成式AI在本地推理真正有了價值。Yqqesmc
我們主要從這兩個方面,來詳細看看這次的天璣9300。Yqqesmc
首先照例還是先匯總一下這顆總共堆了227億晶體管的天璣9300的配置情況,并對照上一代天璣9200。Yqqesmc
Yqqesmc
在我們看來這其中有幾個亮點。其一當然是去掉小核心集群的CPU,雖然仍然是8核,但是4個Cortex-X4超大核加4個Cortex-A720大核。聯(lián)發(fā)科給的數(shù)據(jù)是,相比天璣9200的多核峰值性能提升40%,但在達到天璣9200的峰值性能時功耗降低33%;Yqqesmc
PPT中更是直接展示了Geekbench 6的多核得分在7500-8000之間,領(lǐng)先于“A公司A系列芯片”和“Q公司23年旗艦芯片”——查一下Geekbench 6的數(shù)據(jù)庫就知道,這倆說的是蘋果A17 Pro和高通驍龍8 Gen 3。Yqqesmc
Yqqesmc
雖說這張圖的比例尺是以6500分為起點的,柱狀條的領(lǐng)先幅度看起來夸張了一點,但的確做到了CPU多核性能的全面領(lǐng)先的。Yqqesmc
其二是AI加速單元APU 790能跑生成式AI——無論是發(fā)布會還是面向媒體的pre-briefing,這次聯(lián)發(fā)科在APU花的篇幅那還真是相當大——APU算是第一次在聯(lián)發(fā)科發(fā)布會上這么有排面,甚至是放在GPU前面去談的,后文也會對此做詳述。Yqqesmc
其紙面數(shù)據(jù)主要包括“8倍速生成式AI Transformer算子加速”,“混合精度INT4量化技術(shù)”“NeuroPilot Compression內(nèi)存硬件壓縮技術(shù)”,2倍整數(shù)性能、2倍浮點性能提升,以及45%功耗降低。聯(lián)發(fā)科在發(fā)布會上公布的ETHZ AI Benchmark v5.1跑分是2109分。不過媒體溝通會上,聯(lián)發(fā)科也強調(diào)如果加上內(nèi)存測試成績,系統(tǒng)性能得分會再高出1000+分。畢竟跑大模型本身就非??简灤鎯π阅堋?span style="display:none">Yqqesmc
Yqqesmc
所以實際上,內(nèi)存方面LPDDR5T-9600MT的支持也算是個亮點。LPDDR5T的“T”最早是今年1月SK海力士宣布旗下的LPDDR5新品帶寬達到9.6Gbps,相比LPDDR5X高出13%,所以命名為LPDDR5 Turbo,供電電壓在1.01-1.12V范圍內(nèi)。三星和美光應(yīng)該也有類似產(chǎn)品。Yqqesmc
前不久國外媒體報道稱,美光LPDDR5X-9600和SK海力士LPDDR5T-9600均驗證兼容驍龍8 Gen 3。但在這次天璣9300的媒體溝通會上,聯(lián)發(fā)科方面表示:“9600這個規(guī)模,在我們的芯片平臺會是全球第一個落地,真正商用的,最終消費者能拿得到的。”并談到“友商”在設(shè)計上實際并未落地,今年內(nèi)應(yīng)該也不會出現(xiàn)LPDDR5T-9600的終端產(chǎn)品。Yqqesmc
對于LPDDR5T-9600的支持,可能也和生成式AI在這代芯片上的應(yīng)用有關(guān)。因為我們知道,AI大模型對RAM帶寬、容量都會有較高的需求。Yqqesmc
配置表里的另一個亮點在GPU方面Immortalis-G720 MC12的升級。聯(lián)發(fā)科方面表示,這顆GPU的峰值性能相比天璣9200的Immortalis-G715 MC11提升了46%,達到后者峰值性能時功耗降低40%;而且搬出了相比驍龍8 Gen 3、A17 Pro的兩項GFXBench圖形測試:Yqqesmc
Yqqesmc
Yqqesmc
我們知道,蘋果已經(jīng)在GPU上擠了兩年牙膏,而高通驍龍8 Gen 3的GPU性能升級幅度今年已經(jīng)算是相當大的,但沒想到Immortalis現(xiàn)在能這么爭氣。這里多提一句,注意上圖中的兩個測試,Aztec Ruins測試在幾何復(fù)雜度上會遜于Manhattan,但shader負載高出不少?;蚩勺鳛镮mmortalis和Adreno在性能側(cè)重點上的差異比較依據(jù)之一。Yqqesmc
另外這次天璣9300的GPU光追性能提升了46%,VRS性能提升86%——有關(guān)光追支持及天璣圖形生態(tài)部分,也會在后文提及更多。Yqqesmc
天璣9300芯片的其他亮點,還包括ISP升級到Imagiq 990,聯(lián)發(fā)科特別提到AI語義分割視頻引擎實現(xiàn)了“16層圖像語義分割”,相比其他芯片多了幾層;以及“全像素對焦”,“2倍無損變焦”,“OIS光學(xué)防抖專核”,并支持“3麥克風(fēng)高動態(tài)錄音降噪”。顯示引擎、連接等相關(guān)的技術(shù)升級,這里就不多談了,其實Wi-Fi 7增強Mtra Range 2.0、雙路藍牙閃連技術(shù)等也都算得上亮點。Yqqesmc
今年Arm在新品發(fā)布會上談TCS23方案時,推薦的手機AP SoC,CPU大中小核搭配方式包括了1+3+4,1+5+2,另外就是面向筆記本有10+4+0的新方案。高通顯然是選了1+5+2的方案的,也就是1個Cortex-X4超大核,5個Cortex-A720(額外基于頻率分了兩組)大核,以及2個Cortex-A520小核。Yqqesmc
Yqqesmc
聯(lián)發(fā)科一個也沒選,而上了4+4+0的方案——倒更像是筆記本方案的下放。其實在去年聯(lián)發(fā)科在PC平臺SoC芯片方面的投入。此前聯(lián)發(fā)科也有面向Chromebook的Kompanio 1380芯片。而在今年5月,聯(lián)發(fā)科正與英偉達合作,面向筆記本開發(fā)Windows on Arm平臺產(chǎn)品。Yqqesmc
如果此消息可靠,算時間聯(lián)發(fā)科在PC芯片上的成果應(yīng)該是能夠惠及手機平臺的(雖然一般我們應(yīng)該反過來說)。這么看,是否感覺天璣9300在CPU部分的4+4+0方案合理了很多?(尤其搭配LPDDR5T落地,是不是更像那么回事了?)Yqqesmc
一般我們說移動平臺“小核心”的存在價值是為了省電——主要是低負載區(qū)間內(nèi)保持相比于大核心,更低的功耗和更高的能效;并且以更小的面積換取盡可能高的性能收益。Arm的小核心到現(xiàn)在為止都還是順序架構(gòu),為的就是維系輕量、小尺寸、低功耗。Yqqesmc
但實際上,歷史上移動平臺沒有采用“小核心”的先例早就存在。比如說高通早年的CPU自研架構(gòu),至少到驍龍820的Kryo時期,都還在堅持同構(gòu)核心,而不存在什么小核心——也沒有在續(xù)航方面打多少折扣。而且我們在也探討過,驍龍820的末代自研Kryo架構(gòu)更多的是生不逢時。Yqqesmc
還有個絕佳的例子,雖然我們一直說蘋果A系列芯片的CPU是“大小核”異構(gòu),但其實人家的“小核心”不僅歷史上全程保持著亂序(OoO)設(shè)計,而且規(guī)模還真是一點都不“小”。比如A15的“小核”性能就超過Cortex-A76,甚至和低頻點的Cortex-A78差不多。Yqqesmc
Yqqesmc
全大核帶來最顯而易見的價值,當然就是多線程性能的顯著提升。所以不出意外的,聯(lián)發(fā)科宣布天璣9300相較9200,多核峰值性能提升40%,也領(lǐng)先于蘋果和高通今年的競品。還有包括實驗室環(huán)境下安兔兔跑分超過220萬,都算是宣傳佐料。Yqqesmc
堆核戰(zhàn)術(shù)的另一個價值是多任務(wù)性能:媒體會上,聯(lián)發(fā)科就提到在《原神》游戲極高畫質(zhì)達成60fps幀率的同時,還能進行微信視頻通話。這在傳統(tǒng)架構(gòu)上是很難實現(xiàn)的。Yqqesmc
其實這波性能發(fā)揮的關(guān)鍵,反倒應(yīng)該考慮,手機這種小尺寸設(shè)備的系統(tǒng)設(shè)計是否能全力發(fā)揮出天璣9300的全部性能,尤其是4個Cortex-X4大核。這是未來很值得關(guān)注的問題。從聯(lián)發(fā)科宣布GB6的性能成績,以一個區(qū)間性能來做對比,可見天璣9300可能會比較考驗OEM廠商的系統(tǒng)設(shè)計能力。Yqqesmc
那么接下來的問題就是,去掉了小核,續(xù)航和能效還能不能保證?聯(lián)發(fā)科在發(fā)布會上給出的解釋和邏輯是,“大核做事快,休息快,低功耗”。這個邏輯當然沒有問題,也是我們過去經(jīng)常說的,很多時候不怕功耗高,只要匹配足夠強的性能,其實能讓任務(wù)更快速地完成——蘋果以往就是這么做的。Yqqesmc
我們說的“功耗”一般是指單位時間內(nèi)消耗的能量(單位瓦特),而不是完成一件工作消耗了多少能量(單位焦耳)。手機續(xù)航考驗的實際是所有工作消耗能量的總和;只要不總是處在高功耗狀態(tài),“越快做完越省電”。Yqqesmc
憑借架構(gòu)更新與工藝改良,及在高負載區(qū)間段的高效表現(xiàn),天璣9300的功耗也有對應(yīng)的降低。聯(lián)發(fā)科提到達成天璣9200峰值性能時,天璣9300這邊的功耗降低了33%——這是完全符合直覺的,因為更多的大核,在高負載區(qū)間段本身就有更高的效率。Yqqesmc
Yqqesmc
于是也就有了上圖各類使用場景下,天璣9300的功耗降低。但其實這仍然不能解釋,低負載區(qū)間段如何做到低功耗。Arm做這類3-cluster的設(shè)計,就是要在不同負載區(qū)間內(nèi),以不同的核心來解決問題——因為每個核心只在特定性能區(qū)間內(nèi)才達到最高效率,如下圖性能與功耗的關(guān)系。Yqqesmc
Yqqesmc
Cortex-A520這種小核就是在低負載區(qū)間,達成相比A720和X4更低的功耗。這是Arm設(shè)計此類架構(gòu)的初衷。上面我們談到的功耗降低,都很難說是低負載區(qū)間。所以天璣9300的4+4+0方案,在手機待機及低負載時,如何保證高效呢?Yqqesmc
先談一下我們的猜想。第一是從Cortex-A510開始,Arm的小核設(shè)計似乎就進入了某個瓶頸期。A510相比更早A55的效率提升真是一點都不大,性能提升基本是以功耗為代價;而且我們認為其面積效益不夠理想。A520對效率問題著重做了改良,包括提升分支預(yù)測和數(shù)據(jù)預(yù)取性能,重構(gòu)了存儲子系統(tǒng),去掉了原本的一些性能加強——比如去掉了一條ALU管線。但我們認為現(xiàn)在Arm的小核已經(jīng)不復(fù)當年的經(jīng)典。Yqqesmc
其次可能和制造工藝有關(guān)。聯(lián)發(fā)科在媒體會上說:“這幾年我們在做架構(gòu)設(shè)計時,一個比較大的觀念轉(zhuǎn)變就是不見得小核就比較省電。”“越往先進制程去,晶體管越小——太小鎖不住漏電電流。”“則小核的功耗相比大核未必就會更好。越往后面這個問題會越嚴重。”“越快把系統(tǒng)關(guān)掉,其實比較省電。”Yqqesmc
還有一種可能性,是隨著移動生態(tài)的發(fā)展,操作系統(tǒng)與應(yīng)用設(shè)計的耗電模型已經(jīng)和幾年前大不一樣?,F(xiàn)在芯片的內(nèi)卷程度,已經(jīng)到了芯片設(shè)計企業(yè)普遍會去關(guān)心上層細分應(yīng)用場景。聯(lián)發(fā)科可能在這方面做了更多的工作。Yqqesmc
“以軍隊來講,你要料敵精準,知道哪個敵人要先干掉,然后快速殲敵。”聯(lián)發(fā)科方面談到,“我們能夠做到的事情是,把關(guān)鍵的一些程序定義出來,快速將其解決掉,接下來軍隊就能回去休息了。”據(jù)說其中也涉及到不少與其生態(tài)系統(tǒng)合作伙伴的合作、調(diào)優(yōu)。Yqqesmc
“未來我們會做的事情是,在省電的時候能睡得更沉。”“我們花了3年時間去做這件事。除了硬件設(shè)計之外,軟件、系統(tǒng)設(shè)計怎么去找到關(guān)鍵場景做優(yōu)化,將應(yīng)用聚集在一起,快速將其執(zhí)行完畢,快速深層地睡下去。”“這不是個簡單的事情,必須從端到端,從硬件到軟件到系統(tǒng)全部串在一起。”Yqqesmc
“系統(tǒng)背景有很多小小的程序,那些程序跳出來的時候,CPU就會被喚醒——那就一定會有功耗產(chǎn)生——我們要做的是,把系統(tǒng)里面小小的波動,要么把它結(jié)合起來,要么拿到旁邊,可能用別的硬件或者SCP(system control processor)的方法去做。這就涉及到更細節(jié)的如何進一步節(jié)省功耗的問題了。這個技術(shù)持續(xù)地在做提升,我們會一路這樣做下去。”Yqqesmc
雖然我們對于聯(lián)發(fā)科具體是如何在極低負載區(qū)間段確保能效的,仍然不甚明朗,但這段話大約可以表明,聯(lián)發(fā)科應(yīng)該有在其他方面做技術(shù)補充。最后,聯(lián)發(fā)科還多次強調(diào)“我們相信全大核架構(gòu),明年開始大家都會往這個方向去走”“未來是全大核的世代”。Yqqesmc
天璣9300更新的另一個重點無疑就是APU 790了。從聯(lián)發(fā)科的示意框圖來看,APU 790新增了“生成式AI引擎”,很容易讓人聯(lián)想到英偉達在這代Hopper架構(gòu)中特別加入的Transformer引擎。這是順應(yīng)AI時代潮流的做法,相當于在加速器中又加了個更專用的加速器。Yqqesmc
媒體溝通會上,聯(lián)發(fā)科談到APU 790“深度適配Transformer模型”,尤其“優(yōu)化Softmax + LayerNorm算子,處理速度是上一代的8倍”。因為對Transformer而言,Softmax+LayerNorm占到了其中的大頭。Yqqesmc
Yqqesmc
現(xiàn)在我們常說的Transformer結(jié)構(gòu)采用所謂的self-attention(自注意力)機制,捕捉全局相關(guān)性、在一個隊列內(nèi)不同element的關(guān)系。Softmax函數(shù)就用于幫助決策attention的量或者一句話里每個詞的重要性。而LayerNorm用于在一個層級上,跨神經(jīng)元進行數(shù)值的nomalization。Yqqesmc
以前行業(yè)普遍認為Transformer的結(jié)構(gòu)特性更適用于NLP(自然語言處理);而CNN(卷積神經(jīng)網(wǎng)絡(luò))的卷積特性,決定了其擅長圖像分類、對象識別之類的視覺型工作。所以很顯然LLM大語言模型就以Transformer結(jié)構(gòu)為基礎(chǔ)。Yqqesmc
2021年Google Research團隊發(fā)了個paper,他們提出一種解決方案,把一張圖像切割成小片,每一片作為一個單字、token,則Transformer就能處理圖像相關(guān)工作了。Vision Transformer一時也變得很熱。像Stable Diffusion這類所謂“多模態(tài)模型”多少也都有Transformer結(jié)構(gòu)的影子。這應(yīng)該也是APU 790強調(diào)“生成式AI引擎”的基礎(chǔ)。Yqqesmc
好像過去我們說LLM、Transformer、生成式AI這些關(guān)鍵詞,都會和數(shù)據(jù)中心集群這種大家伙,或者至少也是TDP數(shù)百瓦的旗艦級桌面顯卡關(guān)聯(lián)起來。不過這幾個月,端側(cè)跑生成式AI的宣傳越來越多。不管是手機還是PC,這類端側(cè)設(shè)備所謂的“跑AI”或者“運行AI”,一般是指AI推理(inference)。Yqqesmc
正兒八經(jīng)、商用的大模型training還是要放到服務(wù)器集群上去跑的——可以理解為打造一個模型的過程。模型打造好了,就要拿來用了——也就是推理的過程。推理有時也需要大算力,比如ChatGPT的AI推理就是在服務(wù)器集群上進行的。Yqqesmc
但小模型的推理其實并不需要太高的算力,就連IoT嵌入式設(shè)備很多也強調(diào)AI推理特性,這也叫跑AI。天璣9300跑生成式AI指的就是對一定規(guī)模的生成式AI模型做推理——這些模型的規(guī)模雖然不會大到ChatGPT的程度,但也有一定的量級。Yqqesmc
比如聯(lián)發(fā)科在這次的宣傳中提到,天璣9300能跑70億參數(shù)的AI大語言模型,20 tokens/秒的生成速度;而且“成功在端側(cè)運行130億參數(shù)AI大語言模型”;并達成“首款移動芯片成功運行330億參數(shù)AI大語言模型”。Yqqesmc
其實對后兩個規(guī)模的LLM宣傳,我們并不清楚其運行環(huán)境與確切的實用性如何——330億這個值應(yīng)該是為了對標驍龍8 Gen 3的100億參數(shù)規(guī)模支持能力而提的。Yqqesmc
但70億參數(shù)LLM的20 tokens/秒仍然是具備了實用性的——而且聯(lián)發(fā)科也提及與vivo合作實現(xiàn)了70億參數(shù)LLM的端側(cè)落地。可能很多同學(xué)對參數(shù)規(guī)模沒什么概念,此前,在不用加速器的情況下能跑60億參數(shù)的ChatGLM2、130億參數(shù)的Llama 2、155億參數(shù)的StarCoder——不過要注意,這是純粹靠CPU跑出來的。在此可作為量級參考。Yqqesmc
另外聯(lián)發(fā)科表示天璣9300實現(xiàn)Stable Diffusion“高速生成式AI圖像生成”<1秒——這個表達有些模糊,因為Stable Diffusion文生圖涉及到迭代次數(shù)、圖像分辨率等各種問題。Yqqesmc
但總的來說,要實現(xiàn)上述量級的模型在手機芯片上跑起來,光靠APU的Transformer模型算子加速其實也還不夠。除了在我們看來,全大核CPU以及高頻LPDDR5T內(nèi)存也能幫上忙,聯(lián)發(fā)科還做了其他相關(guān)技術(shù)的補充。Yqqesmc
Yqqesmc
其一是內(nèi)存硬件壓縮技術(shù)NeuroPilot Compression??闪炕臄?shù)據(jù)是LLM 130億參數(shù)大模型原本需求13GB內(nèi)存,則在加上Android操作系統(tǒng)及其他app保活的內(nèi)存需求以后,現(xiàn)在旗艦手機的16GB內(nèi)存也不夠用。所以NeuroPilot Compression能夠在量化、壓縮以后,將其壓縮至5GB。Yqqesmc
其二在開發(fā)生態(tài)和工具鏈上,聯(lián)發(fā)科應(yīng)當也是需要做不少相關(guān)工作的,包括模型量化、優(yōu)化與轉(zhuǎn)換,最終簡化、降低端側(cè)本地推理的性能需求。這其中包括模型方面的合作,這次列舉模型相關(guān)的合作包括Android AI foundational model,百度文心一言、百川大模型,以及Llama 2,“針對主流大語言模型做深度適配與優(yōu)化”。具體應(yīng)當包含了這些模型在端側(cè)的部署。Yqqesmc
另外值得一提的是聯(lián)發(fā)科提到“生成式AI端側(cè)‘技能擴充’”,“在大模型的基礎(chǔ)上,讓端側(cè)的AI學(xué)會更多的技能”——NeuroPilot Fusion技能擴充技術(shù),讓天璣9300成為“首款支持生成式AI在端側(cè)LoRA融合”的芯片,“基于一個大模型,通過云端的訓(xùn)練,在端側(cè)完成N個功能的融合,賦予大模型更全面的能力。”LoRA(Low-Rank Adaptation)一般用在我們常說的模型fine-tuning上,特點是可減少參數(shù)量。這里所說“端側(cè)LoRA融合”的邏輯和流程,我們暫時不是很明晰——從介紹來看,LoRA融合是NeuroPilot開發(fā)工具鏈的一部分。Yqqesmc
這部分的最后還是要談一談應(yīng)用。畢竟高喊生成式AI,最終要落地到手機的應(yīng)用上。聯(lián)發(fā)科現(xiàn)場演示了用天璣9300芯片的手機按照輸入的要求生成詩句,生成圖片和斗圖表情包(叫text-to-meme),以及輸入個人照片來生成個人專屬風(fēng)格gif表情包。Yqqesmc
另外有個更實用的應(yīng)用,是與vivo合作打造的AI助理,以對話形式完成工作:比如說語義搜索、畫圖、文案生成、照片修圖、查資料、生成思維導(dǎo)圖、一鍵識屏安排日程等等。Yqqesmc
Yqqesmc
聯(lián)發(fā)科自己列舉的生成式AI應(yīng)用還包括圖片的生成式超分(與虹軟的合作)、視頻通話基于真實人像的3D形象實時生成(與morpho的合作)、夜景照片防眩光(與TETRAS.AI的合作)等等......端側(cè)生成式AI前期的生態(tài)理論上又會是相對割裂的,這一時期也是芯片企業(yè)需要抓住的時機。聯(lián)發(fā)科在發(fā)布會上展示的生態(tài)合作伙伴除了前面列舉的這些,還包括快手、剪映、美圖秀秀、虎牙直播、抖音、愛奇藝、QQ音樂等。Yqqesmc
未來手機上的生成式AI技術(shù)成果,大概是能在這些應(yīng)用中逐漸看得到的。真正的殺手級應(yīng)用,還真得看應(yīng)用層的這些參與者的點子了——聯(lián)發(fā)科提供的是硬件基礎(chǔ)和開發(fā)平臺。手機用戶們可以期待一下。Yqqesmc
天璣9300發(fā)布會第一次讓我們感覺到,聯(lián)發(fā)科的產(chǎn)品與技術(shù)點講解根本來不及,因為似乎亮點有些過多了。光是CPU和APU的介紹就花了40+分鐘。這就讓GPU、ISP之類同樣值得著墨的部分,只能相對簡略地去談。這在聯(lián)發(fā)科的手機AP SoC發(fā)布會歷史上應(yīng)該是從沒有過的。Yqqesmc
比如從去年9月起,聯(lián)發(fā)科就相繼與Discovery合作攝制紀錄片節(jié)目,還舉辦了影展,就讓ISP介紹顯得更有厚度。但顯然在這場發(fā)布會上,ISP的風(fēng)頭就徹底被APU蓋過了。有關(guān)ISP、顯示引擎、無線通信支持,雙安全芯片,以及聯(lián)發(fā)科常規(guī)項目的低功耗配套技術(shù),受限于篇幅也不再贅述。Yqqesmc
這里我們最后來聊一聊GPU和聯(lián)發(fā)科的圖形生態(tài),畢竟關(guān)注天璣芯片的手游用戶也相當多。前文已經(jīng)大致提到了這次聯(lián)發(fā)科給天璣9300選配的是12核Immortalis-G720,峰值性能相較天璣9200提升46%,達到天璣9200最高性能的情況下,功耗低了40%。綜合圖形性能也強于A17 Pro與驍龍8 Gen 3——這應(yīng)該是聯(lián)發(fā)科,也是Arm第一次在絕對性能上全面超越了另外兩名勁敵。Yqqesmc
這個數(shù)字比我們預(yù)期得要好,因為Arm發(fā)布Immortalis-G720時,提到的是平均15%的持續(xù)與峰值性能提升。Immortalis-G720在設(shè)計上實際更強調(diào)的是系統(tǒng)級能效提升,尤其是更低的內(nèi)存帶寬占用——這代架構(gòu)的DVS(Deferred Vertex Shading)顯著降低了帶寬需求及游戲中的DRAM功耗占比,平均功耗降低20%。而天璣9300的GPU性能提升,很大程度應(yīng)該來自于新增的一個核心。Yqqesmc
Yqqesmc
其余數(shù)值基本與Arm的宣傳相符,包括帶寬需求降低、VRS性能提升、MSAA優(yōu)化等。系統(tǒng)性能數(shù)據(jù),聯(lián)發(fā)科在發(fā)布會上提到即便是《原神》極高畫質(zhì)下的須彌地圖,天璣9300也能在30分鐘內(nèi)跑滿60fps;以及840p分辨率極高畫質(zhì)下《星穹鐵道》能夠滿幀運行30分鐘。后者是個明顯更偏GPU性能發(fā)揮的游戲。若非風(fēng)頭被APU搶走,天璣9300的GPU絕對是值得大書特書的。Yqqesmc
有關(guān)光追,PPT中提到硬件光線追蹤性能提升46%。Immortalis在核心架構(gòu)層面決定了,更多的shader核心就能帶來更高的光追性能。Yqqesmc
天璣9200的光追性能在Basemark InVitro測試中目前排在了第一(機型大概是即將發(fā)布的vivo X100)——Arm此前也在發(fā)布會上特別強調(diào)了Basemark InVitro的領(lǐng)先。聯(lián)發(fā)科認為,Basemark InVitro是“比較貼近復(fù)雜的光追場景”,光追在場景中所占比重較大,可以反映實際光追性能。Yqqesmc
從已知測試來看,A17 Pro在3DMark Solar Bay光追測試里有著相比天璣9200更好的性能發(fā)揮?;?6%的提升值,天璣9300在這項測試里應(yīng)當也能拔得頭籌。不同測試中的排位差異,可能仍與光追測試是否僅考察光追反射,光柵化在場景中參與度,或是否同時包含更復(fù)雜光追測試等狀況相關(guān)。Yqqesmc
可能更多用戶就手機游戲光追,更關(guān)注的還是游戲支持和生態(tài)發(fā)展情況。就生態(tài)相關(guān)問題,聯(lián)發(fā)科宣布天璣9300“首發(fā)支持《暗區(qū)突圍》 60fps光追”,另外《仙劍世界》光追版也準備在天璣平臺首發(fā)。聯(lián)發(fā)科表示,加入到天璣光追生態(tài)的游戲已經(jīng)有50+款,而且生態(tài)做到了Unity, Unreal, Messiah三大引擎的全覆蓋。這在手機行業(yè)里暫時應(yīng)該也是獨一家。光追終于有用了。Yqqesmc
Yqqesmc
圖形生態(tài)相關(guān)的另一個亮點在于全局光照生態(tài)支持,和虛幻引擎、Arm合作,在Unreal 5 Lumen中融入了Vulkan Ray Query+“桌面級渲染Shader Model 5”。具體到與騰訊游戲合作,在《暗區(qū)突圍》游戲中應(yīng)用全局光照Smart GI技術(shù)。這類技術(shù)的普及應(yīng)該是手游玩家都期望看到的。Yqqesmc
此外,圖形技術(shù)相關(guān)更新還包括MAGT游戲自適應(yīng)調(diào)控技術(shù)升級為“星速引擎”。據(jù)說在應(yīng)用星速引擎以后,《王者榮耀》實現(xiàn)了15%的功耗降低,載入對局速度提升了30%。從這些數(shù)據(jù)還是能夠看到聯(lián)發(fā)科的圖形生態(tài),正在深入影響國內(nèi)的手游行業(yè)的。Yqqesmc
Yqqesmc
天璣9300的確從各個維度帶來了驚喜。不過最讓我們驚喜的仍然是生成式AI在其中的強化。在媒體采訪中,聯(lián)發(fā)科對于手機應(yīng)用生成式AI有個暢想:“手機是隨身攜帶的,它知道你的個性化需求,你的位置在哪兒。在回答你的問題時,可以將全部資訊包含在內(nèi),做到個性化的回答,是你真正需要的。”Yqqesmc
“生成式AI的手機是充滿想象力的。輸入是多樣性的、復(fù)合的,語音、文字、手勢等等。”“旗艦機一路走來,大家應(yīng)該慢慢將它從跑分中脫離出來了。”“生成式AI手機能生成什么、創(chuàng)造什么,這才是更基本的。”Yqqesmc
11月13日,vivo X100將首發(fā)天璣9300芯片。這可能會是生成式AI手機翻開的新篇章。Yqqesmc
微信掃一掃,一鍵轉(zhuǎn)發(fā)
關(guān)注“國際電子商情” 微信公眾號
在各大半導(dǎo)體廠商搶攻AI商機之際,芯片產(chǎn)能卻趕不上需求。
TrendForce集邦咨詢預(yù)估AI服務(wù)器第2季出貨量將季增近20%,全年出貨量上修至167萬臺,年增率達41.5%。
根據(jù)TrendForce集邦咨詢最新存儲器產(chǎn)業(yè)分析報告,受惠于位元需求成長、供需結(jié)構(gòu)改善拉升價格,加上HBM(高帶寬內(nèi)
根據(jù)TrendForce集邦咨詢最新存儲器產(chǎn)業(yè)分析報告,受惠于位元需求成長、供需結(jié)構(gòu)改善拉升價格,加上HBM(高帶寬內(nèi)
近日,中國科學(xué)院上海微系統(tǒng)與信息技術(shù)研究所宋志棠、雷宇研究團隊,在三維相變存儲器(3D PCM)亞閾值讀取電路、高
7月21日,TCL電子公布2024年上半年全球出貨量數(shù)據(jù),TCL電子表示,得益于公司在全球市場的積極開拓和品牌影響力的
據(jù)美國趣味科學(xué)網(wǎng)站16日報道,來自美國麻省理工學(xué)院、美國陸軍作戰(zhàn)能力發(fā)展司令部(DEVCOM)陸軍研究實驗室和加拿
全球LED市場復(fù)蘇,車用照明與顯示、照明、LED顯示屏及不可見光LED等市場需求有機會逐步回溫,億光下半年車用及
三星最新推出的Galaxy Watch 7,繼續(xù)重新定義可穿戴技術(shù)的極限。這款最新型號承襲了其前身產(chǎn)品的成功之處,同時
2024年第二季度,在印度大選、季節(jié)性需求低迷以及部分地區(qū)極端天氣等各種因素的影響下,印度智能手機市場微增1%
根據(jù)TechInsights無線智能手機戰(zhàn)略(WSS)的最新研究,2024年Q1,拉丁美洲智能手機出貨量強勁增長,同比增長21%。
Chiplet的出現(xiàn)標志著半導(dǎo)體設(shè)計和生產(chǎn)領(lǐng)域正在經(jīng)歷一場深刻的變革,尤其在設(shè)計成本持續(xù)攀升的背景下。
“芯”聚正當時!第二十一屆中國國際半導(dǎo)體博覽會(IC?CHINA?2024)正式定檔,將于2024年11月18-20日在北京·國家
7月25日,由全球領(lǐng)先的專業(yè)電子機構(gòu)媒體AspenCore與深圳市新一代信息產(chǎn)業(yè)通信集群聯(lián)合主辦的【2024國際AIoT生
2024年7月17日-19日,國內(nèi)專業(yè)的電子元器件混合分銷商凱新達科技(Kaxindakeji)應(yīng)邀參加2024年中國(西部)電子信息
在7月12日下午的“芯片分銷及供應(yīng)鏈管理研討會”分論壇上,芯片分銷及供應(yīng)鏈專家共聚一堂,共謀行業(yè)發(fā)展大計。
7月8日-10日,2024慕尼黑上海電子展(elec-tronica China)于上海新國際博覽中心盛大開展,凱新達科技被邀重磅亮
2024年7月8日到10日 ,浙豪半導(dǎo)體(杭州)有限公司作為小華半導(dǎo)體的優(yōu)秀合作伙伴,在2024慕尼黑上海電子展上展出了
7月25日,由全球領(lǐng)先的專業(yè)電子機構(gòu)媒體AspenCore與深圳市新一代信息產(chǎn)業(yè)通信集群聯(lián)合主辦的【2024國際AIoT生
近日,2024?Matter?中國區(qū)開發(fā)者大會在廣州隆重召開。
7月25日,由全球領(lǐng)先的專業(yè)電子機構(gòu)媒體AspenCore與深圳市新一代信息產(chǎn)業(yè)通信集群聯(lián)合主辦的【2024國際AIoT生
7月13日,以“共筑先進封裝新生態(tài),引領(lǐng)路徑創(chuàng)新大發(fā)展”為主題的第十六屆集成電路封測產(chǎn)業(yè)鏈創(chuàng)新發(fā)展論壇(CIPA
新任副總裁將推動亞太地區(qū)的增長和創(chuàng)新。
以碳化硅和氮化鎵為代表的寬禁帶半導(dǎo)體已成為綠色能源產(chǎn)業(yè)發(fā)展的重要推動力。
點擊查看更多
北京科能廣告有限公司深圳分公司 版權(quán)所有
分享到微信
分享到微博
分享到QQ空間
推薦使用瀏覽器內(nèi)置分享
分享至朋友圈