人妻在线无码一区二区三区,99精品电影一区二区免费看

似乎在去年底、今年初，以ChatGPT為代表的生成式AI技術(shù)爆發(fā)以后，端側(cè)市場的各路參與者都在想辦法借生成式AI的東風(fēng)，比如說PC領(lǐng)域內(nèi)的芯片企業(yè)、OEM廠商都在談輕薄本能跑生成式AI；就連嵌入式市場做SoC/MPU芯片的企業(yè)也在談生成式AI...

最近聯(lián)發(fā)科發(fā)布的天璣9300芯片，在宣傳上叫“天璣9300旗艦5G生成式AI移動芯片”——這個詞條剖析一下，5G是天璣9000系列的標配了，不用多談；“旗艦”和“生成式AI”在我們看來特別對應(yīng)于（1）全大核CPU架構(gòu)設(shè)計，（2）能跑生成式AI。Yqqesmc

Yqqesmc

這兩點之所以引人驚嘆，一方面在Android手機已經(jīng)持續(xù)了多年的CPU大小核或大中小核設(shè)計，Arm的Cortex-A7、A53、A55都是相當經(jīng)典的小核心設(shè)計，也是被市場驗證了有效性的方案，而現(xiàn)在去掉小核，對一向沿襲Arm IP的聯(lián)發(fā)科而言是個突破；Yqqesmc

另一方面，端側(cè)跑生成式AI這件事本身并不稀奇——真正讓人感覺到驚訝的是，聯(lián)發(fā)科表示自家的天璣9300跑70億、130億，甚至330億參數(shù)規(guī)模LLM不在話下。這對追求低功耗的手機芯片而言，的確是很驚艷的成績，也讓生成式AI在本地推理真正有了價值。Yqqesmc

我們主要從這兩個方面，來詳細看看這次的天璣9300。Yqqesmc

天璣9300配置梗概及亮點一瞥

首先照例還是先匯總一下這顆總共堆了227億晶體管的天璣9300的配置情況，并對照上一代天璣9200。Yqqesmc

Yqqesmc

在我們看來這其中有幾個亮點。其一當然是去掉小核心集群的CPU，雖然仍然是8核，但是4個Cortex-X4超大核加4個Cortex-A720大核。聯(lián)發(fā)科給的數(shù)據(jù)是，相比天璣9200的多核峰值性能提升40%，但在達到天璣9200的峰值性能時功耗降低33%；Yqqesmc

PPT中更是直接展示了Geekbench 6的多核得分在7500-8000之間，領(lǐng)先于“A公司A系列芯片”和“Q公司23年旗艦芯片”——查一下Geekbench 6的數(shù)據(jù)庫就知道，這倆說的是蘋果A17 Pro和高通驍龍8 Gen 3。Yqqesmc

Yqqesmc

雖說這張圖的比例尺是以6500分為起點的，柱狀條的領(lǐng)先幅度看起來夸張了一點，但的確做到了CPU多核性能的全面領(lǐng)先的。Yqqesmc

其二是AI加速單元APU 790能跑生成式AI——無論是發(fā)布會還是面向媒體的pre-briefing，這次聯(lián)發(fā)科在APU花的篇幅那還真是相當大——APU算是第一次在聯(lián)發(fā)科發(fā)布會上這么有排面，甚至是放在GPU前面去談的，后文也會對此做詳述。Yqqesmc

其紙面數(shù)據(jù)主要包括“8倍速生成式AI Transformer算子加速”，“混合精度INT4量化技術(shù)”“NeuroPilot Compression內(nèi)存硬件壓縮技術(shù)”，2倍整數(shù)性能、2倍浮點性能提升，以及45%功耗降低。聯(lián)發(fā)科在發(fā)布會上公布的ETHZ AI Benchmark v5.1跑分是2109分。不過媒體溝通會上，聯(lián)發(fā)科也強調(diào)如果加上內(nèi)存測試成績，系統(tǒng)性能得分會再高出1000+分。畢竟跑大模型本身就非?？简灤鎯π阅堋?span style="display:none">Yqqesmc

Yqqesmc

所以實際上，內(nèi)存方面LPDDR5T-9600MT的支持也算是個亮點。LPDDR5T的“T”最早是今年1月SK海力士宣布旗下的LPDDR5新品帶寬達到9.6Gbps，相比LPDDR5X高出13%，所以命名為LPDDR5 Turbo，供電電壓在1.01-1.12V范圍內(nèi)。三星和美光應(yīng)該也有類似產(chǎn)品。Yqqesmc

前不久國外媒體報道稱，美光LPDDR5X-9600和SK海力士LPDDR5T-9600均驗證兼容驍龍8 Gen 3。但在這次天璣9300的媒體溝通會上，聯(lián)發(fā)科方面表示：“9600這個規(guī)模，在我們的芯片平臺會是全球第一個落地，真正商用的，最終消費者能拿得到的。”并談到“友商”在設(shè)計上實際并未落地，今年內(nèi)應(yīng)該也不會出現(xiàn)LPDDR5T-9600的終端產(chǎn)品。Yqqesmc

對于LPDDR5T-9600的支持，可能也和生成式AI在這代芯片上的應(yīng)用有關(guān)。因為我們知道，AI大模型對RAM帶寬、容量都會有較高的需求。Yqqesmc

配置表里的另一個亮點在GPU方面Immortalis-G720 MC12的升級。聯(lián)發(fā)科方面表示，這顆GPU的峰值性能相比天璣9200的Immortalis-G715 MC11提升了46%，達到后者峰值性能時功耗降低40%；而且搬出了相比驍龍8 Gen 3、A17 Pro的兩項GFXBench圖形測試：Yqqesmc

Yqqesmc

我們知道，蘋果已經(jīng)在GPU上擠了兩年牙膏，而高通驍龍8 Gen 3的GPU性能升級幅度今年已經(jīng)算是相當大的，但沒想到Immortalis現(xiàn)在能這么爭氣。這里多提一句，注意上圖中的兩個測試，Aztec Ruins測試在幾何復(fù)雜度上會遜于Manhattan，但shader負載高出不少?；蚩勺鳛镮mmortalis和Adreno在性能側(cè)重點上的差異比較依據(jù)之一。Yqqesmc

另外這次天璣9300的GPU光追性能提升了46%，VRS性能提升86%——有關(guān)光追支持及天璣圖形生態(tài)部分，也會在后文提及更多。Yqqesmc

天璣9300芯片的其他亮點，還包括ISP升級到Imagiq 990，聯(lián)發(fā)科特別提到AI語義分割視頻引擎實現(xiàn)了“16層圖像語義分割”，相比其他芯片多了幾層；以及“全像素對焦”，“2倍無損變焦”，“OIS光學(xué)防抖專核”，并支持“3麥克風(fēng)高動態(tài)錄音降噪”。顯示引擎、連接等相關(guān)的技術(shù)升級，這里就不多談了，其實Wi-Fi 7增強Mtra Range 2.0、雙路藍牙閃連技術(shù)等也都算得上亮點。Yqqesmc

CPU：“全大核”的存在合理性

今年Arm在新品發(fā)布會上談TCS23方案時，推薦的手機AP SoC，CPU大中小核搭配方式包括了1+3+4，1+5+2，另外就是面向筆記本有10+4+0的新方案。高通顯然是選了1+5+2的方案的，也就是1個Cortex-X4超大核，5個Cortex-A720（額外基于頻率分了兩組）大核，以及2個Cortex-A520小核。Yqqesmc

Yqqesmc

聯(lián)發(fā)科一個也沒選，而上了4+4+0的方案——倒更像是筆記本方案的下放。其實在去年聯(lián)發(fā)科在PC平臺SoC芯片方面的投入。此前聯(lián)發(fā)科也有面向Chromebook的Kompanio 1380芯片。而在今年5月，聯(lián)發(fā)科正與英偉達合作，面向筆記本開發(fā)Windows on Arm平臺產(chǎn)品。Yqqesmc

如果此消息可靠，算時間聯(lián)發(fā)科在PC芯片上的成果應(yīng)該是能夠惠及手機平臺的（雖然一般我們應(yīng)該反過來說）。這么看，是否感覺天璣9300在CPU部分的4+4+0方案合理了很多？（尤其搭配LPDDR5T落地，是不是更像那么回事了？）Yqqesmc

一般我們說移動平臺“小核心”的存在價值是為了省電——主要是低負載區(qū)間內(nèi)保持相比于大核心，更低的功耗和更高的能效；并且以更小的面積換取盡可能高的性能收益。Arm的小核心到現(xiàn)在為止都還是順序架構(gòu)，為的就是維系輕量、小尺寸、低功耗。Yqqesmc

但實際上，歷史上移動平臺沒有采用“小核心”的先例早就存在。比如說高通早年的CPU自研架構(gòu)，至少到驍龍820的Kryo時期，都還在堅持同構(gòu)核心，而不存在什么小核心——也沒有在續(xù)航方面打多少折扣。而且我們在也探討過，驍龍820的末代自研Kryo架構(gòu)更多的是生不逢時。Yqqesmc

還有個絕佳的例子，雖然我們一直說蘋果A系列芯片的CPU是“大小核”異構(gòu)，但其實人家的“小核心”不僅歷史上全程保持著亂序（OoO）設(shè)計，而且規(guī)模還真是一點都不“小”。比如A15的“小核”性能就超過Cortex-A76，甚至和低頻點的Cortex-A78差不多。Yqqesmc

Yqqesmc

全大核帶來最顯而易見的價值，當然就是多線程性能的顯著提升。所以不出意外的，聯(lián)發(fā)科宣布天璣9300相較9200，多核峰值性能提升40%，也領(lǐng)先于蘋果和高通今年的競品。還有包括實驗室環(huán)境下安兔兔跑分超過220萬，都算是宣傳佐料。Yqqesmc

堆核戰(zhàn)術(shù)的另一個價值是多任務(wù)性能：媒體會上，聯(lián)發(fā)科就提到在《原神》游戲極高畫質(zhì)達成60fps幀率的同時，還能進行微信視頻通話。這在傳統(tǒng)架構(gòu)上是很難實現(xiàn)的。Yqqesmc

其實這波性能發(fā)揮的關(guān)鍵，反倒應(yīng)該考慮，手機這種小尺寸設(shè)備的系統(tǒng)設(shè)計是否能全力發(fā)揮出天璣9300的全部性能，尤其是4個Cortex-X4大核。這是未來很值得關(guān)注的問題。從聯(lián)發(fā)科宣布GB6的性能成績，以一個區(qū)間性能來做對比，可見天璣9300可能會比較考驗OEM廠商的系統(tǒng)設(shè)計能力。Yqqesmc

那么接下來的問題就是，去掉了小核，續(xù)航和能效還能不能保證？聯(lián)發(fā)科在發(fā)布會上給出的解釋和邏輯是，“大核做事快，休息快，低功耗”。這個邏輯當然沒有問題，也是我們過去經(jīng)常說的，很多時候不怕功耗高，只要匹配足夠強的性能，其實能讓任務(wù)更快速地完成——蘋果以往就是這么做的。Yqqesmc

我們說的“功耗”一般是指單位時間內(nèi)消耗的能量（單位瓦特），而不是完成一件工作消耗了多少能量（單位焦耳）。手機續(xù)航考驗的實際是所有工作消耗能量的總和；只要不總是處在高功耗狀態(tài)，“越快做完越省電”。Yqqesmc

憑借架構(gòu)更新與工藝改良，及在高負載區(qū)間段的高效表現(xiàn)，天璣9300的功耗也有對應(yīng)的降低。聯(lián)發(fā)科提到達成天璣9200峰值性能時，天璣9300這邊的功耗降低了33%——這是完全符合直覺的，因為更多的大核，在高負載區(qū)間段本身就有更高的效率。Yqqesmc

Yqqesmc

于是也就有了上圖各類使用場景下，天璣9300的功耗降低。但其實這仍然不能解釋，低負載區(qū)間段如何做到低功耗。Arm做這類3-cluster的設(shè)計，就是要在不同負載區(qū)間內(nèi)，以不同的核心來解決問題——因為每個核心只在特定性能區(qū)間內(nèi)才達到最高效率，如下圖性能與功耗的關(guān)系。Yqqesmc

Yqqesmc

Cortex-A520這種小核就是在低負載區(qū)間，達成相比A720和X4更低的功耗。這是Arm設(shè)計此類架構(gòu)的初衷。上面我們談到的功耗降低，都很難說是低負載區(qū)間。所以天璣9300的4+4+0方案，在手機待機及低負載時，如何保證高效呢？Yqqesmc

先談一下我們的猜想。第一是從Cortex-A510開始，Arm的小核設(shè)計似乎就進入了某個瓶頸期。A510相比更早A55的效率提升真是一點都不大，性能提升基本是以功耗為代價；而且我們認為其面積效益不夠理想。A520對效率問題著重做了改良，包括提升分支預(yù)測和數(shù)據(jù)預(yù)取性能，重構(gòu)了存儲子系統(tǒng)，去掉了原本的一些性能加強——比如去掉了一條ALU管線。但我們認為現(xiàn)在Arm的小核已經(jīng)不復(fù)當年的經(jīng)典。Yqqesmc

其次可能和制造工藝有關(guān)。聯(lián)發(fā)科在媒體會上說：“這幾年我們在做架構(gòu)設(shè)計時，一個比較大的觀念轉(zhuǎn)變就是不見得小核就比較省電。”“越往先進制程去，晶體管越小——太小鎖不住漏電電流。”“則小核的功耗相比大核未必就會更好。越往后面這個問題會越嚴重。”“越快把系統(tǒng)關(guān)掉，其實比較省電。”Yqqesmc

還有一種可能性，是隨著移動生態(tài)的發(fā)展，操作系統(tǒng)與應(yīng)用設(shè)計的耗電模型已經(jīng)和幾年前大不一樣?，F(xiàn)在芯片的內(nèi)卷程度，已經(jīng)到了芯片設(shè)計企業(yè)普遍會去關(guān)心上層細分應(yīng)用場景。聯(lián)發(fā)科可能在這方面做了更多的工作。Yqqesmc

“以軍隊來講，你要料敵精準，知道哪個敵人要先干掉，然后快速殲敵。”聯(lián)發(fā)科方面談到，“我們能夠做到的事情是，把關(guān)鍵的一些程序定義出來，快速將其解決掉，接下來軍隊就能回去休息了。”據(jù)說其中也涉及到不少與其生態(tài)系統(tǒng)合作伙伴的合作、調(diào)優(yōu)。Yqqesmc

“未來我們會做的事情是，在省電的時候能睡得更沉。”“我們花了3年時間去做這件事。除了硬件設(shè)計之外，軟件、系統(tǒng)設(shè)計怎么去找到關(guān)鍵場景做優(yōu)化，將應(yīng)用聚集在一起，快速將其執(zhí)行完畢，快速深層地睡下去。”“這不是個簡單的事情，必須從端到端，從硬件到軟件到系統(tǒng)全部串在一起。”Yqqesmc

“系統(tǒng)背景有很多小小的程序，那些程序跳出來的時候，CPU就會被喚醒——那就一定會有功耗產(chǎn)生——我們要做的是，把系統(tǒng)里面小小的波動，要么把它結(jié)合起來，要么拿到旁邊，可能用別的硬件或者SCP（system control processor）的方法去做。這就涉及到更細節(jié)的如何進一步節(jié)省功耗的問題了。這個技術(shù)持續(xù)地在做提升，我們會一路這樣做下去。”Yqqesmc

雖然我們對于聯(lián)發(fā)科具體是如何在極低負載區(qū)間段確保能效的，仍然不甚明朗，但這段話大約可以表明，聯(lián)發(fā)科應(yīng)該有在其他方面做技術(shù)補充。最后，聯(lián)發(fā)科還多次強調(diào)“我們相信全大核架構(gòu)，明年開始大家都會往這個方向去走”“未來是全大核的世代”。Yqqesmc

APU：手機上的生成式AI

天璣9300更新的另一個重點無疑就是APU 790了。從聯(lián)發(fā)科的示意框圖來看，APU 790新增了“生成式AI引擎”，很容易讓人聯(lián)想到英偉達在這代Hopper架構(gòu)中特別加入的Transformer引擎。這是順應(yīng)AI時代潮流的做法，相當于在加速器中又加了個更專用的加速器。Yqqesmc

媒體溝通會上，聯(lián)發(fā)科談到APU 790“深度適配Transformer模型”，尤其“優(yōu)化Softmax + LayerNorm算子，處理速度是上一代的8倍”。因為對Transformer而言，Softmax+LayerNorm占到了其中的大頭。Yqqesmc

Yqqesmc

現(xiàn)在我們常說的Transformer結(jié)構(gòu)采用所謂的self-attention（自注意力）機制，捕捉全局相關(guān)性、在一個隊列內(nèi)不同element的關(guān)系。Softmax函數(shù)就用于幫助決策attention的量或者一句話里每個詞的重要性。而LayerNorm用于在一個層級上，跨神經(jīng)元進行數(shù)值的nomalization。Yqqesmc

以前行業(yè)普遍認為Transformer的結(jié)構(gòu)特性更適用于NLP（自然語言處理）；而CNN（卷積神經(jīng)網(wǎng)絡(luò)）的卷積特性，決定了其擅長圖像分類、對象識別之類的視覺型工作。所以很顯然LLM大語言模型就以Transformer結(jié)構(gòu)為基礎(chǔ)。Yqqesmc

2021年Google Research團隊發(fā)了個paper，他們提出一種解決方案，把一張圖像切割成小片，每一片作為一個單字、token，則Transformer就能處理圖像相關(guān)工作了。Vision Transformer一時也變得很熱。像Stable Diffusion這類所謂“多模態(tài)模型”多少也都有Transformer結(jié)構(gòu)的影子。這應(yīng)該也是APU 790強調(diào)“生成式AI引擎”的基礎(chǔ)。Yqqesmc

好像過去我們說LLM、Transformer、生成式AI這些關(guān)鍵詞，都會和數(shù)據(jù)中心集群這種大家伙，或者至少也是TDP數(shù)百瓦的旗艦級桌面顯卡關(guān)聯(lián)起來。不過這幾個月，端側(cè)跑生成式AI的宣傳越來越多。不管是手機還是PC，這類端側(cè)設(shè)備所謂的“跑AI”或者“運行AI”，一般是指AI推理（inference）。Yqqesmc

正兒八經(jīng)、商用的大模型training還是要放到服務(wù)器集群上去跑的——可以理解為打造一個模型的過程。模型打造好了，就要拿來用了——也就是推理的過程。推理有時也需要大算力，比如ChatGPT的AI推理就是在服務(wù)器集群上進行的。Yqqesmc

但小模型的推理其實并不需要太高的算力，就連IoT嵌入式設(shè)備很多也強調(diào)AI推理特性，這也叫跑AI。天璣9300跑生成式AI指的就是對一定規(guī)模的生成式AI模型做推理——這些模型的規(guī)模雖然不會大到ChatGPT的程度，但也有一定的量級。Yqqesmc

比如聯(lián)發(fā)科在這次的宣傳中提到，天璣9300能跑70億參數(shù)的AI大語言模型，20 tokens/秒的生成速度；而且“成功在端側(cè)運行130億參數(shù)AI大語言模型”；并達成“首款移動芯片成功運行330億參數(shù)AI大語言模型”。Yqqesmc

其實對后兩個規(guī)模的LLM宣傳，我們并不清楚其運行環(huán)境與確切的實用性如何——330億這個值應(yīng)該是為了對標驍龍8 Gen 3的100億參數(shù)規(guī)模支持能力而提的。Yqqesmc

但70億參數(shù)LLM的20 tokens/秒仍然是具備了實用性的——而且聯(lián)發(fā)科也提及與vivo合作實現(xiàn)了70億參數(shù)LLM的端側(cè)落地。可能很多同學(xué)對參數(shù)規(guī)模沒什么概念，此前，在不用加速器的情況下能跑60億參數(shù)的ChatGLM2、130億參數(shù)的Llama 2、155億參數(shù)的StarCoder——不過要注意，這是純粹靠CPU跑出來的。在此可作為量級參考。Yqqesmc

另外聯(lián)發(fā)科表示天璣9300實現(xiàn)Stable Diffusion“高速生成式AI圖像生成”<1秒——這個表達有些模糊，因為Stable Diffusion文生圖涉及到迭代次數(shù)、圖像分辨率等各種問題。Yqqesmc

但總的來說，要實現(xiàn)上述量級的模型在手機芯片上跑起來，光靠APU的Transformer模型算子加速其實也還不夠。除了在我們看來，全大核CPU以及高頻LPDDR5T內(nèi)存也能幫上忙，聯(lián)發(fā)科還做了其他相關(guān)技術(shù)的補充。Yqqesmc

Yqqesmc

其一是內(nèi)存硬件壓縮技術(shù)NeuroPilot Compression?？闪炕臄?shù)據(jù)是LLM 130億參數(shù)大模型原本需求13GB內(nèi)存，則在加上Android操作系統(tǒng)及其他app保活的內(nèi)存需求以后，現(xiàn)在旗艦手機的16GB內(nèi)存也不夠用。所以NeuroPilot Compression能夠在量化、壓縮以后，將其壓縮至5GB。Yqqesmc

其二在開發(fā)生態(tài)和工具鏈上，聯(lián)發(fā)科應(yīng)當也是需要做不少相關(guān)工作的，包括模型量化、優(yōu)化與轉(zhuǎn)換，最終簡化、降低端側(cè)本地推理的性能需求。這其中包括模型方面的合作，這次列舉模型相關(guān)的合作包括Android AI foundational model，百度文心一言、百川大模型，以及Llama 2，“針對主流大語言模型做深度適配與優(yōu)化”。具體應(yīng)當包含了這些模型在端側(cè)的部署。Yqqesmc

另外值得一提的是聯(lián)發(fā)科提到“生成式AI端側(cè)‘技能擴充’”，“在大模型的基礎(chǔ)上，讓端側(cè)的AI學(xué)會更多的技能”——NeuroPilot Fusion技能擴充技術(shù)，讓天璣9300成為“首款支持生成式AI在端側(cè)LoRA融合”的芯片，“基于一個大模型，通過云端的訓(xùn)練，在端側(cè)完成N個功能的融合，賦予大模型更全面的能力。”LoRA（Low-Rank Adaptation）一般用在我們常說的模型fine-tuning上，特點是可減少參數(shù)量。這里所說“端側(cè)LoRA融合”的邏輯和流程，我們暫時不是很明晰——從介紹來看，LoRA融合是NeuroPilot開發(fā)工具鏈的一部分。Yqqesmc

這部分的最后還是要談一談應(yīng)用。畢竟高喊生成式AI，最終要落地到手機的應(yīng)用上。聯(lián)發(fā)科現(xiàn)場演示了用天璣9300芯片的手機按照輸入的要求生成詩句，生成圖片和斗圖表情包（叫text-to-meme），以及輸入個人照片來生成個人專屬風(fēng)格gif表情包。Yqqesmc

另外有個更實用的應(yīng)用，是與vivo合作打造的AI助理，以對話形式完成工作：比如說語義搜索、畫圖、文案生成、照片修圖、查資料、生成思維導(dǎo)圖、一鍵識屏安排日程等等。Yqqesmc

Yqqesmc

聯(lián)發(fā)科自己列舉的生成式AI應(yīng)用還包括圖片的生成式超分（與虹軟的合作）、視頻通話基于真實人像的3D形象實時生成（與morpho的合作）、夜景照片防眩光（與TETRAS.AI的合作）等等......端側(cè)生成式AI前期的生態(tài)理論上又會是相對割裂的，這一時期也是芯片企業(yè)需要抓住的時機。聯(lián)發(fā)科在發(fā)布會上展示的生態(tài)合作伙伴除了前面列舉的這些，還包括快手、剪映、美圖秀秀、虎牙直播、抖音、愛奇藝、QQ音樂等。Yqqesmc

未來手機上的生成式AI技術(shù)成果，大概是能在這些應(yīng)用中逐漸看得到的。真正的殺手級應(yīng)用，還真得看應(yīng)用層的這些參與者的點子了——聯(lián)發(fā)科提供的是硬件基礎(chǔ)和開發(fā)平臺。手機用戶們可以期待一下。Yqqesmc

GPU：這次真的成了

天璣9300發(fā)布會第一次讓我們感覺到，聯(lián)發(fā)科的產(chǎn)品與技術(shù)點講解根本來不及，因為似乎亮點有些過多了。光是CPU和APU的介紹就花了40+分鐘。這就讓GPU、ISP之類同樣值得著墨的部分，只能相對簡略地去談。這在聯(lián)發(fā)科的手機AP SoC發(fā)布會歷史上應(yīng)該是從沒有過的。Yqqesmc

比如從去年9月起，聯(lián)發(fā)科就相繼與Discovery合作攝制紀錄片節(jié)目，還舉辦了影展，就讓ISP介紹顯得更有厚度。但顯然在這場發(fā)布會上，ISP的風(fēng)頭就徹底被APU蓋過了。有關(guān)ISP、顯示引擎、無線通信支持，雙安全芯片，以及聯(lián)發(fā)科常規(guī)項目的低功耗配套技術(shù)，受限于篇幅也不再贅述。Yqqesmc

這里我們最后來聊一聊GPU和聯(lián)發(fā)科的圖形生態(tài)，畢竟關(guān)注天璣芯片的手游用戶也相當多。前文已經(jīng)大致提到了這次聯(lián)發(fā)科給天璣9300選配的是12核Immortalis-G720，峰值性能相較天璣9200提升46%，達到天璣9200最高性能的情況下，功耗低了40%。綜合圖形性能也強于A17 Pro與驍龍8 Gen 3——這應(yīng)該是聯(lián)發(fā)科，也是Arm第一次在絕對性能上全面超越了另外兩名勁敵。Yqqesmc

這個數(shù)字比我們預(yù)期得要好，因為Arm發(fā)布Immortalis-G720時，提到的是平均15%的持續(xù)與峰值性能提升。Immortalis-G720在設(shè)計上實際更強調(diào)的是系統(tǒng)級能效提升，尤其是更低的內(nèi)存帶寬占用——這代架構(gòu)的DVS（Deferred Vertex Shading）顯著降低了帶寬需求及游戲中的DRAM功耗占比，平均功耗降低20%。而天璣9300的GPU性能提升，很大程度應(yīng)該來自于新增的一個核心。Yqqesmc

Yqqesmc

其余數(shù)值基本與Arm的宣傳相符，包括帶寬需求降低、VRS性能提升、MSAA優(yōu)化等。系統(tǒng)性能數(shù)據(jù)，聯(lián)發(fā)科在發(fā)布會上提到即便是《原神》極高畫質(zhì)下的須彌地圖，天璣9300也能在30分鐘內(nèi)跑滿60fps；以及840p分辨率極高畫質(zhì)下《星穹鐵道》能夠滿幀運行30分鐘。后者是個明顯更偏GPU性能發(fā)揮的游戲。若非風(fēng)頭被APU搶走，天璣9300的GPU絕對是值得大書特書的。Yqqesmc

有關(guān)光追，PPT中提到硬件光線追蹤性能提升46%。Immortalis在核心架構(gòu)層面決定了，更多的shader核心就能帶來更高的光追性能。Yqqesmc

天璣9200的光追性能在Basemark InVitro測試中目前排在了第一（機型大概是即將發(fā)布的vivo X100）——Arm此前也在發(fā)布會上特別強調(diào)了Basemark InVitro的領(lǐng)先。聯(lián)發(fā)科認為，Basemark InVitro是“比較貼近復(fù)雜的光追場景”，光追在場景中所占比重較大，可以反映實際光追性能。Yqqesmc

從已知測試來看，A17 Pro在3DMark Solar Bay光追測試里有著相比天璣9200更好的性能發(fā)揮?；?6%的提升值，天璣9300在這項測試里應(yīng)當也能拔得頭籌。不同測試中的排位差異，可能仍與光追測試是否僅考察光追反射，光柵化在場景中參與度，或是否同時包含更復(fù)雜光追測試等狀況相關(guān)。Yqqesmc

可能更多用戶就手機游戲光追，更關(guān)注的還是游戲支持和生態(tài)發(fā)展情況。就生態(tài)相關(guān)問題，聯(lián)發(fā)科宣布天璣9300“首發(fā)支持《暗區(qū)突圍》 60fps光追”，另外《仙劍世界》光追版也準備在天璣平臺首發(fā)。聯(lián)發(fā)科表示，加入到天璣光追生態(tài)的游戲已經(jīng)有50+款，而且生態(tài)做到了Unity, Unreal, Messiah三大引擎的全覆蓋。這在手機行業(yè)里暫時應(yīng)該也是獨一家。光追終于有用了。Yqqesmc

Yqqesmc

圖形生態(tài)相關(guān)的另一個亮點在于全局光照生態(tài)支持，和虛幻引擎、Arm合作，在Unreal 5 Lumen中融入了Vulkan Ray Query+“桌面級渲染Shader Model 5”。具體到與騰訊游戲合作，在《暗區(qū)突圍》游戲中應(yīng)用全局光照Smart GI技術(shù)。這類技術(shù)的普及應(yīng)該是手游玩家都期望看到的。Yqqesmc

此外，圖形技術(shù)相關(guān)更新還包括MAGT游戲自適應(yīng)調(diào)控技術(shù)升級為“星速引擎”。據(jù)說在應(yīng)用星速引擎以后，《王者榮耀》實現(xiàn)了15%的功耗降低，載入對局速度提升了30%。從這些數(shù)據(jù)還是能夠看到聯(lián)發(fā)科的圖形生態(tài)，正在深入影響國內(nèi)的手游行業(yè)的。Yqqesmc

Yqqesmc

未來手機的個性化需求

天璣9300的確從各個維度帶來了驚喜。不過最讓我們驚喜的仍然是生成式AI在其中的強化。在媒體采訪中，聯(lián)發(fā)科對于手機應(yīng)用生成式AI有個暢想：“手機是隨身攜帶的，它知道你的個性化需求，你的位置在哪兒。在回答你的問題時，可以將全部資訊包含在內(nèi)，做到個性化的回答，是你真正需要的。”Yqqesmc

“生成式AI的手機是充滿想象力的。輸入是多樣性的、復(fù)合的，語音、文字、手勢等等。”“旗艦機一路走來，大家應(yīng)該慢慢將它從跑分中脫離出來了。”“生成式AI手機能生成什么、創(chuàng)造什么，這才是更基本的。”Yqqesmc

11月13日，vivo X100將首發(fā)天璣9300芯片。這可能會是生成式AI手機翻開的新篇章。Yqqesmc

責編：Momoz

本文為國際電子商情原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。請尊重知識產(chǎn)權(quán)，違者本司保留追究責任的權(quán)利。

閱讀全文，請先

黃燁鋒

歐陽洋蔥，編輯、上海記者，專注成像、移動與半導(dǎo)體，熱愛理論技術(shù)研究。

進入專欄

上一篇:德國批準博世、英飛凌和恩智浦入股臺積電
下一篇:上半年全球電動汽車電池銷量同比猛增54%

微信掃一掃，一鍵轉(zhuǎn)發(fā)
關(guān)注“國際電子商情” 微信公眾號

AI芯片供不應(yīng)求，業(yè)界：半導(dǎo)體后端制程標準應(yīng)統(tǒng)一
在各大半導(dǎo)體廠商搶攻AI商機之際，芯片產(chǎn)能卻趕不上需求。
2024年全球AI服務(wù)器產(chǎn)值可望達1870億美元，約占服務(wù)器市場比重65%
TrendForce集邦咨詢預(yù)估AI服務(wù)器第2季出貨量將季增近20%，全年出貨量上修至167萬臺，年增率達41.5%。
預(yù)估2024年DRAM及NANDFlash營收將分別同增75%和77%
根據(jù)TrendForce集邦咨詢最新存儲器產(chǎn)業(yè)分析報告，受惠于位元需求成長、供需結(jié)構(gòu)改善拉升價格，加上HBM(高帶寬內(nèi)
預(yù)計2025年存儲器產(chǎn)業(yè)營收將創(chuàng)新高，價格上漲和HBM、QLC技術(shù)崛起為
根據(jù)TrendForce集邦咨詢最新存儲器產(chǎn)業(yè)分析報告，受惠于位元需求成長、供需結(jié)構(gòu)改善拉升價格，加上HBM(高帶寬內(nèi)
中國團隊存儲器研究取得系列進展
近日，中國科學(xué)院上海微系統(tǒng)與信息技術(shù)研究所宋志棠、雷宇研究團隊，在三維相變存儲器（3D PCM）亞閾值讀取電路、高
TCL電子上半年MiniLED電視全球出貨量同比增長122.4%
7月21日，TCL電子公布2024年上半年全球出貨量數(shù)據(jù)，TCL電子表示，得益于公司在全球市場的積極開拓和品牌影響力的
厚度僅100nm！新型超薄晶體薄膜半導(dǎo)體被成功研制
據(jù)美國趣味科學(xué)網(wǎng)站16日報道，來自美國麻省理工學(xué)院、美國陸軍作戰(zhàn)能力發(fā)展司令部（DEVCOM）陸軍研究實驗室和加拿
車用及不可見光業(yè)務(wù)旺，億光下半年業(yè)績可望逐季成長
全球LED市場復(fù)蘇，車用照明與顯示、照明、LED顯示屏及不可見光LED等市場需求有機會逐步回溫，億光下半年車用及
拆解：三星GalaxyWatch7中的ExynosW1000處理器3nmGAA工藝
三星最新推出的Galaxy Watch 7，繼續(xù)重新定義可穿戴技術(shù)的極限。這款最新型號承襲了其前身產(chǎn)品的成功之處，同時
2024年Q2印度智能手機市場微增1%，小米重返榜首
2024年第二季度，在印度大選、季節(jié)性需求低迷以及部分地區(qū)極端天氣等各種因素的影響下，印度智能手機市場微增1%
三星連續(xù)51個季度領(lǐng)跑拉丁美洲智能手機市場
根據(jù)TechInsights無線智能手機戰(zhàn)略（WSS）的最新研究，2024年Q1，拉丁美洲智能手機出貨量強勁增長，同比增長21%。
2030年，Chiplet計算細分市場規(guī)模預(yù)計將達到1450億美元
Chiplet的出現(xiàn)標志著半導(dǎo)體設(shè)計和生產(chǎn)領(lǐng)域正在經(jīng)歷一場深刻的變革，尤其在設(shè)計成本持續(xù)攀升的背景下。

定檔！IC?CHINA?2024將于11月在北京舉辦??！
“芯”聚正當時！第二十一屆中國國際半導(dǎo)體博覽會（IC?CHINA?2024）正式定檔，將于2024年11月18-20日在北京·國家
國民技術(shù)將攜多款高能專用MCU亮相全球MCU及嵌入式生態(tài)發(fā)展大會
7月25日，由全球領(lǐng)先的專業(yè)電子機構(gòu)媒體AspenCore與深圳市新一代信息產(chǎn)業(yè)通信集群聯(lián)合主辦的【2024國際AIoT生
凱新達科技 ┃ 亮相2024中國（西部）電子信息博覽會
2024年7月17日-19日，國內(nèi)專業(yè)的電子元器件混合分銷商凱新達科技（Kaxindakeji）應(yīng)邀參加2024年中國（西部）電子信息
芯片產(chǎn)業(yè)鏈大咖齊聚蘇州，共商供應(yīng)鏈管理策略
在7月12日下午的“芯片分銷及供應(yīng)鏈管理研討會”分論壇上，芯片分銷及供應(yīng)鏈專家共聚一堂，共謀行業(yè)發(fā)展大計。
“芯”機遇 ! 凱新達科技亮相2024慕尼黑上海電子展
7月8日-10日，2024慕尼黑上海電子展(elec-tronica China)于上海新國際博覽中心盛大開展，凱新達科技被邀重磅亮
未來可期——浙豪攜手小華半導(dǎo)體亮相慕尼黑上海電子展
2024年7月8日到10日，浙豪半導(dǎo)體（杭州）有限公司作為小華半導(dǎo)體的優(yōu)秀合作伙伴，在2024慕尼黑上海電子展上展出了
領(lǐng)芯微攜LCM32F067系列MCU亮相國際AIoT生態(tài)發(fā)展大會
7月25日，由全球領(lǐng)先的專業(yè)電子機構(gòu)媒體AspenCore與深圳市新一代信息產(chǎn)業(yè)通信集群聯(lián)合主辦的【2024國際AIoT生
2024 Matter?開發(fā)者大會7大看點不容錯過！
近日，2024?Matter?中國區(qū)開發(fā)者大會在廣州隆重召開。
泰凌微將攜低功耗物聯(lián)網(wǎng)無線芯片亮相國際AIoT生態(tài)發(fā)展大會
7月25日，由全球領(lǐng)先的專業(yè)電子機構(gòu)媒體AspenCore與深圳市新一代信息產(chǎn)業(yè)通信集群聯(lián)合主辦的【2024國際AIoT生
第十六屆集成電路封測產(chǎn)業(yè)鏈創(chuàng)新發(fā)展論壇在蘇州開幕
7月13日，以“共筑先進封裝新生態(tài)，引領(lǐng)路徑創(chuàng)新大發(fā)展”為主題的第十六屆集成電路封測產(chǎn)業(yè)鏈創(chuàng)新發(fā)展論壇(CIPA
摩爾斯微電子任命胡文杰為副總裁兼大中華區(qū)及東南亞地區(qū)經(jīng)理
新任副總裁將推動亞太地區(qū)的增長和創(chuàng)新。
低碳化、數(shù)字化推動可持續(xù)發(fā)展，英飛凌亮相2024慕尼黑上海電子展
以碳化硅和氮化鎵為代表的寬禁帶半導(dǎo)體已成為綠色能源產(chǎn)業(yè)發(fā)展的重要推動力。

深度點評天璣9300，全大核CPU和生成式AI加速有什么用？

天璣9300配置梗概及亮點一瞥

CPU：“全大核”的存在合理性

APU：手機上的生成式AI

GPU：這次真的成了

未來手機的個性化需求

雜志聲明

深度點評天璣9300，全大核CPU和生成式AI加速有什么用？