自ChatGPT商用落地以來,在過去近一年半時間里,生成式AI應(yīng)用加速落地,供應(yīng)端力求盡快形成新質(zhì)生產(chǎn)力。風(fēng)口首先吹向的是AI算力市場,AI服務(wù)器作為算力主要載體,自然也首當(dāng)其沖吃到第一波紅利。ebEesmc
一時間,大家探索“AI大模型+行業(yè)”的熱情高漲,高科技企業(yè)也需要AI服務(wù)器來訓(xùn)練AI大模型。現(xiàn)在的AI大模型有數(shù)億至數(shù)千億個參數(shù),數(shù)據(jù)量遠(yuǎn)超傳統(tǒng)模型的規(guī)模。AI模型越復(fù)雜其數(shù)據(jù)集規(guī)模就越大,需要更多的算力資源來支撐訓(xùn)練過程,這也催生了大量的AI芯片需求。ebEesmc
對AI芯片供應(yīng)商來說,由于去年突然增加的需求過多,在短期內(nèi)來不及跟進(jìn)產(chǎn)能。一方面是“紅到發(fā)紫”的市場需求,另一方面是AI芯片供不應(yīng)求,AI行業(yè)遭遇了“甜蜜的負(fù)擔(dān)”。ebEesmc
瘋狂2023:英偉達(dá)GPU一卡難求
AI芯片可根據(jù)其設(shè)計和應(yīng)用特性,分為 GPU、FPGA、ASIC(含NPU、ASSP)。FPGA和ASIC是半定制和全定制芯片,它們可針對AI需求特征定制。GPU是通用型AI芯片,是AI領(lǐng)域的主流芯片,它適合多種計算任務(wù),在AI市場表現(xiàn)突出。ebEesmc
從AI GPU供應(yīng)商層面來看,英偉達(dá)是全球當(dāng)之無愧的No.1。2023年,市場研究機(jī)構(gòu)TrendForce預(yù)計,英偉達(dá)GPU在全球AI服務(wù)器市場的占有率為60%至70%,而云端廠商自研AISC芯片的占有率超過20%。ebEesmc
當(dāng)然,即使是英偉達(dá)這般體量的供應(yīng)商,也難以滿足突增的AI GPU需求。早在去年上半年,供給端就傳出“算力市場供不應(yīng)求”的消息——英偉達(dá)的多款GPU缺貨,GPU交貨周期拉長,半年累計漲幅近40%。H100 GPU在eBay上的價格,甚至一度被炒到4萬美元以上。而中國“特供”版A800/H800 GPU也被炒成高價,從原來的人民幣12萬元左右“炒”到了25-30萬,甚至還有高達(dá)50萬元一張的價格。一時間,大家都在調(diào)侃“顯卡已經(jīng)成為理財產(chǎn)品”。ebEesmc
AI芯片供應(yīng)緊張的情況,貫穿了2023年全年。去年Q4,英偉達(dá)AI GPU的交貨周期仍長達(dá)8至11個月,供應(yīng)問題直到今年Q1才得到緩解,目前的交貨周期縮至3-4個月。ebEesmc
對此,瑞銀(UBS)分析師給出了兩種判斷:第一種是英偉達(dá)正在規(guī)劃新的方案提高產(chǎn)能,滿足未來的訂單;而另一種可能是英偉達(dá)目前已具備足夠的產(chǎn)能,可以處理積壓的訂單。當(dāng)然,不排除是這兩個因素疊加的效果。ebEesmc
針對英偉達(dá)AI GPU交貨周期顯著縮短,美國AI軟件公司Databricks聯(lián)合創(chuàng)始人兼CEO Ali Ghodsi評價表示,隨著明年供需再平衡,英偉達(dá)GPU芯片價格將會大幅下降,從而給眾多AI科技巨頭和初創(chuàng)公司的商業(yè)模式帶來影響。ebEesmc
是什么在限制AI芯片產(chǎn)能?
一般來說,當(dāng)某類產(chǎn)品供應(yīng)緊張時,廠商會爭分奪秒進(jìn)行增產(chǎn)??赡軙腥撕闷?,GPU缺貨早在去年上半年就已顯現(xiàn),為何直到2024年Q1才緩解?其實,GPU缺貨并非受限于英偉達(dá),而是受限于臺積電的CoWoS封裝產(chǎn)能。ebEesmc
·CoWoS是AI芯片主流的封裝技術(shù)
CoWoS(Chip on Wafer on Substrate)是目前主流的AI處理器封裝方案,它是臺積電開發(fā)的一種2.5D芯片封裝技術(shù),由CoW和oS兩種技術(shù)組合而來。先通過Chip on Wafer(CoW)的封裝制程,把芯片封裝到硅轉(zhuǎn)接板(硅中介層)上,并使用硅轉(zhuǎn)接板上的高密度布線進(jìn)行互連,然后再安裝在封裝基板上。ebEesmc
經(jīng)過了以上封裝步驟的芯片,具有封裝體積小、功耗低、引腳少的優(yōu)勢。目前,CoWoS封裝主要使用在高性能計算、人工智能、云計算等領(lǐng)域。除了AI GPU之外,HBM、Chiplet也采用了CoWoS封裝技術(shù)。因此,CoWoS的產(chǎn)能是限制AI芯片出貨量的關(guān)鍵。ebEesmc
·英偉達(dá)、蘋果、AMD、博通緊急追單
據(jù)Omdia的研究報告統(tǒng)計,僅在2023年Q3這一個季度,英偉達(dá)就售出了近50萬張AI計算卡,其中包括了H100、A100、H800、A800、L40S等。這些AI計算卡的買家有Meta、微軟、谷歌、亞馬遜、甲骨文和騰訊,其中Meta和微軟分別采購了15萬張H100 GPU,谷歌、亞馬遜、甲骨文和騰訊均采購了5萬張。ebEesmc
即使如此,英偉達(dá)供應(yīng)的AI GPU仍無法滿足當(dāng)前AI大模型訓(xùn)練的需求。早在去年5月,就有消息傳出英偉達(dá)向臺積電增加A100和H100 AI GPU訂單,導(dǎo)致臺積電的晶圓開工量增加。到去年10月,英偉達(dá)確定擴(kuò)大AI GPU訂單量的消息,隨后蘋果、AMD、博通、Marvell等企業(yè)也向臺積電追加了CoWoS封裝芯片訂單。ebEesmc
·AI芯片供貨緊張或持續(xù)至2025年
實際上,CoWoS的產(chǎn)能并不算高。截至2023年底,臺積電CoWoS的月產(chǎn)能不足2萬片晶圓。2023年10月,臺積電總裁魏哲家在法說會上表示,預(yù)計2024年底,將增加一倍以上的CoWoS產(chǎn)能,一直到2025年,臺積電將持續(xù)擴(kuò)充CoWoS封裝產(chǎn)能?;趯ε_積電的CoWoS擴(kuò)充計劃,業(yè)內(nèi)分析師估計,今年Q3 CoWoS產(chǎn)能可能迎來明顯增長。ebEesmc
為了實現(xiàn)提升CoWoS產(chǎn)能的目標(biāo),臺積電提前尋找設(shè)備供應(yīng)商追加了30%的設(shè)備訂單,不過由于新設(shè)備交期長達(dá)8個月,難以快速滿足客戶的AI芯片訂單需求,為此臺積電改造了部分InFO(集成扇出型)設(shè)備,以此來支持CoWoS封裝芯片的生產(chǎn)。ebEesmc
2024年1月18日,魏哲家在法說會上再次談及先進(jìn)封裝話題,他指出AI芯片先進(jìn)封裝需求持續(xù)強(qiáng)勁,目前產(chǎn)能仍無法滿足客戶的強(qiáng)勁需求,供不應(yīng)求狀況可能會延續(xù)到2025年。ebEesmc
中國AI行業(yè)面臨新課題
雖然高科技巨頭如今都在聚焦AI,為了訓(xùn)練自己的大模型,紛紛布局了AI服務(wù)器,但是來自中國的科技企業(yè),在該輪AI競賽中遭遇了挑戰(zhàn)。ebEesmc
2022年10月,美國商務(wù)部工業(yè)和安全局(BIS)更新了針對中國的“先進(jìn)計算芯片、半導(dǎo)體制造設(shè)備出口管制規(guī)則”,而英偉達(dá)的A100、H100等高端芯片在對華禁售范圍內(nèi)。英偉達(dá)為規(guī)避限制規(guī)則,在A100、H100基礎(chǔ)上推出A800、H800,這兩款新品“特供”給中國市場。有業(yè)內(nèi)人士爆料稱,H800的數(shù)據(jù)傳輸速率只有H100的一半。ebEesmc
到2023年10月,美國商務(wù)部再一次收緊了芯片規(guī)則,限制了英偉達(dá)A800、H800的出貨。業(yè)內(nèi)再傳出,英偉達(dá)還將針對中國市場發(fā)布HGX H20、L20 PCle和L2 PCle,但這三款芯片的性能會再次“打折”。ebEesmc
從英偉達(dá)的”特供“中國市場的A800、H800,再到計劃中再度”閹割“的HGX H20、L20 PCle和L2 PCle。讓大家再次意識到,掌握自主核心技術(shù)、擁有自己技術(shù)體系的重要性。3月29日舉辦的“GPU/AI芯片于高性能計算應(yīng)用論壇”,國產(chǎn)GPGPU和AI芯片廠商會帶來哪些最新思考?點擊這里報名參會ebEesmc
在此背景下,中國本土AI芯片企業(yè)備受關(guān)注。業(yè)內(nèi)人士預(yù)估,英偉達(dá)GPU被禁售事件,將進(jìn)一步促進(jìn)中國本土AI芯片企業(yè)的發(fā)展,同時也有人列舉了一些可行的解決方案。比如,有方案指出英偉達(dá)憑借自研的CUDA生態(tài),才得以在AI訓(xùn)練市場稱霸一方,所以其他廠商想要替代英偉達(dá),就需要先兼容英偉達(dá)CUDA生態(tài),通過該方法可減少用戶的移植成本。ebEesmc
但今年3月,一則“安裝英偉達(dá)CUDA 11.6及更高版本時,最終用戶許可協(xié)議中明確表示:禁止在其他硬件平臺上通過翻譯層運(yùn)行基于CUDA的軟件!”的新聞受到大家的關(guān)注。雖然也有人認(rèn)為這種封閉的做法,不利于整個行業(yè)的發(fā)展和創(chuàng)新,但是這也讓人們對GPU生態(tài)有了更深刻的認(rèn)知。中國本土GPU企業(yè)都強(qiáng)調(diào)——要加快自主軟件生態(tài)的建設(shè),降低對外部技術(shù)的依賴。ebEesmc
責(zé)編:Clover.li