國際電子商情20日訊 號(hào)稱今年全球頭號(hào)人工智能(AI)領(lǐng)域開發(fā)者大會(huì)的英偉達(dá)2024 GTC AI大會(huì)于美東時(shí)間3月18日周一拉開帷幕。今年是英偉達(dá)時(shí)隔五年首次讓年度GTC重回線下,也是此前分析認(rèn)為英偉達(dá)要“拿出點(diǎn)真家伙”的AI盛會(huì)。Mwcesmc
會(huì)上,英偉達(dá)正式推出名為Blackwell的新一代AI圖形處理器(GPU),Blackwell平臺(tái)能夠在萬億參數(shù)級(jí)的大型語言模型(LLM)上構(gòu)建和運(yùn)行實(shí)時(shí)生成式AI,而成本和能耗比前身低25倍。Mwcesmc
這是繼2022年3月發(fā)布的Hopper架構(gòu)數(shù)據(jù)中心GPU之后,英偉達(dá)的最新一代旗艦產(chǎn)品,有望取代被“爆搶”的H100的市場地位。在命名序號(hào)上,最新亮相的產(chǎn)品直接跳過了100的序列,而是直接以“B200”命名。Mwcesmc
英偉達(dá)稱,Blackwell擁有六項(xiàng)革命性的技術(shù):Mwcesmc
- 全球最強(qiáng)大的芯片:Blackwell架構(gòu)GPU由2080億個(gè)晶體管組成,采用量身定制的臺(tái)積電4納米工藝制造,兩個(gè)reticle極限GPU裸片將10 TB/秒的芯片到芯片鏈路連接成單個(gè)統(tǒng)一的GPU。
- 第二代Transformer引擎:結(jié)合了Blackwell Tensor Core技術(shù)和TensorRT-LLM和NeMo Megatron框架中的英偉達(dá)先進(jìn)動(dòng)態(tài)范圍管理算法,Blackwell將通過新的4位浮點(diǎn)AI支持雙倍的計(jì)算和模型大小推理能力。
- 第五代NVLink:為提高數(shù)萬億參數(shù)和混合專家AI模型的性能,最新一代英偉達(dá)NVLink為每個(gè)GPU提供了突破性的1.8TB/s雙向吞吐量,確保最復(fù)雜LLM之間多達(dá)576個(gè)GPU之間的無縫高速通信。
- RAS引擎:Blackwell支持的GPU包含一個(gè)專用引擎,實(shí)現(xiàn)可靠性、可用性和服務(wù)性。此外,Blackwell架構(gòu)還增加了芯片級(jí)功能,利用基于AI的預(yù)防性維護(hù)進(jìn)行診斷和預(yù)測可靠性問題。這可以最大限度地延長系統(tǒng)正常運(yùn)行時(shí)間,并提高大部署規(guī)模AI的彈性,使其能連續(xù)運(yùn)行數(shù)周甚至數(shù)月,并降低運(yùn)營成本。
- 安全人工智能:先進(jìn)的機(jī)密計(jì)算功能可在不影響性能的情況下保護(hù)AI模型和客戶數(shù)據(jù),并支持新的本機(jī)接口加密協(xié)議,這對(duì)于醫(yī)療保健和金融服務(wù)等隱私敏感行業(yè)至關(guān)重要。
- 解壓縮引擎:專用解壓縮引擎支持最新格式,加快數(shù)據(jù)庫查詢,提供數(shù)據(jù)分析和數(shù)據(jù)科學(xué)的最高性能。未來幾年,在企業(yè)每年花費(fèi)數(shù)百億美元的數(shù)據(jù)處理方面,將越來越多地由GPU加速。
售價(jià)方面,黃仁勛表示,B200的售價(jià)可能在3萬到4萬美元之間。這個(gè)定價(jià)低于一些分析師的預(yù)期,他希望新芯片的定價(jià)能吸引盡可能多的客戶。Mwcesmc
不過他后來又補(bǔ)充說,英偉達(dá)將把其新芯片納入更大的計(jì)算系統(tǒng)中,價(jià)格將根據(jù)它們提供的價(jià)值而變化。Mwcesmc
此外,他預(yù)計(jì)B200將于今年晚些時(shí)候發(fā)貨。黃仁勛說,英偉達(dá)正在與臺(tái)積電合作,以避免芯片封裝瓶頸,正是因封裝瓶頸致使其上一代旗艦AI處理器的出貨速度放緩。Mwcesmc
責(zé)編:Momoz