作為國內首款實現前裝量產的百TOPS大算力AI芯片,地平線“征程5”芯片從2019年Q1開始立項研發(fā),2021年2月-5月間在臺積電順利tapeout,15小時內完成了全部的核心功能測試,并一次性流片成功。同年7月,“征程5”系列正式發(fā)布,開啟了中國大算力芯片具備里程碑意義的新時代。9iOesmc
2022年4月,“征程5”在實車環(huán)境下完成了城區(qū)復雜場景自動駕駛的閉環(huán)驗證;6月,多家軟件生態(tài)伙伴開始陸續(xù)推出基于“征程5”開發(fā)的高等級自動駕駛方案與原型Demo。根據后續(xù)規(guī)劃,年內,“征程5”將在完成全部車規(guī)可靠性測試與全面功能安全認證工作后,達到量產成熟水平,基于“征程5”芯片的首個量產項目也會在年底正式量產(SOP)。9iOesmc
“如果把這場大算力自動駕駛的比賽比喻為世界杯,那么地平線與英偉達已經率先進入百TOPS芯片前裝量產的階段,并提前鎖定了決賽席位。”但地平線高級市場總監(jiān)陳遙指出,這不是一場不戰(zhàn)而勝的比賽,量產決賽前的每一個環(huán)節(jié)——AI算力、安全可靠性、開發(fā)環(huán)境、算法驗證、生態(tài)支持、直至量產,都充滿了挑戰(zhàn)。9iOesmc
算力大,更要算的快
地平線聯(lián)合創(chuàng)始人&CTO黃暢日前在“征程5技術開放日”上接受媒體采訪時表示,“提升有效算力這條路是沒有止境的。”當前,自動/智能駕駛領域行業(yè)的基礎算力需求是:L2級,10TOPS左右;L2+,幾十TOPS;L3,100TOPS以上;L4,1000TOPS以上。9iOesmc
“地平線關注峰值算力的持續(xù)提升,但本質上更加關注有效算力的提升。就我個人看來,L2+級最好就能達到百TOPS量級。因為隨著全場景自動駕駛的復雜度越來越高,沒有足夠有效的算力進行處理,將很難滿足實際需求。“ 9iOesmc
9iOesmc
地平線聯(lián)合創(chuàng)始人&CTO黃暢(左)、地平線智能駕駛產品規(guī)劃與市場高級總監(jiān)呂鵬(右)接受媒體采訪9iOesmc
最新數據顯示,在硬件架構和算法都沒有改變的情況下,征程5的AI計算效能從最初發(fā)布時的1283FPS提升到了當前的1531FPS。黃暢將這種AI計算性能“可持續(xù)成長”現象的幕后推手,歸結為軟件架構的改變。9iOesmc
9iOesmc
“我們認為評估一顆AI芯片效能最合理的指標就是FPS/Watt或FPS/$,也就是芯片為了達成AI處理性能所付出的功耗和成本。”黃暢說,地平線的理念始終是能讓軟件做的事情盡可能讓軟件做,硬件做簡單、極致、高效且容易被軟件靈活調用的功能。9iOesmc
他將FPS/Watt或FPS/$指標拆解成三個部分,如下圖所示,左邊一列的TOPS/Watt & TOPS/$數值由硬件架構決定,通過芯片架構和制程工藝的演進可以持續(xù)改善;右邊一列的FPS(Frames Per Second),即為實現單位有效算力時的算法處理速度,更能夠反映AI芯片的真實計算性能。FPS由算法架構決定,也被稱之為算法領域的新摩爾定律,大約會在9-14個月的時間內將AI任務需要的計算次數和復雜度降低一半。9iOesmc
中間一列的Utilization則屬于是軟件架構,也是征程5性能提升的關鍵。在黃暢看來,算法是一個客觀大趨勢,不隨計算平臺公司的意志而轉移,只可能去預判、去識別,但很難改變。所以當芯片公司將架構和算法鎖定之后,就需要編譯器持續(xù)的對算法進行編譯、拆解、重組、部署、運行和調度,反復優(yōu)化,提升性能。9iOesmc
9iOesmc
依照這個評估標準,在典型分類模型下,征程5在處理單幀輸入的百萬像素大圖時,其性能達英偉達Xavier的 6.2倍;針對高效模型(EfficientNet)更接近自動駕駛場景的物體檢測,同精度下,征程5的性能是Xavier的9倍多,Orin的近3倍;能效比方面,在達到更高性能的條件下,征程5的能效比接近Orin的9倍。9iOesmc
9iOesmc
9iOesmc
自動駕駛規(guī)則的改變
數據提升背后折射出的,是大算力AI芯片開發(fā)理念的巨大轉變,意味著自動駕駛正逐步由數據驅動替代傳統(tǒng)基于規(guī)則的計算。9iOesmc
目前主流的自動駕駛方案大致可以分為四個階段,分別是廣義感知、地圖融合、規(guī)劃和控制。每個階段的任務在軟件1.0時代實現用規(guī)則,即我們對世界的理解變成以規(guī)則描述的計算,然后在不同程度上過渡到用數據驅動的軟件2.0,也就是用深度學習、神經網絡的方式訓練得到一個非常復雜的模型,去替代人手工設定的規(guī)則,達成相應的任務目標。9iOesmc
9iOesmc
但在實際應用中,包括地平線和特斯拉在內的企業(yè),都比較激進的將這四個階段的pipeline融合,把更多的信息融合在一起。這樣做的好處,一方面能夠大幅提升整個自動駕駛系統(tǒng)的精度、魯棒性、適用度,另一方面則是可以大幅改進算法迭代的速度。9iOesmc
黃暢認為,在未來,廣義感知幾乎百分之百都是靠數據驅動的,而在規(guī)劃和控制階段80%~90%也是靠數據驅動完成的,如必要的交通規(guī)則,包括人為專門制定的一些規(guī)范性要求,只需要極少量的規(guī)則。所以面向未來的自動駕駛算法,支持數據驅動、神經網絡模型推理計算的專用芯片占比會顯著增加,而CPU這樣的處理器的需求量則不會顯著增加。9iOesmc
他為此提出了這樣的觀點,即,“加速高等級自動駕駛落地的根本途徑,是范式級的智能算法和支持這種算法的硬件體系相結合,也就是我們經常說的軟硬結合。”通過軟硬協(xié)同優(yōu)化的方式,在首重效能的情況下,地平線打造出兼顧靈活的新一代AI計算架構。9iOesmc
9iOesmc
被命名為“貝葉斯”的地平線第三代架構BPU(Brain Processing Unit)是實現軟硬結合理念的載體,最大特點是高性能、低延遲、低能耗。地平線通過聚焦最新的神經網絡架構來服務真實的自動駕駛場景,堅持高度軟硬件的并行化和近存計算等舉措,最大程度優(yōu)化內存占有與訪存,靈活訪問高帶寬的存儲,確保BPU在非常靈活的條件下提供足夠好的算力密度和能效比。9iOesmc
9iOesmc
黃暢特別強調稱,“軟硬結合與軟硬解耦不矛盾”。軟硬結合是在計算平臺的設計階段將軟件和硬件架構結合起來,更加高效地去支持未來的算法發(fā)展趨勢;軟硬解耦是在計算平臺開發(fā)出來后,把硬件和軟件給到開發(fā)者去使用的時候,是要支持軟硬解耦的。換言之,是算法、應用開發(fā)和計算平臺的解耦。9iOesmc
量產,檢驗智能駕駛AI芯片的首要標準
從自動駕駛芯片本身的評估來看,符合ASIL-B產品認證標準的征程5可以稱之為是“全面滿足高等級自動駕駛量產需求”一款芯片。它具有強大的深度學習計算能力,多樣化計算組合、豐富的傳感器接口和通訊能力,完全針對自動駕駛場景,滿足全車電子電氣架構的需求,領先的自動駕駛算法閉環(huán)驗證。9iOesmc
9iOesmc
但地平線智能駕駛產品規(guī)劃與市場高級總監(jiān)呂鵬更強調開發(fā)平臺的“完整性”和“成熟度”。9iOesmc
“智能駕駛行業(yè)當前的核心矛盾是什么?是汽車智能化從開發(fā)到交付全流程的效率低下。“呂鵬說,如果沒有操作系統(tǒng)和開發(fā)工具鏈支持,一顆空有算力的AI芯片其實與一塊磚頭無異,不但無法運行,也無法直接降低整體的開發(fā)效率。9iOesmc
而為了能跟車企達成前裝量產的合作,支撐車企各類車型的量產落地,自動駕駛芯片設計者還必須考慮能效比、算力和效率、芯片適配性、靈活性和全面性、開發(fā)便捷性、安全認證等多項關鍵評估指標。9iOesmc
于是,地平線提供了從最下層的開發(fā)套件與參考設計,到基礎操作系統(tǒng)、應用中間件,再到各類算法、AI芯片及軟件棧的一整套豐富、成熟、完善的系統(tǒng)工具,希望能夠幫助用戶大幅降低在地平線芯片平臺上的開發(fā)難度、花費的時間、投入的成本,提升開發(fā)效率。9iOesmc
9iOesmc
例如在AI開發(fā)套件陣營中,除了征程5芯片,還包括了征程5 EVM開發(fā)版、征程5 SOM、PCIe形式的集群加速卡、Matrix 5整車智能計算參考平臺。其中,Matrix 5是更接近于量產級的參考設計,包括單顆/雙顆/4顆征程5硬件方案,對應算力從128TOPS到最高512TOPS,而且這些硬件方案都提供了相應的原理圖參考設計,可以加快整個行業(yè)使用它快速地設計好自身的產品。9iOesmc
9iOesmc
在開發(fā)工具方面,地平線有天工開物平臺和艾迪平臺。其中天工開物的AI工具鏈可以提供非常高效的自動化環(huán)節(jié),幫助客戶以最小的精度損失實現量化的過程;AI的艾迪開發(fā)工具平臺是地平線面向軟件2.0趨勢的一個背后引擎,它是一個能進行高效AI訓練、測試和管理的工具平臺。9iOesmc
呂鵬表示,生態(tài)建設不是一朝一夕,地平線花了很多年的時間一直建設自己的軟件生態(tài),工具鏈有了上百家合作伙伴的賦能經驗,他們在使用中給地平線提供了很多反饋和輸入,促使開發(fā)人員不斷進行迭代,逐漸形成非常多的參考樣例、參考算法,從而幫助客戶能夠更加更加快速便捷地使用工具鏈。9iOesmc
9iOesmc
目前,已有包括大陸集團、東軟睿馳、立訊集團、聯(lián)成開拓在內的10家合作伙伴推出了基于Matrix 5相關參考設計的域控產品;近期,地平線還官方授權了3家硬件IDH合作伙伴:映馳科技、金脈、天準;還有多家合作伙伴在行業(yè)中拿到了車型的定點,面向相關的量產項目去進行相關的開發(fā)和交付。9iOesmc
結語
總體來看,地平線的定位還是Tier2,希望通過芯片+工具鏈和平臺打造開放共贏的合作模式,希望圍繞地平線的芯片平臺,有越來越多的生態(tài)合作伙伴和資源,從而支持Tier1和OEM完成他們的量產和交付。9iOesmc
而之所以說大算力芯片已經進入“決賽”階段,呂鵬認為,這是由芯片軟硬件體系成熟度、量產能力和生態(tài)壁壘三大核心要素共同決定的。百萬級的出貨、處理問題的方法論、體系流程的建設、對自動駕駛理解的Know-How,構成了決賽選手非常強的隱性競爭力,“對新玩家來說,進入的挑戰(zhàn)非常大。”9iOesmc
責編:Elaine