午夜性刺激在线观看免费,全免费A级毛片免费看无码,国产精品亚洲一区二区三区久久,亚洲精品无码久久久久,国产三区在线成人AV,亚洲乱码一区二区三区在线欧美,国产一区二区视频在线播放,久久亚洲精品无码观看不卡,精品九九人人做人人爱,少妇人妻无码精品视频app

廣告

大模型快速落地,國(guó)產(chǎn)芯片廠商在做什么?

大模型快速落地,國(guó)產(chǎn)芯片廠商在做什么?

2022-2023年的拐點(diǎn)已經(jīng)到來(lái)…

“2022-2023年的拐點(diǎn)是什么?是AI大模型的出現(xiàn)讓獲取知識(shí)的邊際成本開始變成固定成本。”奇績(jī)創(chuàng)壇創(chuàng)始人兼CEO陸奇在4月的一次演講中稱,“一定要記住,任何改變社會(huì)、改變產(chǎn)業(yè)的,永遠(yuǎn)是結(jié)構(gòu)性改變。這個(gè)結(jié)構(gòu)性改變往往是一類大型成本,從邊際成本變成固定成本。”iqEesmc

而ChatGPT能在歷史上第一次兩個(gè)月內(nèi)擁有1億活躍用戶,擋都擋不住,為什么?因?yàn)樗庋b了世界上所有知識(shí);有足夠強(qiáng)的學(xué)習(xí)和推理能力;涉及的領(lǐng)域足夠?qū)?,知識(shí)足夠深,又足夠好用。iqEesmc

加在一起,AI新范式的臨界點(diǎn)到了,拐點(diǎn)已經(jīng)到來(lái)。iqEesmc

算力缺口巨大

既然叫大模型,顯而易見,“大”必然是其最大的特點(diǎn)之一。有多大呢?安謀科技產(chǎn)品總監(jiān)楊磊表示,如果把具備一千多億個(gè)參數(shù)規(guī)模的GPT3.5模型存下來(lái),需要100GB的存儲(chǔ)空間,這當(dāng)然要比普通芯片內(nèi)部1MB SRAM的片上存儲(chǔ)規(guī)模大出許多。iqEesmc

“但這樣就到頭了嗎?顯然還沒有,因?yàn)榇蠹矣X得‘暴力出奇跡’,比如新的模型已經(jīng)達(dá)到了三千億個(gè)參數(shù),而且還在暴力地往上漲,暫時(shí)還看不到盡頭在哪里。”他說(shuō)。iqEesmc

另一方面,傳統(tǒng)的AI算法,比如美顏、人臉識(shí)別、刷臉等,都屬于卷積神經(jīng)網(wǎng)絡(luò)(CNN)架構(gòu)。但基于Tranformer架構(gòu)的GPT模型,其核心計(jì)算是大型矩陣圖版,從底層計(jì)算類型角度來(lái)講與傳統(tǒng)CNN算法并不一樣,適用于傳統(tǒng)CNN或語(yǔ)音處理的NPU,不一定擅長(zhǎng)高效地計(jì)算AIGC類模型。iqEesmc

天數(shù)智芯產(chǎn)品線總裁鄒翾認(rèn)為,對(duì)頭部企業(yè)來(lái)說(shuō),早期的GPT3大模型大概需要1萬(wàn)張英偉達(dá)GPU,但GPT4達(dá)到了100萬(wàn)億的參數(shù)規(guī)模,可能就需要3-5萬(wàn)張最先進(jìn)的GPU才能完成。對(duì)于這一領(lǐng)域出現(xiàn)的眾多跟隨者來(lái)說(shuō),勢(shì)必要在算力上不能輸于頭部企業(yè),甚至還要進(jìn)行更多的算力基礎(chǔ)設(shè)施投資才能實(shí)現(xiàn)追趕。iqEesmc

“關(guān)于大模型參數(shù)規(guī)模不斷上調(diào),其實(shí)我個(gè)人還有點(diǎn)不一樣的看法。”在鄒翾看來(lái),原因之一是現(xiàn)在業(yè)界還沒有把大模型的性能潛力全部挖掘出來(lái),現(xiàn)在的大模型只是一個(gè)起點(diǎn),頭部企業(yè)希望能夠率先抓住那些沒有被發(fā)現(xiàn)的能力制高點(diǎn),于是不斷調(diào)高通用大模型的參數(shù)以開發(fā)新功能;原因之二是隨著大模型的不斷迭代,最終不可能有那么多的算力投資都真正產(chǎn)生效益,他個(gè)人判斷未來(lái)1-2年內(nèi),當(dāng)前許多重復(fù)性的投資會(huì)看到一個(gè)收斂穩(wěn)定的閾值。iqEesmc

全功能GPU成AI大模型應(yīng)用關(guān)鍵

面對(duì)未來(lái)大規(guī)模的計(jì)算工作量需求,如今各大芯片廠商都在布局大型計(jì)算機(jī)體系結(jié)構(gòu)。摩爾線程創(chuàng)始人兼CEO張建中指出,對(duì)于提升性能來(lái)說(shuō),效率和管理能力比單個(gè)芯片的計(jì)算能力更為重要——就像特斯拉的電池并不是由一個(gè)大型電池組成,而是由許多小電池組合而成的一樣,GPU也將是如此,沒有人能制造一個(gè)巨大的GPU來(lái)運(yùn)行算法,但是卻可以通過組合多個(gè)GPU來(lái)完成任務(wù),并且提高效率和管理能力。因此,我們不必僅僅追求規(guī)模的擴(kuò)大(scale up),而是要追求規(guī)模的擴(kuò)展(scale out)。iqEesmc

“這也正是我們的優(yōu)勢(shì),GPU里面有成千上萬(wàn)個(gè)核心。將多個(gè)GPU組合在一起的原理也是類似的,其中涉及到空間、存儲(chǔ)、網(wǎng)絡(luò)和調(diào)度等各方面的能力,這些正是GPU的核心所在。”張建中說(shuō),現(xiàn)在很多的創(chuàng)新型應(yīng)用如AIGC、數(shù)字人、元宇宙里的3D圖象/圖形生成、自動(dòng)駕駛、機(jī)器人、數(shù)字孿生等,都是與“AI+圖形+元宇宙”場(chǎng)景相關(guān)的。所有的AI應(yīng)用最后落地給到用戶的時(shí)候,最終呈現(xiàn)出的是多模態(tài)化應(yīng)用場(chǎng)景,一定是圖像、圖形,而不只是文字。所以,全功能GPU將成為關(guān)鍵。iqEesmc

他進(jìn)一步解釋稱,為什么很多用戶會(huì)喜歡用全功能?因?yàn)槲覀儾荒芟拗朴脩艚裉熘荒芨蛇@件事,如果換一個(gè)代碼就不能用,那用戶肯定不愿意投。另一方面,如果GPU放在云端大的計(jì)算集群里,好幾億的投資只能換來(lái)一個(gè)應(yīng)用,成本太貴,但如果可以做100甚至1000個(gè)應(yīng)用,分?jǐn)傁聛?lái)成本自然就低了。所以從規(guī)模效應(yīng)講,通用性比專用性更有價(jià)值。iqEesmc

換句話說(shuō),全功能GPU雖然價(jià)格貴一些,但是它可以處理多種應(yīng)用,利用率高。相比較而言,ASIC芯片干一件事的效率非常高,但是做完就處于閑置狀態(tài)。對(duì)于超算中心來(lái)說(shuō),90%的利用率都不存在,這是極其浪費(fèi)成本的做法,超算算一次差不多要10億,如果是100%的利用率,成本平攤后將大幅降低成本。因此,重復(fù)利用率、整個(gè)資源率對(duì)于大型基建基礎(chǔ)設(shè)施來(lái)講非常重要。iqEesmc

鄒翾則認(rèn)為,通用GPU的優(yōu)勢(shì)源于“通用”、“易用”和“好用”。目前來(lái)看,國(guó)內(nèi)企業(yè)與美國(guó)頂級(jí)廠商的產(chǎn)品性能之間的確存在差距,尤其在旗艦級(jí)產(chǎn)品性能方面,品牌知名度也不夠。但好在國(guó)內(nèi)產(chǎn)品是可用的,實(shí)現(xiàn)了國(guó)產(chǎn)通用GPU產(chǎn)品從0到1的突破。iqEesmc

例如,日前天數(shù)智芯就宣布其天垓100加速卡算力集群,基于北京智源人工智能研究院70億參數(shù)的Aquila語(yǔ)言基礎(chǔ)模型,使用代碼數(shù)據(jù)進(jìn)行繼續(xù)訓(xùn)練,穩(wěn)定運(yùn)行19天,模型收斂效果符合預(yù)期,證明天數(shù)智芯有支持百億級(jí)參數(shù)大模型訓(xùn)練的能力。iqEesmc

在談及通用GPU落地前景時(shí),鄒翾希望“能用5-10年左右的時(shí)間追趕上國(guó)際同類主流產(chǎn)品的性能”,并且在人工智能、元宇宙、科學(xué)計(jì)算、天氣預(yù)報(bào)、分子動(dòng)力學(xué)、股票量化交易、投資等多個(gè)賽道取得成績(jī)。iqEesmc

邊緣側(cè)部署Transformer為什么難?

近幾年Transformer大有取代卷積神經(jīng)網(wǎng)絡(luò)(CNN)之勢(shì),因?yàn)樗梢垣@取全局特征,有一定的知識(shí)遷移性,能夠很好地適應(yīng)各種場(chǎng)景,不僅在COCO榜單上處于霸榜狀態(tài),很多以CNN為主的框架也已經(jīng)切換到了Transformer。iqEesmc

目前來(lái)看,Transformer大模型在云端主要還是通過GPU部署,在邊緣側(cè)、端側(cè)硬件支撐方面,則更多依賴NPU實(shí)現(xiàn)對(duì)神經(jīng)網(wǎng)絡(luò)的加速。“這倒不是指CPU不能運(yùn)行Transformer模型,只是它的運(yùn)行速度無(wú)法滿足實(shí)際應(yīng)用落地需求。”愛芯元智聯(lián)合創(chuàng)始人、副總裁劉建偉表示,之所以要強(qiáng)調(diào)速度,一是神經(jīng)網(wǎng)絡(luò)速度快,意味著終端設(shè)備可以運(yùn)行更多類型的智能網(wǎng)絡(luò),更智能;二是即便不需要跑那么多類型的網(wǎng)絡(luò),那么某種程度上就可以把神經(jīng)網(wǎng)絡(luò)規(guī)模做大,提高精度。iqEesmc

另一方面,盡管CNN和Transformer都屬于神經(jīng)網(wǎng)絡(luò),但Transformer的計(jì)算訪存比比CNN低,精度和靈活度高,而此前市面上的一些NPU主要針對(duì)CNN網(wǎng)絡(luò)做了一些過擬合的設(shè)計(jì),導(dǎo)致在部署Transformer網(wǎng)絡(luò)時(shí)遇到了功耗、效率等諸多問題,現(xiàn)在需要找到合適的新算力平臺(tái),并在算法側(cè)找到能降低大參數(shù)模型帶寬的新途徑。iqEesmc

其實(shí),Transformer大模型方向在2019年就有人提出,當(dāng)時(shí)在思路和訓(xùn)練方法上與傳統(tǒng)CNN也并無(wú)太大差別,只知道“上限更高”。但近兩年,Transformer被廣泛應(yīng)用到計(jì)算機(jī)視覺的物體分類領(lǐng)域(例如ViT、SwinT等),以及用在目標(biāo)檢測(cè)領(lǐng)域的DETR(DEtection TRansformer),而且隨著自然語(yǔ)言處理(NLP)領(lǐng)域的突飛猛進(jìn),大模型通過無(wú)監(jiān)督或是自監(jiān)督的方式進(jìn)行訓(xùn)練,正成為AI領(lǐng)域新的趨勢(shì)。iqEesmc

為此,考慮到如何在端側(cè)、邊緣側(cè)高效部署Transformer正成為用戶選擇平臺(tái)的核心考量。作為人工智能視覺感知芯片研發(fā)及基礎(chǔ)算力平臺(tái)公司,愛芯元智在今年3月正式推出的第三代高算力、高能效比的SoC芯片AX650N,為行業(yè)探索Transformer在端側(cè)、邊緣側(cè)落地方面做出了有益的嘗試。iqEesmc

楊磊表示,未來(lái)AIGC或大模型的場(chǎng)景肯定會(huì)潛移默化地影響到我們生活的方方面面,但從目前的實(shí)際狀況來(lái)看,動(dòng)輒千億/萬(wàn)億規(guī)模的模型參數(shù)、上億美元的生產(chǎn)工具部署成本、以及相對(duì)偏窄的帶寬,都給大模型落地IoT領(lǐng)域造成了實(shí)際困難。今后,結(jié)合一些特定的場(chǎng)景和應(yīng)用,對(duì)大模型進(jìn)行精簡(jiǎn),使其能在手機(jī)、PC、邊緣設(shè)備和汽車等端側(cè)IoT場(chǎng)景上實(shí)現(xiàn),會(huì)成為未來(lái)的發(fā)展方向。iqEesmc

中外用戶的需求差異

鄒翾同時(shí)討論了中國(guó)客戶和海外客戶在需求和使用習(xí)慣上的差異,認(rèn)為中國(guó)市場(chǎng)上大多數(shù)客戶仍然以快為主,“拿來(lái)主義”之風(fēng)仍然比較盛行,在軟件和應(yīng)用模式方面缺乏獨(dú)立創(chuàng)新。“對(duì)于硬件企業(yè)來(lái)說(shuō),一個(gè)難點(diǎn)在于如果用戶不愿意自己嘗試做一些原生性的創(chuàng)新,那我們就很難在體系支撐角度去提供創(chuàng)新,因?yàn)槲移髽I(yè)的需求首先是要看客戶需要什么。”iqEesmc

但中國(guó)在應(yīng)用場(chǎng)景上有著自己獨(dú)特的優(yōu)勢(shì),很多國(guó)內(nèi)頭部企業(yè)也正在思考如何讓大模型更好的使用起來(lái),創(chuàng)造出類似“新四大發(fā)明”的獨(dú)特應(yīng)用,實(shí)現(xiàn)原生技術(shù)的通用性。因此,底層技術(shù)與市場(chǎng)差異化的融合將成為關(guān)鍵,需要更多工程師、更多的創(chuàng)新、甚至是國(guó)家的機(jī)制引領(lǐng),來(lái)共同推動(dòng)全國(guó)產(chǎn)化進(jìn)程。iqEesmc

張建中表示,生成式AI領(lǐng)域有許多成功的機(jī)會(huì),并且在許多行業(yè)領(lǐng)域都有專業(yè)支持。因此,不可能只有一個(gè)模型能夠統(tǒng)一所有需求,而是需要多個(gè)模型。這就是為什么國(guó)外有那么多創(chuàng)業(yè)公司從事這個(gè)領(lǐng)域。而且國(guó)外的模型不一定適用于中國(guó)市場(chǎng),在國(guó)內(nèi),生成式AI創(chuàng)業(yè)的空間和機(jī)會(huì)都非常廣闊。iqEesmc

“對(duì)于我們來(lái)講,當(dāng)然是更好的機(jī)會(huì)。不管做訓(xùn)練、推理,大家都用更多算力,如果是只有一家來(lái)供應(yīng)的話,供應(yīng)的量將有限。再者,許多創(chuàng)業(yè)公司對(duì)金錢成本的控制都有需求,如果我們能夠提供好的方案且具有性價(jià)比的話,這個(gè)就是我們的機(jī)會(huì)。”張建中補(bǔ)充說(shuō),摩爾線程之所以要做摩筆馬良和智娛魔方這種偏向應(yīng)用層的產(chǎn)品,就是為了給客戶打樣,啟發(fā)用戶利用摩爾線程的全功能GPU可以做哪些比較有意義事情。iqEesmc

“我們的模型是在自己的平臺(tái)上訓(xùn)練的,不需要依靠任何人,就可以完成這些事情,所以我們既然能做,那么我們相信客戶也可以做。”iqEesmc

責(zé)編:Momoz
本文為國(guó)際電子商情原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。請(qǐng)尊重知識(shí)產(chǎn)權(quán),違者本司保留追究責(zé)任的權(quán)利。
邵樂峰
ASPENCORE中國(guó)區(qū)首席分析師。
  • 微信掃一掃,一鍵轉(zhuǎn)發(fā)

  • 關(guān)注“國(guó)際電子商情” 微信公眾號(hào)

近期熱點(diǎn)

廣告
廣告

EE直播間

更多>>

在線研討會(huì)

更多>>
国产乱人伦精品一区二区在线观看| 国产AⅤ无码专区久久精品国产| 69SEX久久精品国产麻豆| 国产精品久久久久乳精品爆| 偷偷做久久久久网站| 亚洲国产中文成人无码影片在线| 一本一道AⅤ无码中文字幕| 久久精品人人做人人爽97| 色欲精品人妻AV一区二区三区| 国产亚洲欧美日韩亚洲中文| √天堂资源在线中文8在线最新| 人妻熟妇久久久久久XXX| 免费无码黄动漫在线观看| 中文字幕不卡在线观看| 色综合天天综合婷婷伊人| 久久九九久精品国产日韩经典| 久久精品一区二区三区不卡| 国产乱伦片乱伦片乱伦片子| 捆绑走绳虐乳调教小说| 精品国产乱码一区二区三区,久久国产精品| 亚洲av日韩av高潮潮喷无码| 国语对白露脸XXXXXX,亚州av综合色区无码一区| 欧美疯狂做受XXXXX高潮| 国产手机在线亚洲精品观看| 中文字幕人成乱码中文乱码| 办公室双腿打开揉弄在线观看| 人妻无码中文久久久久专区| 国产乱子伦精品无码码专区| 日韩人妻潮喷视频网站| 亚洲国产成人超福利久久精品| 亚洲妓女综合网9页| 非洲黑妞下面好紧水多| 小十四萝裸体洗澡自慰| 少妇一级婬片免费放狠狠干狠狠躁| 国产精品99无码一区二区| 国模无码视频一区二区三区| 天天操B夜夜办骚妇影院 | 99久久精品免费看国产一区二区| 粗大的内捧猛烈进出视频| 日韩精品免费在线观看视频| 精品无码人妻一区二区三区品|