近日,Linux 基金會宣布,包括AMD、Arista、Broadcom、Cisco、Eviden(Atos 旗下公司)、HPE、Intel、Meta和Microsoft等企業(yè)作為創(chuàng)始成員的超以太網(wǎng)聯(lián)盟((Ultra Ethernet Consortium,UEC) 正式成立。UEC將提供基于以太網(wǎng)的開放、可互操作、高性能的全通信堆棧架構(gòu),以滿足大規(guī)模人工智能和高性能計算不斷增長的網(wǎng)絡(luò)需求。rBLesmc
人工智能 (AI) 和高性能計算 (HPC) 工作負載正在快速發(fā)展,需要一流的功能、性能、互操作性和總體擁有成本,同時又不犧牲開發(fā)人員和最終用戶的友好性。超以太網(wǎng)解決方案堆棧將利用以太網(wǎng)的普遍性和靈活性來處理各種工作負載,同時具有可擴展性和成本效益。rBLesmc
rBLesmc
rBLesmc
圖片來源:Linux 基金會rBLesmc
“這并不是要徹底改革以太網(wǎng),”超以太網(wǎng)聯(lián)盟主席 J Metz 博士說。“這是關(guān)于調(diào)整以太網(wǎng)以提高具有特定性能要求的工作負載的效率。我們正在研究每一層——從物理層一直到軟件層——以找到大規(guī)模提高效率和性能的最佳方法。”rBLesmc
該聯(lián)盟的技術(shù)目標是開發(fā)規(guī)范、API 和源代碼來定義:rBLesmc
- 以太網(wǎng)通信的協(xié)議、電信號和光信號特征、應(yīng)用程序接口和/或數(shù)據(jù)結(jié)構(gòu)。 鏈路級和端到端網(wǎng)絡(luò)傳輸協(xié)議可擴展或替換現(xiàn)有鏈路和傳輸協(xié)議。
- 鏈路級和端到端擁塞、遙測和信令機制;上述各項均適用于人工智能、機器學習和高性能計算環(huán)境。
- 軟件、存儲、管理和安全結(jié)構(gòu)可促進各種工作負載和操作環(huán)境。
- UEC 將遵循模塊化、兼容、可互操作層和緊密集成的系統(tǒng)方法,為要求苛刻的工作負載提供全面改進。
- 創(chuàng)始公司正在為聯(lián)盟的四個工作組做出極具價值的貢獻:物理層、鏈路層、傳輸層和軟件層。
有分析指出,超以太網(wǎng)聯(lián)盟(UEC)的成立,意味著將與InfiniBand在AI和HPC領(lǐng)域同臺競爭。rBLesmc
數(shù)據(jù)顯示,InfiniBand 起源于 1999 年,由Future I/O 和 Next Generation I/O (NGIO) 合并而成。NGIO 由Intel主導,并于 1998 年發(fā)布了規(guī)范 , Sun Microsystems和Dell也加入其中。Future I/O 得到了康柏(后被惠普收購)、IBM和惠普的支持。InfiniBand 架構(gòu)規(guī)范的 1.0 版于 2000 年發(fā)布。rBLesmc
根據(jù)《國際電子商情》查詢InfiniBand貿(mào)易協(xié)會(IBTA)官網(wǎng)信息,IBTA成員主要已經(jīng)囊括了AMD、Broadcom、Cisco、HPE、Intel這些UEC創(chuàng)始會員企業(yè)。其中,HPE、Intel還是UEC聯(lián)盟指導委員會成員(其他還包括IBM、NVIDIA)。rBLesmc
rBLesmc
rBLesmc
InfiniBand成員,IBTA官網(wǎng)截圖rBLesmc
rBLesmc
InfiniBand 連接技術(shù)已經(jīng)超算中盛行rBLesmc
到 2014 年,InfiniBand 已成為超級計算機最流行的內(nèi)部連接技術(shù)。2016 年,有報道稱Oracle(Mellanox 的投資者)可能會設(shè)計自己的 InfiniBand 硬件。2019年,Nvidia收購了最后一家InfiniBand產(chǎn)品獨立供應(yīng)商Mellanox。rBLesmc
2022 年 7 月 ,IBTA宣布,在同年6月公布的全球超算TOP500中,197個系統(tǒng)部署了InfiniBand,同比增長 17%。InfiniBand還連接了Top100中的62個,使其成為世界頂級超級計算機中使用最多的高速互連。rBLesmc
InfiniBand 在 TOP500 中的突出表現(xiàn)表明,它有能力提供世界頂級系統(tǒng)所需的速度、低延遲和可擴展性。利用 InfiniBand 和融合以太網(wǎng) RDMA (RoCE) 等遠程直接內(nèi)存訪問 (RDMA) 結(jié)構(gòu)還可以為數(shù)據(jù)中心提供可靠性、效率以及高度互操作性的環(huán)境,以便這些系統(tǒng)進行擴展。rBLesmc
rBLesmc
InfiniBand 路線圖,圖片來源:IBTA官網(wǎng)rBLesmc
責編:Zengde.Xia