算力是人工智能的“大腦”,支撐海量數(shù)據(jù)訓(xùn)練和復(fù)雜模型運行。當(dāng)前算力“大腦”的重大挑戰(zhàn)是低延遲和高吞吐量,高速網(wǎng)絡(luò)是解決這一挑戰(zhàn)的主要路徑。
3月12日,中科曙光宣布實現(xiàn)國產(chǎn)高端原生RDMA(遠(yuǎn)程直接內(nèi)存訪問)技術(shù)重大突破,正式發(fā)布首款全棧自研400G無損高速網(wǎng)絡(luò)——scaleFabric。該產(chǎn)品基于原生RDMA架構(gòu),從底層的112G SerDes IP、硬件設(shè)備到上層的管理軟件實現(xiàn)100%自研,填補了國內(nèi)數(shù)據(jù)中心高速網(wǎng)絡(luò)領(lǐng)域的空白。
中國工程院院士鄔賀銓在發(fā)布會上表示,高速網(wǎng)絡(luò)作為算力基礎(chǔ)設(shè)施的核心關(guān)鍵技術(shù),長期被國外技術(shù)壟斷,成為算力產(chǎn)業(yè)發(fā)展的核心瓶頸之一,其自主可控性直接關(guān)系到國家算力基礎(chǔ)設(shè)施的安全與發(fā)展質(zhì)量。中科曙光高級副總裁李斌說,(算力集群)從萬卡到十萬卡,最核心的技術(shù)突破不在計算節(jié)點,而在互聯(lián)系統(tǒng)。
近年來,人工智能大模型的發(fā)展可謂日新月異,萬億級參數(shù)規(guī)模大模型已經(jīng)不斷面世,帶來算力需求的不斷提升,萬卡級智算集群乃至更大規(guī)模的算力集群走向規(guī)模化部署。要發(fā)揮大規(guī)模超算系統(tǒng)、智算系統(tǒng)的最佳性能,算力、存儲、網(wǎng)絡(luò)三大要素須協(xié)調(diào)有效運行。
在大模型的大規(guī)模分布式訓(xùn)練中,網(wǎng)絡(luò)通信耗時占比已達到30-50%,網(wǎng)絡(luò)性能直接影響算力系統(tǒng)的整體效率。這意味著大規(guī)模算力系統(tǒng)需要網(wǎng)絡(luò)同時具備超低延遲、超高帶寬與無損傳輸能力,而RDMA高速網(wǎng)絡(luò)正是智算集群的“算力大動脈”。
RDMA網(wǎng)絡(luò)已成為大規(guī)模智算集群的基本需求,憑借零丟包、高帶寬、低延遲等特征,可極大提升通信效率。目前,RDMA在國內(nèi)外已形成三大技術(shù)路線,分別是InfiniBand(IB,一種高性能計算和數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu))、RoCE(RDMA over Converged Ethernet)和iWARP(Internet Wide Area RDMA Protocol)。
其中,InfiniBand憑借低時延與原生無損傳輸能力,在全球頂級超算與AI集群中被廣泛采用。根據(jù)TOP500榜單,目前全球約60%的高性能計算系統(tǒng)采用InfiniBand網(wǎng)絡(luò)架構(gòu)。
然而,從高速SerDes(一種顯著提升數(shù)據(jù)吞吐量的技術(shù)) IP、核心芯片到IB網(wǎng)卡、IB交換機等設(shè)備,InfiniBand相關(guān)產(chǎn)業(yè)鏈基本被海外廠商壟斷,封閉且成本高昂。要競逐人工智能,必占據(jù)算力高地,自主高性能RDMA網(wǎng)絡(luò)是其中必須攻克的“堡壘”。
新發(fā)布的中科曙光scaleFabric是國內(nèi)首款原生無損RDMA高速網(wǎng)絡(luò),面向超大規(guī)模智算集群設(shè)計,從核心關(guān)鍵IP、交換芯片、網(wǎng)卡到交換機、驅(qū)動與管理軟件均實現(xiàn)自主研發(fā),構(gòu)建起從硬件到軟件的完整技術(shù)體系。其中,硬件主要包括scaleFabric400單口標(biāo)準(zhǔn)網(wǎng)卡、scaleFabric400 1U 80口液冷交換機、scaleFabric400 2U 80口的風(fēng)冷交換機。
中科曙光高速網(wǎng)絡(luò)互聯(lián)產(chǎn)品部總工程師萬偉介紹,scaleFabric的核心是兩顆高速網(wǎng)絡(luò)芯片,即scaleFabric400網(wǎng)卡芯片與caleFabric400交換芯片,兩顆芯片均采用自研的112G開闊的高速SerDes IP。
從發(fā)布會現(xiàn)場了解的產(chǎn)品信息來看,scaleFabric全面對標(biāo)英偉達NDR(400G InfiniBand),部分指標(biāo)實現(xiàn)趕超。例如,與英偉達NDR相比,交換機端口密度提升25%,網(wǎng)卡最大QP(Queue Pair,隊列對,通信基本單元)數(shù)支持提升100%,單子網(wǎng)(一種網(wǎng)絡(luò)部署方式,不涉及路由,設(shè)備間直接通信)互連規(guī)模是傳統(tǒng)IB的2.33倍,可輕松支持最大11.4萬卡集群部署,同時網(wǎng)絡(luò)總成本可降低30%。
這意味著,國產(chǎn)高速網(wǎng)絡(luò)已與英偉達NDR比肩。性能對標(biāo),但更具性價比。而在實踐驗證、產(chǎn)業(yè)生態(tài)、用戶遷移方面,scaleFabric已漸次展開。
在實際應(yīng)用中,scaleFabric目前已部署于位于鄭州的國家超算互聯(lián)網(wǎng)核心節(jié)點,支撐三套萬卡級scaleX智算集群上線運行,總規(guī)模達3萬卡。運行數(shù)據(jù)顯示,該網(wǎng)絡(luò)系統(tǒng)穩(wěn)定運行,可支持跨POD組網(wǎng)(通常指含多個機柜的一個?物理部署單元?,多個 POD可橫向擴展形成超大規(guī)模集群)及大規(guī)模并行訓(xùn)練任務(wù),為國產(chǎn)原生無損RDMA網(wǎng)絡(luò)在高端智算基礎(chǔ)設(shè)施中的應(yīng)用提供了實踐驗證。
在產(chǎn)業(yè)生態(tài)方面,發(fā)布會上正式成立光合組織高性能計算專委會AIDC高速網(wǎng)絡(luò)工作組,發(fā)布高速網(wǎng)絡(luò)生態(tài)合作計劃,主要包含三大工作,一是標(biāo)準(zhǔn)建設(shè),聯(lián)合國內(nèi)合作伙伴建立相關(guān)標(biāo)準(zhǔn);二是技術(shù)開放,打造生態(tài)適配底座,讓更多用戶使用,打磨產(chǎn)品;三是聯(lián)合更多科研力量,以產(chǎn)業(yè)模式推動發(fā)展。
在用戶遷移方面,萬偉指出,scaleFabric提供原生接口,可以全面兼容各種通信庫,無縫兼容各種HPC和AI的應(yīng)用,各種大模型訓(xùn)練可以在不改代碼的情況下直接遷移到scaleFabric系統(tǒng)上來,可以做到應(yīng)用無感。
2019年英偉達完成對Mellanox(邁絡(luò)思)收購,掌握了全球大部分InfiniBand市場,構(gòu)建了InfiniBand從芯片到通信庫的完整閉環(huán)生態(tài),但在同時,InfiniBand有自己的協(xié)議、標(biāo)準(zhǔn)組織,這是開放的。中科曙光的策略,就是在繼承InfiniBand開放性的基礎(chǔ)上,從產(chǎn)品、技術(shù)、商業(yè)模式等層面全面開放,“反其道而行”。
中國科學(xué)院計算技術(shù)研究所研究員王展表示,科學(xué)智能發(fā)展到現(xiàn)在,缺乏一個底層計算系統(tǒng)的支撐,需要計算芯片、互聯(lián)芯片,推動真正的科學(xué)發(fā)展?,F(xiàn)在及未來將能在曙光的產(chǎn)品里進一步做科學(xué)研究上的優(yōu)化。
科大訊飛股份有限公司AI工程院智算基礎(chǔ)設(shè)施架構(gòu)師鮑中帥說,科大訊飛堅持開放協(xié)作、自主創(chuàng)新之路,將與中科曙光一起協(xié)同破局,加速人工智能在千行百業(yè)落地應(yīng)用。
北京科技大學(xué)計算機與通信工程學(xué)院的儲根深介紹,通過運行最新的流體模擬、輻照材料分子動力學(xué)和物理模擬軟件,感受到scaleFabric的性能和穩(wěn)定性,沒有遇到性能抖動等任何網(wǎng)絡(luò)方面的問題。
當(dāng)下,中國人工智能已從科技攻關(guān)走向場景落地,從“關(guān)鍵變量”成為經(jīng)濟高質(zhì)量發(fā)展的“強勁增量”。剛剛發(fā)布的“十五五”規(guī)劃”提出了“新基建”五大方向,全國一體化算力網(wǎng)排在首位?!丁叭斯ぶ悄?制造”專項行動實施意見》提出要“強化人工智能算力供給”。
以scaleFabric為代表的國產(chǎn)原生RDMA在超大規(guī)模智算集群中的落地應(yīng)用,表明這一技術(shù)路線正逐步走向成熟,國產(chǎn)高性能網(wǎng)絡(luò)產(chǎn)業(yè)生態(tài)也正在加速形成,以“技術(shù)自覺”補齊了我國智算基礎(chǔ)設(shè)施中的關(guān)鍵一環(huán),夯實了“人工智能+”算力基石。
“期待在IB的技術(shù)路線能實現(xiàn)技術(shù)上的國產(chǎn)化替代?!崩畋笳f。
轉(zhuǎn)自:中國工業(yè)新聞網(wǎng)
【版權(quán)及免責(zé)聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時須獲得授權(quán)并注明來源“中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個人觀點,不代表本網(wǎng)觀點和立場。版權(quán)事宜請聯(lián)系:010-65363056。
延伸閱讀