9月5日,中科曙光在2025世界智能產(chǎn)業(yè)博覽會(huì)上發(fā)布了國(guó)內(nèi)首個(gè)基于AI計(jì)算開(kāi)放架構(gòu)設(shè)計(jì)的產(chǎn)品--曙光AI超集群系統(tǒng)。
記者在現(xiàn)場(chǎng)了解到,這一AI超集群系統(tǒng)以GPU為核心,實(shí)現(xiàn)了"算、存、網(wǎng)、電、冷、管、軟"一體化緊耦合設(shè)計(jì),具備"超高性能、超高效率、超高可靠、全面開(kāi)放"四大特點(diǎn),可為萬(wàn)億參數(shù)大模型訓(xùn)練推理、行業(yè)大模型微調(diào)、多模態(tài)大模型開(kāi)發(fā)、AI4S等場(chǎng)景提供高效算力底座。
據(jù)介紹,曙光AI超集群系統(tǒng)具有高性能、高效率、高可靠、全面開(kāi)放的技術(shù)特點(diǎn)。比如,在性能方面,單機(jī)柜可搭載96張GPU卡、算力規(guī)模達(dá)百P級(jí)、訪(fǎng)存總帶寬超180TB/s,支持多精度、混合精度運(yùn)算以及百萬(wàn)卡超大集群擴(kuò)展;效率方面,千卡集群大模型訓(xùn)練推理性能達(dá)到業(yè)界主流水平2.3倍,開(kāi)發(fā)效率提升4倍。
當(dāng)前,伴隨AI大模型快速演進(jìn)以及全球IT產(chǎn)業(yè)生態(tài)體系調(diào)整,國(guó)內(nèi)AI算力領(lǐng)域面臨高端算力供給不足、國(guó)產(chǎn)加速卡性能差距大、算力成本高、自主軟硬件生態(tài)不成熟等挑戰(zhàn)。而發(fā)展更大規(guī)模、更高效智算集群來(lái)彌補(bǔ)國(guó)產(chǎn)單卡算力差距以突破算力瓶頸,打造開(kāi)放式、標(biāo)準(zhǔn)化、高效率的算力集群,以實(shí)現(xiàn)智算集群的易用與可控成本,正逐漸成為業(yè)界共識(shí)。
值得關(guān)注的是,相比封閉系統(tǒng),曙光AI超集群系統(tǒng)不僅通過(guò)緊耦合設(shè)計(jì)像一臺(tái)計(jì)算機(jī)般高效工作,還支持多品牌AI加速卡以及兼容主流軟件生態(tài),為用戶(hù)提供更多開(kāi)放性選擇,并降低硬件成本和軟件開(kāi)發(fā)適配成本,保護(hù)前期投資。
中科曙光總裁助理、智能計(jì)算產(chǎn)品事業(yè)部總經(jīng)理杜夏威表示,克服國(guó)內(nèi)AI算力多維挑戰(zhàn),需匯聚芯片、計(jì)算系統(tǒng)、大模型等產(chǎn)業(yè)鏈多方力量,構(gòu)建開(kāi)放AI計(jì)算架構(gòu)并拉通產(chǎn)業(yè)間跨層協(xié)作,以打破"技術(shù)墻"與"生態(tài)墻"。據(jù)他透露,依托AI超集群系統(tǒng),中科曙光將開(kāi)放AI存儲(chǔ)優(yōu)化能力、液冷基礎(chǔ)設(shè)施設(shè)計(jì)規(guī)范、DeepAI基礎(chǔ)軟件棧等三項(xiàng)技術(shù)能力,助力合作伙伴、重點(diǎn)用戶(hù)在AI應(yīng)用存儲(chǔ)性能加速、液冷超節(jié)點(diǎn)系統(tǒng)設(shè)計(jì)、GPU開(kāi)發(fā)統(tǒng)一開(kāi)發(fā)框架等方面獲得高級(jí)別技術(shù)共享、深度定制優(yōu)化與專(zhuān)業(yè)技術(shù)支持。(記者 楊鵬岳)
轉(zhuǎn)自:中國(guó)電子報(bào)
【版權(quán)及免責(zé)聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時(shí)須獲得授權(quán)并注明來(lái)源“中國(guó)產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個(gè)人觀點(diǎn),不代表本網(wǎng)觀點(diǎn)和立場(chǎng)。版權(quán)事宜請(qǐng)聯(lián)系:010-65363056。
延伸閱讀

版權(quán)所有:中國(guó)產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)京ICP備11041399號(hào)-2京公網(wǎng)安備11010502035964