近日,由中國信息通信研究院牽頭研制的《大規(guī)模預(yù)訓(xùn)練模型技術(shù)和應(yīng)用評估方法》5項(xiàng)行業(yè)標(biāo)準(zhǔn)獲批發(fā)布。
該系列標(biāo)準(zhǔn)覆蓋大模型的開發(fā)、管理、運(yùn)營等多個階段,主要包括模型開發(fā)、能力評估、應(yīng)用成效、運(yùn)營管理和可信要求5部分,為大模型技術(shù)和產(chǎn)品的研發(fā)測試及應(yīng)用推廣提供了重要參考。該系列標(biāo)準(zhǔn)的發(fā)布與實(shí)施,將進(jìn)一步健全大模型標(biāo)準(zhǔn)體系,加速大模型技術(shù)創(chuàng)新與應(yīng)用落地,為"人工智能﹢"行動的深入推進(jìn)提供堅(jiān)實(shí)支撐。
《大規(guī)模預(yù)訓(xùn)練模型技術(shù)和應(yīng)用評估方法 第1部分:模型開發(fā)》規(guī)定了大模型在開發(fā)過程中的能力要求,旨在評估數(shù)據(jù)管理、模型訓(xùn)練、模型管理和模型部署四大維度的規(guī)范性與成熟度,涵蓋數(shù)據(jù)獲取與處理、訓(xùn)練方式與框架、版本回溯、模型微調(diào)與轉(zhuǎn)換等關(guān)鍵能力。
《大規(guī)模預(yù)訓(xùn)練模型技術(shù)和應(yīng)用評估方法 第2部分:模型能力》規(guī)定了大模型的技術(shù)和服務(wù)能力要求,旨在通過智能語義、視覺、語音及跨模態(tài)等多方面任務(wù)評估大模型的技術(shù)能力,以及大模型在服務(wù)穩(wěn)定性、魯棒性、響應(yīng)時間、開放程度和并發(fā)性等方面的服務(wù)成熟度。
《大規(guī)模預(yù)訓(xùn)練模型技術(shù)和應(yīng)用評估方法 第3部分:模型應(yīng)用》規(guī)定了大模型在應(yīng)用階段的能力要求,旨在評估工程路徑、運(yùn)營能力、管理能力和服務(wù)能力等方面的成熟度,包括大模型的知識庫管理、工具鏈完備性及應(yīng)用服務(wù)的安全可靠性。
《大規(guī)模預(yù)訓(xùn)練模型技術(shù)和應(yīng)用評估方法 第4部分:可信要求》規(guī)定了大模型全生命周期的可信能力要求,旨在評估技術(shù)層面的數(shù)據(jù)可信、算法模型可信、基礎(chǔ)設(shè)施可信能力,以及業(yè)務(wù)層面的應(yīng)用可控性和業(yè)務(wù)可信度。
《大規(guī)模預(yù)訓(xùn)練模型技術(shù)和應(yīng)用評估方法 第5部分:模型運(yùn)營》規(guī)定了大模型工程化落地和運(yùn)營階段的能力要求,旨在評估數(shù)據(jù)工程、模型調(diào)優(yōu)、模型交付、服務(wù)運(yùn)營以及平臺資源管理調(diào)度等方面的能力。
據(jù)介紹,近年來,中國信息通信研究院積極踐行標(biāo)準(zhǔn)引領(lǐng)人工智能產(chǎn)業(yè)高質(zhì)量發(fā)展的目標(biāo),深入開展大模型關(guān)鍵技術(shù)及產(chǎn)業(yè)應(yīng)用研究工作,旨在通過建立一套科學(xué)、系統(tǒng)、全面的大模型評估體系,有效引導(dǎo)大模型產(chǎn)業(yè)的健康有序發(fā)展,推動技術(shù)與應(yīng)用的深度融合。(王彥涵 記者 何可)
轉(zhuǎn)自:中國質(zhì)量報
【版權(quán)及免責(zé)聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時須獲得授權(quán)并注明來源“中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個人觀點(diǎn),不代表本網(wǎng)觀點(diǎn)和立場。版權(quán)事宜請聯(lián)系:010-65363056。
延伸閱讀