邁向全球首個(gè)百萬小時(shí)數(shù)據(jù)里程碑
——探訪北京人形機(jī)器人創(chuàng)新中心具身智能機(jī)器人數(shù)據(jù)采集與訓(xùn)練基地
3月19日,《中國電子報(bào)》記者在調(diào)研北京人形機(jī)器人創(chuàng)新中心具身智能機(jī)器人數(shù)據(jù)采集與訓(xùn)練基地(以下簡稱“數(shù)據(jù)基地”)時(shí)了解到,目前數(shù)據(jù)采集主要面臨場景碎片化、機(jī)器人“方言”不通、數(shù)據(jù)質(zhì)量參差不齊等難點(diǎn)。在“數(shù)據(jù)飛輪效應(yīng)”的驅(qū)動(dòng)下,該數(shù)據(jù)基地有望迎來全球首個(gè)完成百萬小時(shí)高質(zhì)量具身智能機(jī)器人數(shù)據(jù)采集的里程碑。
走進(jìn)數(shù)據(jù)基地,記者看到這里復(fù)刻了家居、商超、辦公、工業(yè)、醫(yī)藥、康養(yǎng)六大核心領(lǐng)域,構(gòu)建起超過30個(gè)典型應(yīng)用場景的實(shí)體空間。每一處場景的布局,都遵循著“真實(shí)、泛化、可復(fù)用”的數(shù)據(jù)采集原則。尤為重要的是,這些場景并非靜態(tài)的“樣板間”,而是可動(dòng)態(tài)配置、可組合重構(gòu)的“數(shù)據(jù)工廠”。
據(jù)了解,數(shù)據(jù)基地建立了標(biāo)準(zhǔn)化的項(xiàng)目管理體系,制定了涵蓋數(shù)據(jù)采集、標(biāo)注、質(zhì)檢等環(huán)節(jié)的全流程規(guī)范手冊(cè),實(shí)現(xiàn)了從任務(wù)下發(fā)到最終交付的全流程質(zhì)量可控。
當(dāng)前,高質(zhì)量數(shù)據(jù)已成為驅(qū)動(dòng)人形機(jī)器人產(chǎn)業(yè)發(fā)展的戰(zhàn)略資源。不過,人形機(jī)器人要真正走進(jìn)千行百業(yè),需要的不僅僅是幾百、幾千條“精修”數(shù)據(jù),而是海量、多樣、高質(zhì)量的數(shù)據(jù)“原料”。其中,真機(jī)數(shù)據(jù)是機(jī)器人智能從虛擬走向現(xiàn)實(shí)的必經(jīng)之路。
數(shù)據(jù)基地專家指出,真機(jī)數(shù)據(jù)能夠精準(zhǔn)還原力覺反饋、觸覺信息、環(huán)境干擾等仿真難以復(fù)制的細(xì)節(jié)。這些被稱為“物理直覺”的關(guān)鍵信息,只能通過真機(jī)采集的多模態(tài)數(shù)據(jù)來訓(xùn)練。更重要的是,真機(jī)數(shù)據(jù)記錄了真實(shí)環(huán)境中完整的任務(wù)閉環(huán)。一條簡單的“抓取-操作-放置”軌跡中,蘊(yùn)含了大量人類在復(fù)雜環(huán)境中的隱性決策,其數(shù)據(jù)價(jià)值密度遠(yuǎn)高于其他類型的數(shù)據(jù)。此外,真機(jī)數(shù)據(jù)還能有效解決“分布偏移”問題,幫助機(jī)器人學(xué)習(xí)適應(yīng)各種環(huán)境特征與突發(fā)情況,從而真正實(shí)現(xiàn)從實(shí)驗(yàn)室走向現(xiàn)實(shí)世界的跨越。
記者在采訪中了解到,數(shù)據(jù)采集主要面臨三大難點(diǎn):一是場景碎片化,真實(shí)環(huán)境千差萬別,每個(gè)變量都在考驗(yàn)算法的泛化能力;二是機(jī)器人“方言”不通,不同構(gòu)型的機(jī)器人本體存在顯著的“方言”差異,傳感器布局、關(guān)節(jié)自由度、控制接口各不相同,導(dǎo)致不同構(gòu)型的數(shù)據(jù)難以遷移;三是數(shù)據(jù)質(zhì)量參差不齊,數(shù)據(jù)采集涉及動(dòng)作捕捉、多模態(tài)同步、人工標(biāo)注等環(huán)節(jié),任何環(huán)節(jié)的偏差都可能產(chǎn)出“低質(zhì)數(shù)據(jù)”,不僅浪費(fèi)資源,甚至可能誤導(dǎo)模型。
為破解行業(yè)數(shù)據(jù)瓶頸,各方正在積極探索。據(jù)悉,北京人形機(jī)器人創(chuàng)新中心布局的專業(yè)化數(shù)據(jù)采集基地,旨在將分散的場景集中復(fù)現(xiàn)、將多樣的機(jī)器人統(tǒng)一調(diào)度、將采集標(biāo)注質(zhì)檢全流程標(biāo)準(zhǔn)化。目前,該數(shù)據(jù)基地已為多家頭部企業(yè)及科研機(jī)構(gòu)交付數(shù)萬小時(shí)高質(zhì)量數(shù)據(jù),整體數(shù)據(jù)合格率穩(wěn)定在95%以上。(記者楊鵬岳)
轉(zhuǎn)自:中國電子報(bào)
【版權(quán)及免責(zé)聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時(shí)須獲得授權(quán)并注明來源“中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個(gè)人觀點(diǎn),不代表本網(wǎng)觀點(diǎn)和立場。版權(quán)事宜請(qǐng)聯(lián)系:010-65363056。
延伸閱讀

版權(quán)所有:中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)京ICP備11041399號(hào)-2京公網(wǎng)安備11010502035964