DoNews6月6日消息,近日,蘑菇車(chē)聯(lián)提出BalanceHRNet人體姿態(tài)估計(jì)模型,能夠幫助自動(dòng)駕駛精準(zhǔn)識(shí)別行人意圖。這一研究成果被國(guó)際頂級(jí)期刊Neural Networks收錄。
Neural Networks是世界三大神經(jīng)網(wǎng)絡(luò)領(lǐng)域權(quán)威學(xué)術(shù)期刊之一,也是SCI一區(qū)期刊,涉及行為學(xué)、腦建模、學(xué)習(xí)算法、數(shù)學(xué)和計(jì)算分析,以及使用神經(jīng)網(wǎng)絡(luò)概念和技術(shù)的工程和技術(shù)應(yīng)用。
目前,人體姿態(tài)估計(jì)的主流方法是使用神經(jīng)網(wǎng)絡(luò)來(lái)識(shí)別人體關(guān)鍵點(diǎn)。近年來(lái),該領(lǐng)域研究人員提出多種深度學(xué)習(xí)模型來(lái)提高人體姿態(tài)估計(jì)的準(zhǔn)確性,包括主流的HigherHRNe模型。
盡管這一模型已經(jīng)取得很大進(jìn)步,但在復(fù)雜環(huán)境或者擁擠場(chǎng)景下,不同個(gè)體間的相互遮擋會(huì)導(dǎo)致檢測(cè)難度激增,識(shí)別準(zhǔn)確性會(huì)大大降低。
鑒于此,蘑菇車(chē)聯(lián)提出BalanceHRNet模型,該模型借鑒HigherHRNet的多分支結(jié)構(gòu)和融合方法,克服HigherHRNet無(wú)法獲取大感受野的缺點(diǎn),在更小計(jì)算量的情況下提高準(zhǔn)確性。
BalanceHRNet具有三大優(yōu)勢(shì):具備更大感受野,可以提取更豐富的語(yǔ)義信息,并且具有較高準(zhǔn)確性;提出平衡高分辨率模塊BHRM,可以獲取物體多尺度特征;學(xué)習(xí)不同分支的重要性,讓模型自己決定不同分支的意義。
測(cè)試結(jié)果表明,BalanceHRNet能夠有效提升人體姿態(tài)估計(jì)準(zhǔn)確性。研究人員將CrowdPose數(shù)據(jù)集用作測(cè)試數(shù)據(jù)集,并以HigherHRNet、AlphaPose、OpenPose等模型為比較模型。
數(shù)據(jù)顯示,BalanceHRNet測(cè)得平均正確率為63.0%,比最佳模型HigherHRNet提高3.1%,準(zhǔn)確率為目前業(yè)界最高水平。每一幀畫(huà)面的感知準(zhǔn)確率都提升3.1%,數(shù)字看著小,但對(duì)自動(dòng)駕駛安全性的整體提升影響很大。
研究人員還通過(guò)COCO(2017)關(guān)鍵點(diǎn)檢測(cè)數(shù)據(jù)集展示BalanceHRNet網(wǎng)絡(luò)的有效性,BalanceHRNet模型比平均正確率提高1.6%。
目前,BalanceHRNet已被蘑菇車(chē)聯(lián)用于高精地圖,提高了感知成功率和地圖精度。
作為行業(yè)領(lǐng)先的自動(dòng)駕駛?cè)珬<夹g(shù)與運(yùn)營(yíng)服務(wù)提供商,蘑菇車(chē)聯(lián)持續(xù)推動(dòng)數(shù)字交通、自動(dòng)駕駛領(lǐng)域的技術(shù)突破。
近半年來(lái),蘑菇車(chē)聯(lián)CAMO-MOT算法、IPS300+路側(cè)多模態(tài)目標(biāo)檢測(cè)數(shù)據(jù)集、multi-to-single知識(shí)蒸餾框架、InterFusion融合感知、BalanceHRNet模型等研究成果陸續(xù)被國(guó)際頂級(jí)學(xué)術(shù)機(jī)構(gòu)收錄,這意味著相關(guān)技術(shù)達(dá)到世界領(lǐng)先水平。