国产一区高清|日韩精品一区人妻|曰夲AV一区二区|美日韩一区二区三区|国产喷水在线观看|狼友网站成人大全|欧美日韩制服中文视频在线|久草加勒比手机在线|婷婷色综合无码专区|japanese 精品视频在线观看

Wayve展示GAIA-1自動(dòng)駕駛世界模型 可預(yù)測(cè)事件

DoNews10月9日消息,英國(guó) AI 初創(chuàng)公司 Wayve 日前公布了旗下 GAIA-1 生成式模型的最新進(jìn)展。

據(jù)IT之家報(bào)道,在 6 月的時(shí)候,Wayve 建立了將生成式模型用于自動(dòng)駕駛的概念性驗(yàn)證,而在這幾個(gè)月中,Wayve 公司持續(xù)擴(kuò)展 GAIA-1,使其擁有 90 億個(gè)參數(shù),能夠生成逼真的駕駛場(chǎng)景影片,展示自動(dòng)駕駛“在各種情境的反應(yīng)”,并且更好地預(yù)測(cè)未來(lái)事件。

GAIA-1 是一個(gè)可以利用不同類(lèi)型的資料,包括影片、文字和動(dòng)作,創(chuàng)建逼真駕駛場(chǎng)景影片的世界模型(World Model)。

GAIA-1 可對(duì)自動(dòng)駕駛車(chē)輛的行為和場(chǎng)景特征進(jìn)行細(xì)致的控制,且由于其多模態(tài)的性質(zhì),能夠從多種提示模式和組合中生成相關(guān)視頻。

官方提到,GAIA-1 可對(duì)環(huán)境進(jìn)行學(xué)習(xí),從而提供結(jié)構(gòu)性的環(huán)境理解,協(xié)助自動(dòng)駕駛系統(tǒng)做出明智的決策。

而“預(yù)測(cè)未來(lái)事件”是該模型的基本關(guān)鍵能力,對(duì)未來(lái)的準(zhǔn)確預(yù)測(cè),可以讓自動(dòng)駕駛車(chē)輛預(yù)先知道即將發(fā)生的事件,從而規(guī)劃對(duì)應(yīng)的動(dòng)作,增加汽車(chē)上路時(shí)的安全性和效率。

據(jù)悉,GAIA-1 會(huì)先運(yùn)用專(zhuān)門(mén)的編碼器,將影片或文字等各種形式的輸入,編碼成一個(gè)共享的表示形式,進(jìn)而在模型中實(shí)現(xiàn)統(tǒng)一的時(shí)序?qū)R和上下文理解,這種編碼方法,讓模型能夠更好地整合和理解不同類(lèi)型的輸入。

GAIA-1 的核心,是一個(gè)自回歸 Transformer,能夠預(yù)測(cè)序列中下一組圖像 token,世界模型不只考慮過(guò)去的圖像 token,還參照文字和動(dòng)作 token 的上下文資訊,運(yùn)用這個(gè)方法所生成的圖像 token,不僅會(huì)在視覺(jué)上連貫,而且和預(yù)期的文字和動(dòng)作指引保持一致。

在此之后,模型會(huì)啟動(dòng)視頻解碼器這個(gè)階段被啟動(dòng),主要功能是將這些圖像 token 轉(zhuǎn)換回像素空間,視頻解碼器作為一個(gè)擴(kuò)散模型,其強(qiáng)大之處主要在于可保證生成的影片,具語(yǔ)義意義、視覺(jué)準(zhǔn)確且時(shí)間序一致性。

GAIA-1 的世界模型經(jīng)過(guò) 64 個(gè)英偉達(dá) A100 GPU 上長(zhǎng)達(dá) 15 天的訓(xùn)練,包含了高達(dá) 65 億個(gè)參數(shù),而視頻解碼器則在 32 個(gè)英偉達(dá) A100 GPU 上訓(xùn)練了 15 天,總共擁有 26 億個(gè)參數(shù)。

GAIA-1 的主要價(jià)值,是在自動(dòng)駕駛中引入生成式世界模型的概念,透過(guò)整合影片、文本和動(dòng)作輸入,展示多模態(tài)學(xué)習(xí)在創(chuàng)建多樣化駕駛情境的潛力,而且透過(guò)整合世界模型與駕駛模型,使駕駛模型能夠更好地理解自己的決策,并且泛化至真實(shí)世界的情境中,進(jìn)而提升自動(dòng)駕駛系統(tǒng)的能力。

標(biāo)簽: Wayve
Wayve展示GAIA-1自動(dòng)駕駛世界模型 可預(yù)測(cè)事件
掃描二維碼查看原文
分享自DoNews
Copyright ? DoNews 2000-2025 All Rights Reserved
蜀ICP備2024059877號(hào)-1