還在玩ChatGPT?已經(jīng)有自動駕駛算法能告訴你“我在干嘛”。
基于視覺和神經(jīng)網(wǎng)絡(luò)的自動駕駛算法,雖然能通過傳感器數(shù)據(jù),以及學(xué)習(xí)人類的駕駛行為,自主決策并控制車輛。
但是,算法基于什么做出的決策?特別是出現(xiàn)故障,也就是決策錯誤的時(shí)候,算法是怎么想的?這些一直被稱為自動駕駛算法里的“黑匣子”,讓算法缺乏透明度和可解釋性。
(資料圖)
不過,現(xiàn)在有這么一個模型,既能預(yù)測車輛控制行為,還能自己解釋“我停車是因?yàn)榧t燈亮了,并且有行人在過馬路”。
模型論文入選ICRA 2023,相關(guān)模型已開源。
那么,是一個什么樣的算法?
ADAPT:駕駛行為感知說明大模型
這是一種叫ADAPT(Action-aware Driving Caption Transformer)的端到端算法,也是目前第一個基于Transformer的駕駛行為描述框架,可以感知和預(yù)測駕駛行為,并且輸出自然語言敘述和推理。
直白一點(diǎn)說,輸入車輛視頻后,這個算法可以判斷車輛行為并告訴你:車在做什么,為什么要這么做。
在論文作者提供的測試視頻里,這個算法最終上車的效果是這樣的。(紅色字是車輛行為,藍(lán)色字是解釋)
“車在向前開。因?yàn)槁飞蠜]有車。”
駕駛行為變化后,算法也能及時(shí)感知:
“車靠左邊停下了。因?yàn)橐\??!?/p>
“車開始移動并且靠右行駛。因?yàn)槁纷筮呁V??!?/p>
算法不僅能識別路口,也能識別騎著車的人。
“車在十字路口停下了。因?yàn)橐荛_街上騎著自行車的人,”
這是怎么實(shí)現(xiàn)的?
多任務(wù)框架下的聯(lián)合訓(xùn)練
ADAPT框架可以分為兩個部分:車輛行為描述(DCG,Driving Caption Generation)和車輛控制信號預(yù)測(CSP,Control Signal Prediction)。
首先,傳感器端輸入視頻,Video Swin Transformer對車輛視頻進(jìn)行編碼,得到的視頻特征會輸入進(jìn)各任務(wù)模塊里。
在DCG模塊,算法利用Vision-Language Transformer生成兩個自然語句,也就是上文中提到的車輛行為描述和原因解釋。
相同的視頻特征也會輸入進(jìn)CSP模塊(類似一般基于視覺的自動駕駛系統(tǒng)),輸出車輛實(shí)際的控制信號序列,并利用Motion Transformer輸出模型預(yù)測的控制信號,比如速度、方向和加速度。
在單個網(wǎng)絡(luò)中,作者利用車輛實(shí)際的控制信號序列和模型預(yù)測的控制信號序列,兩者的均方誤差作為CSP模塊的損失函數(shù)。
而在多任務(wù)框架下,通過聯(lián)合訓(xùn)練DCG和CSP,可以減少車輛決策和文本描述之間的差異,提高控制信號預(yù)測的準(zhǔn)確率。
論文里,作者們在包含控制信號和車輛視頻的大規(guī)模數(shù)據(jù)集BDD-X上,利用機(jī)器評測和人工評測驗(yàn)證了ADAPT的有效性。
機(jī)器評測方面,使用的是BLEU4、METEOR、ROUGE-L和CIDEr(對應(yīng)縮寫分別為B4、M、R、C)等多種語言任務(wù)常用的指標(biāo)。
最終顯示ADAPT達(dá)到了當(dāng)前最優(yōu)(State-of-the-Art)的結(jié)果,ADAPT在動作描述方面比原有先進(jìn)方法CIDEr高出31.7,在原因解釋方面高33.1。
人工評測分為動作描述、原因解釋和全句三個部分。通過人工判斷,ADAPT在這三部分的準(zhǔn)確性分別達(dá)到了90%,90.3%和82.7%,證明了ADAPT的有效性。
在可視化結(jié)果里,也能看出ADAPT可以準(zhǔn)確識別車輛行為以及決策原因。并且在黑夜、陰雨天等場景下,ADAPT也能保證準(zhǔn)確度;即使有雨刷器干擾,ADAPT也可以識別道路上的停止標(biāo)識。
為什么需要ADAPT?
自動駕駛行為的可解釋性
在基于視覺的自動駕駛算法里,比較常見的解釋圖有視覺注意圖(Attention Map),或者成本量圖(Cost Volume),但不熟悉自動駕駛算法的人容易對這些圖造成誤解。
上:視覺注意圖;下:成本量圖
因此,ADAPT這種能夠生成自然語言、“說人話”的算法,能夠幫助用戶更好地理解自動駕駛算法在做什么、為什么要這么做,同時(shí)還能讓用戶更信任自動駕駛技術(shù)。
而對于算法工程師和研究人員來說,當(dāng)發(fā)生極端情況時(shí)、或者發(fā)生故障(比如判斷錯誤)時(shí),ADAPT可以幫助他們獲得更多信息,進(jìn)而改進(jìn)算法。
作者們將進(jìn)一步研究如何在模擬器和實(shí)際車輛上如何部署ADAPT,以及如何利用文本轉(zhuǎn)語音技術(shù),讓生成的句子轉(zhuǎn)化為語音,幫助普通乘客,特別是視力障礙乘客使用。
本文作者來自中國科學(xué)院自動化研究所、清華大學(xué)人工智能產(chǎn)業(yè)研究院(AIR)、北京大學(xué)、英特爾中國研究院、西安電子科技大學(xué)、南方科技大學(xué)和北京航空航天大學(xué)。
論文一作晉步和三作鄭宇鵬是來自中國科學(xué)院自動化研究所的研究生,晉步主要研究方向?yàn)槎嗄B(tài)學(xué)習(xí)、視覺語言模型等。
通訊作者為劉新宇,清華大學(xué)自動化系學(xué)士和碩士,長期從事軟件研發(fā)工作,著有《算法新解》。
作者之一李鵬飛是AIR在讀博士生,本科畢業(yè)于中國科學(xué)院大學(xué),主要研究智慧交通、機(jī)器人、計(jì)算機(jī)視覺等方向。
另一位作者趙昊是AIR助理教授,本博畢業(yè)于清華大學(xué)電子工程系,曾任英特爾中國研究院研究員和北京大學(xué)聯(lián)合博士后,研究方向?yàn)閹缀闻c認(rèn)知層面的場景理解及其在機(jī)器人中的應(yīng)用。
另外,本文的模型已經(jīng)開源,感興趣的可以去試試看~
論文地址
https://arxiv.org/abs/2302.00673
代碼地址
https://github.com/jxbbb/ADAPT
關(guān)鍵詞:
- 當(dāng)前通訊!他們用ChatGPT方式搞自動駕駛,論文入選了ICRA 2023
- 市值暴跌99%,字節(jié)曾經(jīng)的對手退市了
- 環(huán)球短訊!中東土豪,剛投了馬斯克70個億
- 當(dāng)前聚焦:安理會將就俄方呼吁聯(lián)合國調(diào)查的草案表決
- 臺媒稱解放軍軍艦過恒春外海,回懟臺艦:臺灣是中國不可分割一部分
- 觀焦點(diǎn):美民眾質(zhì)問國會議員:“為什么要如此歇斯底里和恐慌”
- 全球關(guān)注:中澳國防部工作會晤三年來首度舉行
- 播報(bào):新機(jī)型!空客交付首架在天津總裝A321飛機(jī)
- 世界消息!杠桿資金加倉股出爐 千億通信大牛股高居第一 這些大牛股也被盯上
- 【世界播資訊】二氧化碳變石頭?碳捕集利用與封存產(chǎn)業(yè)化有望加速 機(jī)構(gòu)看好這15股
- 頭條:京基智農(nóng):育肥豬生產(chǎn)成本1-2月回升,后續(xù)有較大下降空間
- 【全球時(shí)快訊】上海證券給予東方時(shí)尚買入評級 深度報(bào)告:品牌化定義駕培標(biāo)準(zhǔn) VR重塑商業(yè)模式
- 觀熱點(diǎn):訪問三所高校 智慧互通積極開展校企合作
- 環(huán)球精選!智能手機(jī)需求疲軟持續(xù) 瑞聲科技去年毛利率下降6.4%
- 實(shí)時(shí)焦點(diǎn):禁立“小金庫”、培訓(xùn)費(fèi)優(yōu)先清償……五部門為校外培訓(xùn)機(jī)構(gòu)財(cái)務(wù)管理劃紅線
- 全球熱頭條丨降雨量50毫米是什么意思(降雨量50毫米是什么意思?)
- 環(huán)球即時(shí):麥迪文的日記(wow卡拉贊麥迪文的日記任務(wù))
- 四川天府銀行與綠地金控達(dá)成合作 攜手共謀市場拓展
- 股票深成是啥意思?深圳成指和深圳綜指有什么不一樣?
- 美元貨幣符號是什么?人民幣對美元匯率走勢
- 低碳菜單引領(lǐng)寧波餐飲消費(fèi)新風(fēng)尚 試點(diǎn)將持續(xù)至今
- 深圳坪山打造餐飲服務(wù)食品安全示范高地 嚴(yán)守食品
- 黑龍江哈爾濱推出“沙盒”監(jiān)管新模式 激發(fā)市場活
- 第三季度全國消協(xié)受理投訴數(shù)量同比增10.02% 食品
- 北京懷柔對機(jī)動車檢測機(jī)構(gòu)開展監(jiān)督抽查 規(guī)范機(jī)動
- 天津北辰扎實(shí)做好價(jià)格監(jiān)管工作 維護(hù)安全有序市場
- 北京石景山開展冬季供暖前特種設(shè)備安全專項(xiàng)檢查
- 陜西延安:開展兒童化妝品專項(xiàng)檢查 規(guī)范化妝品市
- 北京海淀開展商品條碼專項(xiàng)監(jiān)督檢查 努力打造穩(wěn)定
- 金華推進(jìn)網(wǎng)絡(luò)直播營銷治理顯成效 培育放心消費(fèi)直
- 1 當(dāng)前通訊!他們用ChatGPT方式搞自動駕駛,論文入選
- 2 市值暴跌99%,字節(jié)曾經(jīng)的對手退市了
- 3 環(huán)球短訊!中東土豪,剛投了馬斯克70個億
- 4 當(dāng)前聚焦:安理會將就俄方呼吁聯(lián)合國調(diào)查的草案表決
- 5 臺媒稱解放軍軍艦過恒春外海,回懟臺艦:臺灣是中國
- 6 觀焦點(diǎn):美民眾質(zhì)問國會議員:“為什么要如此歇斯底
- 7 全球關(guān)注:中澳國防部工作會晤三年來首度舉行
- 8 播報(bào):新機(jī)型!空客交付首架在天津總裝A321飛機(jī)
- 9 世界消息!杠桿資金加倉股出爐 千億通信大牛股高居
- 10 【世界播資訊】二氧化碳變石頭?碳捕集利用與封存產(chǎn)