MILD與ECPO:讓駕駛從監督者變經理的代理人式人車協作

部分自動駕駛會增加駕駛認知負擔。本研究提出Mediator-in-the-Loop-Driving(MILD),以代理人架構整合座艙與車外感知,並由輕量策略代理人提出可解釋建議,採Evidence-and-Constraint-weightedPolicyOptimization(ECPO)及檢驗器與檢索增強模組強化決策。實驗於三個公開資料集顯示MILD於可稽核指標與人類評分上優於基線。

MILD ECPO 智慧介面

重點速遞

部分自動駕駛可能反而增加駕駛的認知負擔,問題來源在於車輛意圖與決策邏輯不透明,以及自動系統對駕駛狀態感知不足。針對這點,提出一種把人從被動監督者提升為主動管理者的新架構。

方法概述

Mediator-in-the-Loop-Driving(MILD)採用代理人式系統,整合座艙與車外的感知代理人,並由一個輕量策略代理人產生合規且可解釋的行動建議。為確保策略與安全規範及人類價值一致,研究設計Evidence- and Constraint-weighted Policy Optimization(ECPO),利用自動驗證器引導代理人朝向有證據支持、結構完整且不違反約束的行為。

同時,系統包含檢索增強生成模組,動態把交通規則、速限建議與駕駛偏好納入決策回路,以提升策略的可稽核性與人機協作性。

實驗與發現

在三個公開資料集上的場域實驗顯示,MILD在感知準確度與策略品質上持續優於基線,並在可稽核的離線指標以及人類評分(如政策適切性、舒適度與說明品質)上取得較好表現。此架構提供建立可稽核、與人值對齊的人車協作代理人的可行路徑。

延伸閱讀

原始來源:ArXiv AI


系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。

Read more