「自動駕駛新青年講座」由智東西公開課全新企劃,將邀請全球知名高校、頂尖研究機構以及優秀企業的新青年,主講在環境感知、精準定位、決策規劃、控制執行等自動駕駛關鍵技術上的最新研究成果和開發實踐。

有興趣分享的朋友,可以與智東西公開課教研團隊進行郵件(class@jmfly.net)聯系。

決策是自動駕駛系統中至關重要的一環,是決定自動駕駛汽車大規模部署的前沿問題。相比于傳統的基于規則的決策方法,基于學習的決策方法可以大大增強系統的可擴展性,從而加速自動駕駛汽車在現實復雜道路情況下的開發和部署。然而,目前仍缺乏對基于學習的自動駕駛決策過程的系統總結。

來自南洋理工大學的AutoMan實驗室的在讀博士黃志宇等人專注于自動駕駛決策、預測規劃領域的研究。他們在最新的研究中利用逆強化學習(Inverse reinforcement learning)評估決策,結合模仿學習(Imitation learning)和強化學習(Reinforcement learning)直接生成決策,以及學習世界模型(World model)用于決策。

11月29日晚7點,「自動駕駛新青年講座」第12講邀請到南洋理工大學在讀博士黃志宇,主講《自動駕駛智能決策生成算法解析》。

本次講座中,黃博將基于個人的研究工作,全面講解基于學習的決策系統框架以及其中各模塊的學習方法,之后重點將講解學習世界模型對真實世界交通場景中的人類交互行為進行建模,并以此做出更加智能和擬人化的決策。

講者
 黃志宇,南洋理工大學在讀博士;研究方向為自動駕駛決策、預測規劃及人機交互;在TNNLS、TITS、ICRA/IV等相關領域頂級期刊和會議發表多篇論文;曾獲2021年Waymo開放數據集挑戰賽交互預測冠軍,運動預測亞軍以及2022年Occupancy Flow預測亞軍。

第12講
主 題
《自動駕駛智能決策生成算法解析》

提 綱
1、基于學習的決策系統框架
2、逆強化學習評估決策
3、結合強化學習與模仿學習的決策生成
4、學習世界模型對人類交互行為建模及決策生成

直 播 信 息
直播時間:11月29日19:00
直播地點:智東西公開課知識店鋪

成果

論文標題
《Driving behavior modeling using naturalistic human driving data with inverse reinforcement learning》
《Efficient deep reinforcement learning with imitative expert priors for autonomous driving》
 《Differentiable integrated motion prediction and planning with learnable cost function for autonomous driving》

論文地址
//arxiv.org/abs/2010.03118
//arxiv.org/abs/2103.10690
//arxiv.org/abs/2207.10422

開源地址
//github.com/MCZhi/Driving-IRL-NGSIM
//github.com/MCZhi/Expert-Prior-RL
//github.com/MCZhi/DIPP