會議論文
學年 | 113 |
---|---|
學期 | 1 |
發表日期 | 2024-08-22 |
作品名稱 | 基於深度強化學習之無人載具對未知環境的路徑規劃 |
作品名稱(其他語言) | |
著者 | 劉智誠; 林怡仲; 李柏陞; 周品甄 |
作品所屬單位 | |
出版者 | |
會議名稱 | National Conference on Advanced Robotics |
會議地點 | Taipei, Taiwan |
摘要 | 本論文應用深度強化學習於模擬環境中的無人載具,嘗試透過深度強化學習解決傳統路徑規劃方法所遇到的瓶頸。主要分為兩個部分:(1)已知環境資訊的Q學習、(2)未知環境資訊的深度Q學習。在已知環境資訊的Q學習,將代理人於模擬環境中的座標作為狀態,經過Q學習的模擬後,建立Q表並找出最佳路徑。在未知環境資訊的深度Q學習透過PyTorch建立神經網路,將代理人的影像作為狀態經過簡單的CNN神經網路與Q網路的計算得出最佳動作,在一定次數的訓練疊代後找出能達成最佳路徑的價值函數。深度Q學習在訓練過程中利用經驗回放(Experience Replay)隨機抽取以前的經驗並進行學習。除了經驗回放外,深度Q學習透過建立兩個結構相同但參數不同的神經網路,修正Q值的目標值(Fixed Q-targets),此兩種方法可以打亂訓練的相關性,使神經網路更新更有效率。實驗結果上,本論文分別測試在模擬環境與實際場域的實用性,利用在模擬環境執行深度學習(Reinforcement Learning)能夠減少大量的人力資源並驗證在實際場域上,證明無人載具可以依靠模擬軟體中訓練出來的權重檔,在實際場域上能自動避障並且獲得與模擬相同的控制成果,最終成功到達目的地。 |
關鍵字 | 深度強化學習;路徑規劃;Gazebo模擬器;機器人操作系統 |
語言 | zh_TW |
收錄於 | |
會議性質 | 國內 |
校內研討會地點 | 無 |
研討會時間 | 20240822~20240824 |
通訊作者 | |
國別 | TWN |
公開徵稿 | |
出版型式 | |
出處 | |
相關連結 |
機構典藏連結 ( http://tkuir.lib.tku.edu.tw:8080/dspace/handle/987654321/127130 ) |