LEARNING TO NAVIGATE IN COMPLEX ENVIRONMENTS

书呆鱼

关注

阅读 53

2022-07-18

任务是地图里面导航,让agent从起始点到达指定位置。

 

用了supervised learning + reinforcement learning + lstm

 

用supervised learning当做辅助训练,加速rl训练,用lstm当做memory。实验表明depth construction比较有用。论文中的方法在固定地图和随机地图中都能用。

 

黄世宇/Shiyu Huang's Personal Page:​​https://huangshiyu13.github.io/​​



精彩评论(0)

0 0 举报