Playing FPS Games with Deep Reinforcement Learning

论文不同点：

（1）用两套网络分别实现移动和射击。

（2）使用LSTM来处理不完全信息。

疑问：

（1）为什么对于射击使用RNN，对导航却没有使用RNN。一般来说，当我们看见视野里面有敌人的时候，我们可以立即进行射击，似乎不太需要长久的历史信息，再官方给出的视频中，我也没发现RNN有什么好处。另一方面，倒是导航应该使用RNN，对于非完全信息来说，bot只根据当前的画面并不能判断自身的位置和已经走过的路径，加入历史信息才能帮助bot建立长久的移动策略。

该论文没有考虑的地方：

（1）没有环顾四周探测敌人和物资的策略。

（2）没有训练上下视角移动的策略，没法精确射击敌人，没法处理有阶梯的情况。

相关阅读:
PHP cURL模块
phpweb成品网站最新版(注入、上传、写shell)
首都师范大学2012年高等代数考研试题参考解答
华南理工大学2020年数学分析考研试题参考解答
四川大学2020年数学分析考研试题参考解答
武汉大学2020年数学分析考研试题部分参考解答
同济大学2020年高等代数考研试题部分参考解答
同济大学2020年数学分析考研试题部分参考解答
首都师范大学2020年数学分析考研试题参考解答
首都师范大学2020年高等代数考研试题部分参考解答

原文地址：https://www.cnblogs.com/huangshiyu13/p/8473259.html