版权声明:本文为CSDN博主「ok_kakaka」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/clksjx/article/details/104053216
===============================================
如题:
- 首先是v0和v4的区别:带有v0的env表示会有25%的概率执行上一个action,而v4表示只执行agent给出的action,不会重复之前的action。
- 带有Deterministic的env表示固定跳4帧,否则跳帧数随机从(2, 5) (2, 4)中采样。
- 带有NoFrameskip的env表示没有跳帧。
参考链接
https://github.com/openai/gym/issues/1280
==============================================