很多数学上的知识不懂,充电学习中。
==============================================
1. 找到一个讲“压缩映射原理”比较好理解的视频:
https://www.bilibili.com/video/BV16a411A7Lm/
这个视频中虽然有好多地方没有讲清,不过作为入门还是不错的。
2. 文字讲解“压缩映射原理”的一个资料,虽然在拉格朗日法部分写法有些问题,不过还是蛮容易入门的:
https://zhuanlan.zhihu.com/p/458151225
如果 f函数 可以求导,那么条件:
可以写为:
也就是:
====================================================
“压缩映射定理”的完整定义:
====================================================
使用“压缩映射定理”证明Q-Learning收敛性的资料:
https://www.zhihu.com/question/344193325
https://zhuanlan.zhihu.com/p/496774565
====================================================