• 纳什均衡和帕勒托最优


    囚徒困境

    双方不能通信的前提下,选择招供是唯一的不管对方如何行为对方都不能增加收益的情况。----也就是在出于自身利益的前提下达到了纳什均衡。

    个体的理性选择并不是整体的最优选择(因为不能确定对方的行为--零和静态(即同时,象棋就是动态)非合作博弈)

    纳什均衡

    任何行为者独自改变策略都不能再比对方增加收益

    帕勒托曲线

    不可能再在不损失任一方的前提下,使其他任一方获利。

    但是帕勒托最优不一定我们想要的全局最优:如世界上只有一个富翁和一个流浪汉,只需给流浪汉一些钱,世界就没有了贫困。

    显然纳什均衡不一定是帕勒托最优,如囚徒困境。

    非零和博弈中,帕累托最优和纳什均衡是互相冲突的。

    GAN基于博弈论, VAE变分基于贝叶斯先验

  • 相关阅读:
    flask强大的三方组件flask-Migrate
    FTP和HTTP
    MD5-JS加密
    使用websocket实现单聊和多聊
    Flask上下文管理
    python中的with用法
    如何判断一个对象是可调用对象
    缓存
    websocket与http
    csrf
  • 原文地址:https://www.cnblogs.com/Henry-ZHAO/p/14058237.html
Copyright © 2020-2023  润新知