• [学习笔记]博弈论


    nim游戏

    [学习笔记]nim游戏

    公平组合游戏

    就是一般的博弈,先手后手选择相同、交替行动,正负判定是能不能动为准。

    SG函数

    对于单独的游戏,0/1足以表示必胜必败态

    SG函数主要处理多个游戏组合起来,即公平组合游戏

    SG函数xor值为0,必败,否则必胜

    SG函数定义为所有后继状态的mex值

    其实只要规定好终态SG函数并且方便转移,公平组合游戏都可以用SG函数刻画

    Every-SG 游戏

    每个子游戏必须同时进行的组合游戏。

    一个DAG上有多个棋子,每次选择所有能移动的棋子沿着有向边移动。

    谁不能移动了谁输。

    (最后一个棋子归位才是关键)

    直观上感觉,要将必胜态保持更长,要将必败态保持更短

    先找出必胜必败态,

    当前是必胜态,D(T)=max(D(T'))+1

    当前是必败态,D(T)=min(D(T'))+1

    混合博弈

    根据当前情况以一定概率决策

    混合策略游戏

    大概决策如下两种:
    真诚(问自己没有的)欺骗(问自己有的)

    再考虑对方“认为你真诚”,“认为你虚假”,做出的决策和你获胜的关系,


    T-T:m/(m+1)(1-f(m-1,n))
    T-F:1/(m+1)+m/(m+1)*(1-f(m-1,n))
    F-T:1
    F-F:1-f(m,n-1)
    推出式子,求交点

    假如以先手以P概率真诚,

    最大化:
    max(min(pm/(m+1)*(1-f(m-1,n))+(1-p),p/(m+1)+p*m/(m+1)(1-f(m-1,n))+(1-p)(1-f(m,n-1)))

    f(m-1,n)和f(m,n-1)递归下去,

    P是横坐标的话,

    其实就是,两个直线求交点,横坐标的概率就是最优决策了,由最高处的纵坐标,再得到获胜的概率

    例题

  • 相关阅读:
    app-授权登录插件配置
    微信公众号-公众号设置-功能设置
    Java变量
    Java数据类型
    计算机存储单元
    Java常量
    k8s
    第一个Java程序
    旋转木马
    tools
  • 原文地址:https://www.cnblogs.com/Miracevin/p/10427096.html
Copyright © 2020-2023  润新知