nim游戏
公平组合游戏
就是一般的博弈,先手后手选择相同、交替行动,正负判定是能不能动为准。
SG函数
对于单独的游戏,0/1足以表示必胜必败态
SG函数主要处理多个游戏组合起来,即公平组合游戏
SG函数xor值为0,必败,否则必胜
SG函数定义为所有后继状态的mex值
其实只要规定好终态SG函数并且方便转移,公平组合游戏都可以用SG函数刻画
Every-SG 游戏
每个子游戏必须同时进行的组合游戏。
一个DAG上有多个棋子,每次选择所有能移动的棋子沿着有向边移动。
谁不能移动了谁输。
(最后一个棋子归位才是关键)
直观上感觉,要将必胜态保持更长,要将必败态保持更短
先找出必胜必败态,
当前是必胜态,D(T)=max(D(T'))+1
当前是必败态,D(T)=min(D(T'))+1
混合博弈
根据当前情况以一定概率决策
混合策略游戏
大概决策如下两种:
真诚(问自己没有的)欺骗(问自己有的)
再考虑对方“认为你真诚”,“认为你虚假”,做出的决策和你获胜的关系,
T-T:m/(m+1)(1-f(m-1,n))
T-F:1/(m+1)+m/(m+1)*(1-f(m-1,n))
F-T:1
F-F:1-f(m,n-1)
推出式子,求交点
假如以先手以P概率真诚,
最大化:
max(min(pm/(m+1)*(1-f(m-1,n))+(1-p),p/(m+1)+p*m/(m+1)(1-f(m-1,n))+(1-p)(1-f(m,n-1)))
f(m-1,n)和f(m,n-1)递归下去,
P是横坐标的话,
其实就是,两个直线求交点,横坐标的概率就是最优决策了,由最高处的纵坐标,再得到获胜的概率