《数学模型》第10章 博弈模型
10.1点球大战
博弈分为合作博弈和非合作博弈
根据所有决策者的决策是同时做出的、还是按一定先后顺序作出的,非合作博弈可以分为静态博弈和动态博弈
根据决策者在决策时所掌握的信息多少,非合作博弈可以分为完全信息博弈和不完全信息博弈
完全信息的静态博弈:参与人(player)、策略空间(决策变量的取值范围)、效用函数(决策的目标函数)
零和博弈和常数和博弈
支付矩阵(payoff matrix,也译为收益矩阵、赢得矩阵)
[M=(m_{ij})_{2 imes 2}=left(egin{matrix}0.58&0.95\0.93&0.70end{matrix}
ight)
]
纯策略Nash均衡(Nash equilibrium):如果对方不改变策略,每一方的策略选择都是最优的.
[u_1(a_1^*,a_2^*)geqslant u_1(a_1,a_2^*),u_2(a_1^*,a_2^*)geqslant u_2(a_1^*,a_2),a_1in{1,2},a_2in{1,2}
]
混合策略Nash均衡
[]