📌  相关文章
📜  博弈论(普通形式的博弈)|套装2(具有纯策略的游戏)

📅  最后修改于: 2021-04-29 17:11:03             🧑  作者: Mango

博弈论(普通–形式游戏)|设置1(简介)

请先阅读以上文章,然后再继续。

给定回报矩阵。任务是找到玩家的最佳策略。

解决方案:
玩家A有3个策略– 1、2和3,玩家B也有3个策略– 1、2和3。

  • 步骤1:查找每一行的行最小值和每一列的列最大值。

    第一行,第二行和第三行中的最小值分别为20、45和40。 58、45和55分别是第一,第二和第三栏中的最大值。
  • 步骤2:找到行最小值的最大值(行最小值)和列最大值的最小值(列最大值)。

    行最小值的最大值称为maximin值,列最大值的最小值称为minimax

    这里的maximin值等于minimax值,因此该游戏在对应于第2行和第2列的单元格处有一个鞍点(请参见下图)。

    因此,游戏(V)的值为45 。每种策略的双方参与者的最佳概率,

    在哪里,
    P1,P2P3是策略1,23的概率分别玩家A。
    Q1,Q2Q3分别为玩家B策略1,23的概率
    对于这两个玩家,总概率为1