『人間行動に潜むジレンマ』で進化ゲーム理論の基本をお勉強 - 02

人間行動に潜むジレンマ―自分勝手はやめられない? (DOJIN選書 13)

人間行動に潜むジレンマ―自分勝手はやめられない? (DOJIN選書 13)

  • ゲーム理論は相互の利害がお互いに影響する状態に置ける、3要素[プレーヤ][戦略][利得]のステータス変化を扱う
自分↓相手→ 戦略A 戦略B 戦略C
戦略A 1,1 4,2 1,3
戦略B 2,3 0,1 3,2
戦略C 0,2 3,4 2,0
  • 自分が戦略Aを採ると仮定する。それに対する相手の最適な戦略は戦略Cとなる
  • 相手が戦略Cを採るとすると、自分の最適な戦略は戦略Bとなる
  • 自分が戦略Bを採るとすると、相手の最適な戦略は戦略Aとなる
  • 相手が戦略Aを採るとすると、自分の最適な戦略は戦略Bとなる

この結果、お互いが相手の戦略を含めて完全に把握しており、かつ相互に最善手を選択するとした場合、自分は戦略B、相手は戦略Aを採り(2,3)の結果となる
→このように、お互いの戦略が相手の戦略に対する最善手となっている戦略の組み合わせを"ナッシュ均衡"という。
ナッシュ均衡=いずれかのプレーヤが自身の戦略を変更したとしてもいずれの利益も増やすことができない戦略の組み合わせ

  • 「強い」ナッシュ均衡
    • ナッシュ均衡状態から自身の戦略を変更すると、どんな変更であっても「戦略を変えたプレーヤ側が」損をするような状態
自分↓相手→ 戦略A 戦略B
戦略A 1,2 0,0
戦略B 0,2 3,2
  • この場合、自分が戦略A、相手が戦略Aの組み合わせは、「戦略を変えた側が必ず損をする」ので強いナッシュ均衡である(自分が戦略を変更すると自分の利益は1→0となるし、相手が戦略を変更すると、相手の利益は2→0となる)
  • 一方、自分が戦略B、相手が戦略Bの組み合わせは、相手のみ「戦略を変えても損をしない」ので強くないナッシュ均衡である(自分が戦略を変更すると自分の利益は3→0となるが、相手は戦略を変更しても利益2は変わらない)

→強くないナッシュ均衡は安定性に欠ける(上記の例の場合であれば、相手にとっては戦略を変更してもよいと思える状態である)ため、状態変化に弱い
(「強い」ナッシュ均衡の場合、一時的に状態が変化したとしても均衡状態に戻る誘因が強い)

  • 囚人のジレンマ状態のように、他のプレーヤの利益を下げることなく利益を上げる状態になれるにもかかわらず、均衡状態はその位置にないことを"パレート非効率"と呼ぶ
  • 現在の状態から、いずれかのプレーヤの利益を低下させることなくいずれかのプレーヤの利益を増加させることができる選択を行うことを"パレート改善"と呼ぶ
  • これ以上パレート改善をする余地のない状態を"パレート最適(パレート効率)"と呼ぶ