Life is beautiful Quiz

Life is beautifulで中島さんが恒例の(?)クイズを出題。

あなた(=Aさん)とBさんにジャンケンを連続で1000回してもらいます。あなたもBさんも、パーで勝つたびに500円、チョキで勝つたびに200円の賞金を主催者からもらえます。グーで勝ったり、アイコになった場合には一円ももらえません。この条件で、あなたの賞金を最大化するために、どんな戦略を採りますか?ただし、Bさんと前もって相談することはできないし、試合中はしゃべったり身振りで合図を送ってはいけません。表情も見えないように、ミラーガラスのヘルメットを被ってもらいます。試合中に見えるのは相手が何を出したかだけです。

http://satoshi.blogs.com/life/2007/03/post_16.html
ぱっと思うのはゲーム理論の応用だが、少々ジレンマがある。

  • パーで勝つことは最も利益が大きい(=500yen)が、グーを出しても利益がない(グーで勝っても0yen)ので結局パーでは勝つことができない
  • かといってチョキを出すことは相手も上記の通り考えていると想定した場合、あいこになってしまうのでこれまた利益がでない

じゃんけんに勝つことはもちろんだが、結果としての利益の最大化こそが目指すべきターゲットとなっていることが重要だろう。また、この種の問題は相手とコミュニケーションできないという前提があったとしても、「じゃんけんを行う」という行為では相互にコミュニケーションを行っているわけで、「じゃんけんという方法をつかっていかに利益を最大化するか」という風にも考えることができる。
まずは極端なパターンを考えてみることにする。

  • ずっとチョキ
    • 競争社会:相手にしてみればグーを出してじゃんけんに勝利しても利益にはつながらないわけで、相手としてはずっとチョキもしくはグーを出して0yenの利益、こちらも0yenの利益
    • 共存社会:自分と相手を共存相手と考え、2人としての利益の最大化を目指すとすると、ずっとパーをだして相手は0yenの利益、こちらは200yen x1000回=20万円の利益
      • # ただこの考え方は全体の利益最適化にはならないですね
  • ずっとパー
    • 競争社会:当然ずっとチョキであいては200yen x1000回で20万円の利益、こちらは0yen
    • 共存社会:二人の利益の最大化という観点では相手にしてみればわざとグーで負けることによって、相手は0yenの利益、こちらが500yen x1000回で50万円の利益で最大となる
  • ずっとグー
    • ありえない選択だが、もしこの選択を取った場合は競争・共存のいずれの社会だとしても相手はパーを出し続けて50万円の利益を得る

さて、相手も利益の最大化を目指して合理的に行動するとすると基本をチョキとして相手の出方を伺いながらランダムにパーとグーを織り交ぜて1yenでも利益を出すことを目指すことがこちらの行動としては合理的だろう。負けたとしてもマイナスにはならないわけで、であるならば相手に対して「自分はグーも出す」というメッセージをじゃんけんを通じて送ることによって、相手に対して「パーで勝つ可能性がある」ことを意識させることによって逆に自分にとっても「チョキで勝つ」ことができる可能性が生じる。グーを基本にすると相手にとってのパーで勝つ可能性を増やしてあげることになるだけであまり自分にとってメリットはない。相手がチョキを出してグーで勝っても利益はないのだから。パーを基本にすると相手は基本的にグーはださない戦略でくるだろう。結果として相手がチョキを出して負けるか、相手がパーを出して引き分けるかする可能性が高くなり、自分にとって利益に結びつかない。
よって、基本的には50%がチョキ、残りはパーとグーをランダムに織り交ぜて結果的に25%ずつの割合となるように出すことが自分にとっての利益の最大化になるのではないだろうか。
# なにか致命的に間違っている気もするが…この問題に数学的な正解があるのか、もうちょっとじっくり考えてみることにしよう。