「じゃんけんの行方」に関する補注

はーい、ゲーム理論の時間ですよー。好きな人だけよっといでー。

※ほんとにゲーム理論関連だけです。数式こそ出てきませんが専門用語とか注釈なしでばんばん登場します。申し訳ない。

EL-CO さんのコメント (2005-12-15)

ナッシュ均衡解を含めたゲーム理論は基本的に試行回数の有限性を前提としていないように思われます(専門家ではないので断言は出来ませんが、私の知る限りにおいてはそうです)。しかしながら実際のゲームにおいては試行回数は有限であり、「この1回に勝つか(あるいはこれからの数回において勝ち越すか)」こそが重要なのです。なので次の1回に勝てばその戦略が最適でなかろうが、その後ずっと負け越すことになろうがどうでもいい、というわけです。「囚人のジレンマ」において報復戦略が有効、とか言っても当の囚人にとっては「今ここでどうするか」だけが問題なのです。全体として個人的には「実際のゲームにゲーム理論を持ち込むこと自体が危険行為」だと思っています。


ということで今日はこのコメントへの回答です。ちょっと話が錯綜しそうなので、いくつかの文に分解して、順番も弄らせていただきたいと思います。


1a. 「囚人のジレンマ」において報復戦略が有効、とか言っても当の囚人にとっては「今ここでどうするか」だけが問題

1b. 「この1回に勝つか(あるいはこれからの数回において勝ち越すか)」こそが重要なのです。なので次の1回に勝てばその戦略が最適でなかろうが、その後ずっと負け越すことになろうがどうでもいい

2. ナッシュ均衡解を含めたゲーム理論は基本的に試行回数の有限性を前提としていない

3.「実際のゲームにゲーム理論を持ち込むこと自体が危険行為」


ということで楽な問題から片付けましょう。『1a. 報復戦略と「いまここ」』の話から。これは単純なことで、例示されている『当の囚人にとっては「今ここでどうするか」だけが問題』は1回きりの囚人のジレンマゲームであるのに対して、報復戦略は無限回繰り返し囚人のジレンマゲームの解(割引率に関して条件を付与する必要がありますが)を構成する戦略です。1回きり囚人のジレンマゲームと無限回繰り返し囚人のジレンマゲームは(ゲーム理論の範疇では)全然別のゲームですので、1回きり囚人のジレンマゲームのプレイヤーであるところの当の囚人さんが報復戦略に基づいて行動しないのは、ゲーム理論的に言えば当然です。

『1b. この一回に勝つかどうかこそが重要』についても、少なくともそう考えている人としては単純に1回きりのゲームをプレーしているのです、として片付けることができます。これからの数回の結果が重要だという人は、そういう割引率設定のゲームのプレイヤーなんでしょう。但し前項の話と違うのは、相手プレイヤーと認識に差があるかもしれないという点で、向こう側が五回ベースで考えていてこっちは無限回ベースで考えているとか、そうなると共有知識の前提が成り立たなくなるのでベーシックなゲーム理論の範疇ではなくなります(いや、じゃんけんだとどうせ1/3混合ですけど。囚人のジレンマなら)。

今は相手固定ってことにしましたけど、相手があちこちにいていろんな人とゲームする、というような、有名なアクセルロッドのコンテストみたいな状況だとさらに違って、これはどっちかというと実験経済学の話になると思います(報復戦略が繰り返しゲームの解として位置づけられたというのと、アクセルロッドのコンテストでラパポートが勝ったというのは、ここでは別個の話として考えています)。

(話ずれますが、相手と自分とで認識がずれてますよっていう状態でのゲームが個人的に大好きで論文書いたこともあるくらいなので、このへんを専門的に扱うハイパーゲームとか認識論的ゲーム理論みたいな分野がもっとメジャーになってくれると嬉しいです。ハイパーゲームなんてゲーム理論の専門家ですら知らないし。なんでかなー。みんなそんなにベイジアンが好きなの?)


んで『2.ナッシュ均衡解を含めたゲーム理論は基本的に試行回数の有限性を前提としていない』かどうか。まず、ゲーム理論が扱うゲームが何を前提としているかは、そこに書いてあるゲームがどのように定式化されているかによります。1回きりゲームと書いてあれば当然前提は1回きりですし、無限回と書いてあれば無限回前提です。ただ、ベーシックなゲーム理論が扱うのは「1シリーズ限定」であることが多い、とはいえると思います。つまり「無限回ゲームを一回だけ」とか。進化論ゲームとかの話が持ち出されると微妙になっちゃいますけど。

ゲーム理論自体はそれでいいとして、ナッシュ均衡という解概念についてはどーなの?というのは当然別の問題です。ということで箪笥の奥から教科書を引っ張り出してきました (Osborne and Rubinstein, "A Course in Game Theory", The MIT Press, 1994) 。この本の Ch.1.5 The Steady State and Deductive Interpretations, 引用はめんどくさいんで省きますが、要は Steady State (または evolutive) な解釈と deductive な解釈というのがあって、前者だと「みんながゲームをいっぱいプレーした結果このへんに落ち着いてるみたいなんでそれを数学的に分析するとこーゆう意味なんだよ」という解釈、後者だと「いや1回きりのゲームで合理性について要件を被せるとこうすべきであるという正解がでてくるのだ」という解釈になります(リクエストをいただければ、原文を直接引用します)。後者だとワンショット前提、前者だと無限回(すくなくともたくさん回)前提と言っていいんじゃないでしょうか。つまりどっちもあると。

そして『3. 実際のゲームにゲーム理論を持ち込むこと自体が危険行為』。実際のゲームというのがいわゆるドイツゲームの場合、その全体をゲーム理論で捌こうというのは無謀以外の何者でもなく、結局のところゲーム理論による分析というのはゲームの構造が分析可能な程度の大きさであることを前提としているのに対して、ドイツゲーム(に限らずロジカルなゲーム一般)は分析しきれないくらいの大きさを持っていることを前提としていますから。「クク」程度のゲームでさえ、分析をやろうとすると一筋縄ではいきません。さてならば繰り返しじゃんけんとか繰り返し囚人のジレンマゲームみたいな小さいゲームを実地に持ち込めるかどうか。うーん。共有知識をどれくらい信じられるかどうかですかねー。

(個人的にはゲームを作るときにゲーム理論を齧ってると便利かなー、と思ってます。)


なお本文で疑念を出した混合戦略の解釈についても、前掲書Ch.3.2でスペースを取っていろんな立場(5つほど書かれています)が述べられてます。専門家にとっても混合戦略均衡の解釈ってのはけっこう厄介なものみたいですね。ただ、本文でメインに取り上げているのは混合戦略の怪しさよりも「じゃんけんにおける」ナッシュ均衡の解としての弱さなので、ここでは教科書の引用は止めておきます。
[PR]
by Taiju_SAWADA | 2005-12-25 15:25 | うわごと
<< 欧州ゲーム屋紀行 パリ編(前編) じゃんけんの行方 >>