<   2005年 12月 ( 2 )   > この月の画像一覧

「じゃんけんの行方」に関する補注

はーい、ゲーム理論の時間ですよー。好きな人だけよっといでー。

※ほんとにゲーム理論関連だけです。数式こそ出てきませんが専門用語とか注釈なしでばんばん登場します。申し訳ない。

EL-CO さんのコメント (2005-12-15)

ナッシュ均衡解を含めたゲーム理論は基本的に試行回数の有限性を前提としていないように思われます(専門家ではないので断言は出来ませんが、私の知る限りにおいてはそうです)。しかしながら実際のゲームにおいては試行回数は有限であり、「この1回に勝つか(あるいはこれからの数回において勝ち越すか)」こそが重要なのです。なので次の1回に勝てばその戦略が最適でなかろうが、その後ずっと負け越すことになろうがどうでもいい、というわけです。「囚人のジレンマ」において報復戦略が有効、とか言っても当の囚人にとっては「今ここでどうするか」だけが問題なのです。全体として個人的には「実際のゲームにゲーム理論を持ち込むこと自体が危険行為」だと思っています。


ということで今日はこのコメントへの回答です。ちょっと話が錯綜しそうなので、いくつかの文に分解して、順番も弄らせていただきたいと思います。


1a. 「囚人のジレンマ」において報復戦略が有効、とか言っても当の囚人にとっては「今ここでどうするか」だけが問題

1b. 「この1回に勝つか(あるいはこれからの数回において勝ち越すか)」こそが重要なのです。なので次の1回に勝てばその戦略が最適でなかろうが、その後ずっと負け越すことになろうがどうでもいい

2. ナッシュ均衡解を含めたゲーム理論は基本的に試行回数の有限性を前提としていない

3.「実際のゲームにゲーム理論を持ち込むこと自体が危険行為」


ということで楽な問題から片付けましょう。『1a. 報復戦略と「いまここ」』の話から。これは単純なことで、例示されている『当の囚人にとっては「今ここでどうするか」だけが問題』は1回きりの囚人のジレンマゲームであるのに対して、報復戦略は無限回繰り返し囚人のジレンマゲームの解(割引率に関して条件を付与する必要がありますが)を構成する戦略です。1回きり囚人のジレンマゲームと無限回繰り返し囚人のジレンマゲームは(ゲーム理論の範疇では)全然別のゲームですので、1回きり囚人のジレンマゲームのプレイヤーであるところの当の囚人さんが報復戦略に基づいて行動しないのは、ゲーム理論的に言えば当然です。

『1b. この一回に勝つかどうかこそが重要』についても、少なくともそう考えている人としては単純に1回きりのゲームをプレーしているのです、として片付けることができます。これからの数回の結果が重要だという人は、そういう割引率設定のゲームのプレイヤーなんでしょう。但し前項の話と違うのは、相手プレイヤーと認識に差があるかもしれないという点で、向こう側が五回ベースで考えていてこっちは無限回ベースで考えているとか、そうなると共有知識の前提が成り立たなくなるのでベーシックなゲーム理論の範疇ではなくなります(いや、じゃんけんだとどうせ1/3混合ですけど。囚人のジレンマなら)。

今は相手固定ってことにしましたけど、相手があちこちにいていろんな人とゲームする、というような、有名なアクセルロッドのコンテストみたいな状況だとさらに違って、これはどっちかというと実験経済学の話になると思います(報復戦略が繰り返しゲームの解として位置づけられたというのと、アクセルロッドのコンテストでラパポートが勝ったというのは、ここでは別個の話として考えています)。

(話ずれますが、相手と自分とで認識がずれてますよっていう状態でのゲームが個人的に大好きで論文書いたこともあるくらいなので、このへんを専門的に扱うハイパーゲームとか認識論的ゲーム理論みたいな分野がもっとメジャーになってくれると嬉しいです。ハイパーゲームなんてゲーム理論の専門家ですら知らないし。なんでかなー。みんなそんなにベイジアンが好きなの?)


んで『2.ナッシュ均衡解を含めたゲーム理論は基本的に試行回数の有限性を前提としていない』かどうか。まず、ゲーム理論が扱うゲームが何を前提としているかは、そこに書いてあるゲームがどのように定式化されているかによります。1回きりゲームと書いてあれば当然前提は1回きりですし、無限回と書いてあれば無限回前提です。ただ、ベーシックなゲーム理論が扱うのは「1シリーズ限定」であることが多い、とはいえると思います。つまり「無限回ゲームを一回だけ」とか。進化論ゲームとかの話が持ち出されると微妙になっちゃいますけど。

ゲーム理論自体はそれでいいとして、ナッシュ均衡という解概念についてはどーなの?というのは当然別の問題です。ということで箪笥の奥から教科書を引っ張り出してきました (Osborne and Rubinstein, "A Course in Game Theory", The MIT Press, 1994) 。この本の Ch.1.5 The Steady State and Deductive Interpretations, 引用はめんどくさいんで省きますが、要は Steady State (または evolutive) な解釈と deductive な解釈というのがあって、前者だと「みんながゲームをいっぱいプレーした結果このへんに落ち着いてるみたいなんでそれを数学的に分析するとこーゆう意味なんだよ」という解釈、後者だと「いや1回きりのゲームで合理性について要件を被せるとこうすべきであるという正解がでてくるのだ」という解釈になります(リクエストをいただければ、原文を直接引用します)。後者だとワンショット前提、前者だと無限回(すくなくともたくさん回)前提と言っていいんじゃないでしょうか。つまりどっちもあると。

そして『3. 実際のゲームにゲーム理論を持ち込むこと自体が危険行為』。実際のゲームというのがいわゆるドイツゲームの場合、その全体をゲーム理論で捌こうというのは無謀以外の何者でもなく、結局のところゲーム理論による分析というのはゲームの構造が分析可能な程度の大きさであることを前提としているのに対して、ドイツゲーム(に限らずロジカルなゲーム一般)は分析しきれないくらいの大きさを持っていることを前提としていますから。「クク」程度のゲームでさえ、分析をやろうとすると一筋縄ではいきません。さてならば繰り返しじゃんけんとか繰り返し囚人のジレンマゲームみたいな小さいゲームを実地に持ち込めるかどうか。うーん。共有知識をどれくらい信じられるかどうかですかねー。

(個人的にはゲームを作るときにゲーム理論を齧ってると便利かなー、と思ってます。)


なお本文で疑念を出した混合戦略の解釈についても、前掲書Ch.3.2でスペースを取っていろんな立場(5つほど書かれています)が述べられてます。専門家にとっても混合戦略均衡の解釈ってのはけっこう厄介なものみたいですね。ただ、本文でメインに取り上げているのは混合戦略の怪しさよりも「じゃんけんにおける」ナッシュ均衡の解としての弱さなので、ここでは教科書の引用は止めておきます。
[PR]
by Taiju_SAWADA | 2005-12-25 15:25 | うわごと

じゃんけんの行方

昔々。たしか「電撃アドベンチャーズ」という雑誌に、ゲームデザイナーの清松みゆきさんだったと思うのですが、誰かが「じゃんけんは最適解(グー・チョキ・パーをそれぞれ等確率で出すのが最適)がすぐわかるのでゲームとしては駄目だ」というような内容のことを書かれていました。書かれていたはずです。書かれていたような気がします。ちょっと自信ない。雑誌名と著者名はともかく昔々そのような内容の記事があってそれを読んだのは確かなので話を続けます。話と言うのはなにかといえば、つまりこれってほんとにほんとなのか。

このグーチョキパー各三分の一、というのは「(ゲーム理論における)混合戦略ナッシュ均衡解」なる解概念を用いたときの解です。そもそもの問題として、この概念は確かにゲーム理論ワールドの中の話としてはたいへんベーシックなものではあるものの、だいたいゲーム理論自体が電撃アドベンチャーズ誌上(って決め付けてますが)で注釈無しに使って「だれでもすぐわかる」と言い切れるようなメジャーなものではないように思うのですが、とりあえずそれは関係ないんで脇に置きましょう。

ここで触れたい問題は二つあります。まず先に簡単なほうの問題ですが、「三分の一ずつ」という確率論をここで急に持ち出したところで、その「三分の一」ってどうやってつくるのよ、という実用性に関する疑問があります。常日頃からポケットにサイコロを忍ばせてじゃんけんが発生するたびにいったん後ろ向いてしゃがんで誰にも覗かれないようにしてサイコロ振るのか、と。それともポケットコンピュータを忍ばせてじゃんけんが発生するたびにメルセンヌツイスター、ってしつこいですか。そりゃ数学的にはそれでいいかもしれないけど一回きりの問題で確率とか言われても無粋だよねえ、という気分もあります。

そしてもう一つ、簡単じゃないほうの問題。ナッシュ均衡解ってそんなに信用できるもんなの?

つまりね、相手が延々とパーを出しているときに、こっちとしてはそれを無視して「三分の一」(というのを簡単に作り出せる確率発生器を持ってるという仮定の上ですけど)を続けることができるのか、ということなのですよ。ナッシュ均衡解というのは、「相手が三分の一で来るみたいだから、こっちも三分の一でまあ問題ないよね」ということを互いに思っている(のでお互いに延々と三分の一をやり続ける)という状態ですから、相手がパーを出し続けるという手を使ってきているんであれば、敢えて三分の一を続けるよりもよっぽど良いやり方(要はチョキを出すことですね)があるわけです。

ここでポイントになることのひとつめ。相手が三分の一で来てるってなんで解るのか。一回きりとか三回勝負とかのじゃんけんで、何を根拠に「相手が三分の一で来てるみたい」とか言えるんですか?

んで二つ目のポイントは、三分の一って別に誰に対しても必ず勝てるキングオブキングスでは全然なくて、単にイーブンに持ち込めるだけだ、ということです。一応負けないのは事実だから(事実なんです)先ほどのナッシュ均衡とかいうものに当てはまってはいますが、イーブンはもちろん勝ちではない。三分の一をやってるかぎり、永遠にじゃんけんには勝てません。

でもって最後のポイント。いままで書いてきたようなことを相手がまともに考えてるって保証はどこにあるのか。相手がゲーム理論っぽい考え方を知ってて、その考え方に同意していて、もちろん混合戦略の実用性も認めていて、まともな乱数発生器を持っていて、こっちもそれは一緒で、あっちもそのことはわかっていて、こっちもそのことはわかっていて、あっちも「こっちもそのことはわかってい」ることはわかっていて、以下略、ってとこまで言えないと、この話はそもそも成り立ちません。相手が「そんなこと知ったこっちゃない」という態度を取った時点で終わりというだけならまだしも、こっちが「相手が『そんなこと知ったこっちゃない』という態度を取るかも」と思った時点で終わりなわけで、これではあまりにもフラジャイルではありますまいか。

何が言いたいのかというと、じゃんけんに面白みがあるとすればこの部分じゃないかということです。この部分というのはつまり解の不安定性で、一応両方が三分の一を出し続ければそれでおしまいということは解っているにもかかわらず、その膠着状態はどっちかが息を吹きかけただけで・どっちかに息を吹きかけられたような気がしただけで、思い切り崩れてしまう。しかし崩れてしまえばやりたい放題かといえば、そこには崩れ落ちたとはいえ三分の一の枠がいることはいるわけで、こいつを横目で見ながら今バランスはどんな感じかなー、これからどうしようかなー、と考える、そして考えることそのものがバランスを振らせる原因になる。ですからじゃんけんというのは、三分の一が解析のゴールなのではなくて、三分の一をスタートにしてバランスのぶれを楽しむゲームである筈なのです。


いや、正直じゃんけんが面白いかと言われると困っちゃいますけど。
[PR]
by Taiju_SAWADA | 2005-12-13 01:06 | うわごと