ナッシュ均衡

2023-08-01 17:07:07

ICS認証とは何ですか? QUICとは何ですか?

目次

  1. Q1:ナッシュ均衡とは何ですか?
    1. ナッシュ均衡(Nash equilibrium)は、ゲーム理論の概念です。
    2. ナッシュ均衡は非常に重要です。
  2. Q2:ナッシュ均衡をどう活用しますか?
    1. 囚人のジレンマを分析します。
    2. 智豚ゲームを分析します。
    3. 共有地の悲劇を分析します。

Q1:ナッシュ均衡とは何ですか?

1、ナッシュ均衡(Nash equilibrium)は、ゲーム理論の概念です。

安定したゲームでは、一方的に戦略を変えたほうが損をします。

二人の囚人が告発し合うのがナッシュ均衡です。

それぞれの囚人にとっては、ナッシュ均衡を破って相手が告発戦略を実行したときに告発戦略を変えて黙秘すれば、自分は懲役2年から懲役5年になります。

つまり、2人の囚人がお互いに安定ゲームの結果、どちらか一方が戦略を変えて損をしていることを告発し合うのです。

これがバランスの意味するところで、どちらの囚人も利己的に一方的に戦略を変えたりはしません。ゲームの戦略が安定すれば、ゲームの結果も安定します。

ナッシュ均衡と名付けられたのは、発案者が経済学者でゲーム理論の創始者であるジョンであることに由来します。ナッシュです。

非協力的なゲームの均衡と呼ばれる理由は、2人の囚人が協力して沈黙を守っていれば、それぞれ1年間刑務所にいればよいからです。しかし最終的なゲームの結果ナッシュ均衡は顕著でした

征、非協力です。

2、ナッシュ均衡は非常に重要です。

ナッシュ均衡の提唱は、経済学界を揺るがしました。

ノーベル経済学賞受賞者のサミュエルソンは、「オウムに『需要と供給』を教えれば、オウムも経済学者だ」と言いました。ゲーム理論の専門家キャンドリーは、「このオウムはもう一つ、『ナッシュ均衡』という言葉を学ばなければならなくなった」と言います。

ノーベル経済学賞を受賞したマイケルも、「ナッシュ均衡の発見は、生命科学におけるDNAの二重らせんの発見に匹敵する」と述べています。

ナッシュもナッシュ均衡を提唱したゲーム理論の創始者として、1994年にノーベル経済学賞を受賞しています。

納値均衡は非常に大きな意味を持ち、簡単に言えば経済学にとって大きな意味を持ちます。

経済学の見えない手の原理を知っている人なら、古典経済学では市場という「見えない手」の調節を通じて、個人が私利を追求する行動が集団の利益を最大化すると考えたことがわかります。

しかしナッシュ均衡は、2人の囚人がそれぞれ自分の利益を追求することで、集団(囚人全体)の利益を最大化するのではなく、相手を損ねて利己的になるという原理に反しています。

ここが市場の失敗の弱点であり、ゲーム理論の視点から論理的に説明することで、より適切な解決策を見出すことができるのです。このような点からも、ゲーム理論の重要性は「一斑一豹」として感じられます。

さらに重要なことは、ナッシュ均衡は個人間のコミュニケーションから、企業間の競争、国家間の交流に至るまで、非常に一般的であることです。

Q2:ナッシュ均衡をどう活用しますか?

1、囚人のジレンマを分析します。

囚人のジレンマナッシュ均衡の結果は、前述したように、2人の囚人が互いに告発し合うことになります。このプロセスを理解するのは難しくありません

心理学的には、二人が隔離されているために、お互いに情報を伝えられず、口裏を合わせられないと、保身のために自分を売るのではないかと疑われます。

さらに経済学的には、囚人は「合理的経済人」であり、見えない手の原理に従って利己的な選択をします。

もし彼が自白すれば私が黙っていれば5年間刑務所に入れられますもし私が告白するならば、多くて2年です;もし彼が沈黙すれば、私も沈黙すれば、私は1年の判決を受けます。私が告白すれば釈放され彼は5年服役します

総合すると、相手が告白しようがしまいが、私にとっては告白したほうが得なのです。

2人ともそう思っているので、最終的には2年の懲役刑を受けることになります。つまり、「すべて告白する」ことが囚人のジレンマにおける唯一の安定した「ナッシュ均衡」なのです。

囚人のジレンマの例からもわかるように、あるゲームにおいて、相手の戦略の選択にかかわらず、当事者の一方はある決定戦略を選択します。この確定的な戦略を支配的戦略といいます。

2つのゲーム当事者の戦略が組み合わさって、それぞれが支配的な戦略を構成している場合、その組み合わせをナッシュ均衡と定義します。これがナッシュ均衡の定義です。

囚人のジレンマに対処し、集団の利益を最大化するために、ゲーム理論の視点、つまり数学的思考を用いると、2つの理由が見えてきます。

1つ目は誘惑を裏切り協力報酬です

協力報酬は懲役1年ですが、裏切りの誘惑は即釈放です。「すべてを告白しない」というのは安定的なナッシュ均衡ではありません

 

第二に、だまされて支払って、裏切って罰します。

里切りは懲役2年ですが、詐欺払いは懲役5年です。これにより「すべてが正直であること」が安定したナッシュ均衡となります。

ゲーム理論の視点から囚人のジレンマの原理を理解すれば、解決策は簡単に手に入ります。里切りには罰を与え、だまされて支払います。

例えば、ギャング映画のギャングは、ギャングが刑務所に入れば、「家族の面倒を見てあげて、出所後には大金を出してあげます」と言われます。

投獄されたギャングが自白によって釈放された場合ギャングは復讐を企てるでしょう協力報酬>裏切りの誘惑です。

たとえば、ヤクザは「忠義の文化」を形成し、心理的には「裏切りの罰」が加わります。「仁義を守らないと、ヤクザ全体から見放され、出所後の就職ができなくなる」ということです。これが裏切り罰を増やすということです。

ギャングは里切られた場合、お金や家族の世話をするだけでなく、里切られた人を追いかけたり、復讐したりもします。これが詐欺被害を減らすということです。一増一減は、里切り罰>騙払いです。

これは制度設計によって、望ましくないナッシュ均衡を、望ましくないナッシュ均衡に変えるということです。

同様に、両社が提携していても、お互いに不信感を抱かないためには、このような原則を採用することができます。例えば、契約不履行条項を締結することができて、一方の契約不履行に十分なコストを払わせて、共同で投資して、唯一の安定したナッシュ均衡になります。

2、智豚ゲームを分析します。

もう1つ、ゲーム理論の古典的なゲームの例として、「ピッグゲーム」があります。

ピッグゲームとは、豚小屋はとても長く、片方が踏み台で、もう片方が餌場になっているゲームです。片方でペダルを踏むと、片方のエサ場から10個のエサが落ちてきます。

豚小屋の中に、大きな豚がいました。誰がペダルを踏むにしても、食べ物2食分のエネルギーを消費します。

ペダルの踏み方には、4つのパターンがあります。

1つ目は、大ブタと小ブタがエサ場のそばにいて、相手がペダルを踏むのを待っているパターンです。これでは誰も食べません。

二つ目は、大ブタと小ブタが同時にペダルを踏み、エサ場に駆け寄り、同時に食べます。大きい豚は比較的に食べることができて、7人分の食物を食べて、減らして走って2人分の体力を消耗して、実際に5人分を得ます;小豚が食べます

3人分、1人分いただきます。

3つ目は、大ブタがエサ場を守り、小ブタがペダルを踏むというパターンです。この時大きいブタはもっと多く食べることができて、ただ9分を得て、その上運働がないため、実際に9分を得ます;小豚はペダルを踏んでエサ場に行くと、1人分しか食べられません。走ることで2人分の体力を消耗することを差し引けば、マイナス1人分になります。

四つ目は、小ブタがエサ場を守り、大ブタがペダルを踏むというパターンです。この時小豚は先を争って、4人分まで食べることができて、実際に4人分を得ます;大ブタは走って帰ってきて、また6人分まで奪うことができて、実際に4人分を得ます。

この4つを分析すると、「ピッグゲーム」におけるナッシュ均衡は、「大ブタはペダルを踏み、小ブタは動かない」というものです。

なぜなら、大ブタがペダルを踏まないように戦略を変えると、「大ブタは動かない、小ブタは動かない」という組み合わせになり、大ブタの利益は4から0に減るのですが、大ブタはそんなことはしません。

もし小ブタが一方的にペダルを踏む戦略を変えたら、戦略の組み合わせは「大ブタがペダルを踏む、小ブタがボードを踏む」になり、小ブタの利益は4から1に減ります。小ブタもしません。

ですから、「大ブタはペダルを踏み、小ブタは動かない」というのは、それぞれが4つのエサを得る、安定したナッシュ均衡なのです。

ヒッチハイクに覚えがあれば、「ピッグゲーム」では、「小ブタ」は「大ブタ」に乗ってペダルを漕いで、苦労せずにタダで乗っています。

これは囚人のジレンマとは異なり、2人の囚人がそれぞれの思惑を抱えていても、お互いに利益を得て、お互いに損失を得て、結果としてナッシュ均衡が現れます。しかしサピエンスのゲームでは明らかに子ブタが占めています

優です。

仕事でもプライベートでも、このようなヒッチハイクはたくさんいます。

例えば、小さい不働産業者は、大きいブランドの不働産業者のプロジェクトの周りに土地を持って、生地を炒めて熟して、自分のプロジェクトの価値を上げさせます。

たとえば、大企業が巨額の研究開発費を投じて、儲けの仕組みが実証された新市場に参入するのを待って、そこから細分化された市場に便乗しているとします。

例えば、発展途上国は「追従型国家戦略」を立てて、科学技術・産業・イノベーションに「便乗」し、痩せていたものから太っていたものへ、小さくて大きくなっていたものへと変化しています。

もちろん、ヒッチハイクには良いものも悪いものもありますが、ナッシュ均衡を理解していれば解決策を提示し、良いヒッチハイクを奨励し、悪いヒッチハイクを減らすことができます。

たとえば、ピッグゲームでは、豚を飼っている人(第三者)がエサ場の中にある区画を決めて、ペダルを踏んだ豚だけを独占します。そうすれば、大ブタは心配することなく、自分で力を出して、エサ場に行ったらエサがなくなっていました。

同様に、国のデザイン特許保護制度は、特許を一定期間限定で取得できるようにすることを目的としており、人や組織が創意工夫をすることを奨励しているわけではありません。

制度が整備されたとき、小ブタや怠け者のブタ、あるいは遅いブタは、エサ場で待っていることが優位ゲームの戦略ではないことに気づき、ペダルを踏もうとするでしょう。

3、共有地の悲劇を分析します。

囚人のジレンマ、サピエンスのブタのゲームに加えて、古典的なゲームの3つ目、共通の悲劇でいう共有地の悲劇を紹介します。

1968年にイギリスの学者ハーディングは『サイエンス』志の上で1編の「公地の悲劇」という文章を発表します。

文章は1つの無料ですべての牧人に開放牧場があると仮定して、理性的な人として、すべての牧人はすべて自分の収益を最大化したいです。

羊が1頭増えるごとに2つの結果が得られます二は草地の負担を重くして、草地を過度に放牧させる可能性がありますが、その危害は全体の牧人が分担して、各羊飼いは平均した後のあの小さい部分だけを負担します。

羊飼いたちは考えた末、牧草地の許容能力を無視して、羊の数を増やすことにしました。すると、羊が増えて収益が上がるのです。

儲かると見て、他の羊飼いたちもそれに加わりました。羊の立ち入りが制限されないために牧場が酷使され、草地の状態が急速に悪化してこれだけの羊を放牧できなくなり、砂漠化さえして放牧できなくなりました。

そのプロセスとは、羊飼いが公共の牧場を使う自由を利用して、資源の枯渇、集団の壊滅へと突き進むことです。

共有地の悲劇モデルでは、ナッシュ均衡とは、それぞれの羊飼いが羊を多く飼っているにもかかわらず、社会全体にとって最適な結果にはならず、再び見えない手の原理に逆らうというものです。

これはナッシュ均衡ですが、悪いナッシュ均衡であり、それを良いナッシュ均衡に変える解決策を考える必要があります。

例えば、所有権、使用権、収益権、規制権、資源税などの権益と義務を明確にし、制度設計を行います。

例えば公共資源の私有化です牧場をN分割して、N人の羊飼いに分けます。そうすれば、羊飼いの一人一人が過剰な放牧の弊害のコストを負担することになり、放牧と牧場の保護のバランスがとれるようになります。

たとえば、規制強化です。公共資源の私有化ができない場合、例えば空気や海などは、環境保護費を徴収したり、許可証を発行したり、禁漁期間を設定するなどの制度を使って、資源の枯渇を避けるために規制を強化することができます。

このように、ナッシュ均衡という視点があって、仕事、生活、組織、社会などを見ていくと、制度の状況によって、さまざまなナッシュ均があり、良いものも悪いものもあることがわかります。

衡です。

などなど、ナッシュ均衡の視点で仕事、生活、組織、社会などを見ると、さまざまな制度的条件の下で、良いナッシュ均衡と悪いナッシュ均衡が存在することがわかります。

これらのナッシュ均衡の特徴を理解すると、体系的に考え、適切な薬を処方し、活用された解決策を見つけ、悪いナッシュ均衡を可能な限り良いナッシュ均衡に変換する能力がさらに高まります。