コンテンツにスキップ

ε均衡

出典: フリー百科事典『ウィキペディア(Wikipedia)』

ゲーム理論において ε 均衡 (イプシロンきんこう,epsilon-equilibrium) または近似ナッシュ均衡 (near-Nash equilibrium) とは,ナッシュ均衡の条件を近似的にみたすような戦略プロファイルのことである.

定義

[編集]

ゲームと非負の実数 ε とを所与として,戦略プロファイルが ε 均衡であるとは,どのプレーヤーにとっても,自分の戦略からの単独での逸脱によって,期待利得を ε より大きく改善することができないことをいう.任意のナッシュ均衡は,ε = 0 の場合の ε 均衡に等しい.

形式的に書こう.N 人のプレーヤーがいて,各プレーヤーの行動集合が , 効用関数が u であるようなゲームを とする.戦略の組 G の ε 均衡であるとは,

であるときをいう.

[編集]

ε 均衡の概念は,無限に継続する可能性のある確率ゲームの理論において重要である.ナッシュ均衡が存在しないが,0 より厳密に大きい任意の ε について ε 均衡が存在するような,簡単な確率ゲームの例がある.

おそらくもっとも簡単な例は,エヴェレットにより提案された,次のようなマッチングペニーの変種だろう.プレーヤー 1 はペニー硬貨を隠し,プレーヤー 2 はそれが表か裏かを推測する.プレーヤー 2 が正しく当てたならば,プレーヤー 1 からペニーをもらってゲームが終了する.プレーヤー 2 が,表と推測して外したならば,両プレーヤーの利得を 0 としてゲームが終了する.プレーヤー 2 が裏と推測して外したならば,ゲームは繰りかえす.もしゲームが永久に続くならば,両プレーヤーの利得は 0 になる.

パラメータ ε > 0 を所与として,プレーヤー 2 が,(ゲームのステージによらず,それ以前のステージとも独立に) 表を確率 ε, 裏を確率 1 − ε と推測するような任意の戦略プロファイルは,このゲームの ε 均衡になる.このような戦略プロファイルにおけるプレーヤー 2の 期待利得は少なくとも 1 − ε になる.しかし,ちょうど 1 の期待利得を保証するようなプレーヤー 2 の戦略は存在しないことが簡単にわかる.したがって,このゲームはナッシュ均衡をもたない.

べつの簡単な例として,T 期間の有限回繰りかえし囚人のジレンマを考え,利得は T 期間の平均で与えられるものとしよう.このゲームの唯一のナッシュ均衡は,各期において裏切りを選ぶというものである.ここで,2 つの戦略,しっぺ返し戦略グリムトリガーを考えよう.しっぺ返しもグリムトリガーもこのゲームのナッシュ均衡にならないが,どちらもある正なる ε について ε 均衡になる.ε の許容される値は,ステージゲーム利得と繰りかえしの期間数 T に依存する.

経済学において,純粋戦略 ε 均衡の概念は,混合戦略によるアプローチが現実的でないとみなされるときに使われている.純粋戦略 ε 均衡においては,各プレーヤーは,最適な純粋戦略から ε 以内だけ離れた純粋戦略を選択する.例として,ベルトラン・エッジワースモデル英語版においては,純粋戦略均衡は存在しないが,純粋戦略 ε 均衡は存在しうる.

参考文献

[編集]
  • Dixon, H Approximate Bertrand Equilibrium in a Replicated Industry, Review of Economic Studies, 54 (1987), pages 47-62.
  • H. Everett. "Recursive Games". In H.W. Kuhn and A.W. Tucker, editors. Contributions to the theory of games, vol. III, volume 39 of Annals of Mathematical Studies. Princeton University Press, 1957.
  • Leyton-Brown, Kevin; Shoham, Yoav (2008), Essentials of Game Theory: A Concise, Multidisciplinary Introduction, San Rafael, CA: Morgan & Claypool Publishers, ISBN 978-1-59829-593-1, http://www.gtessentials.org . An 88-page mathematical introduction; see Section 3.7. Free online at many universities.
  • R. Radner. Collusive behavior in non-cooperative epsilon equilibria of oligopolies with long but finite lives, Journal of Economic Theory, 22, 121-157, 1980.
  • Shoham, Yoav; Leyton-Brown, Kevin (2009), Multiagent Systems: Algorithmic, Game-Theoretic, and Logical Foundations, New York: Cambridge University Press, ISBN 978-0-521-89943-7, http://www.masfoundations.org . A comprehensive reference from a computational perspective; see Section 3.4.7. Downloadable free online.
  • S.H. Tijs. Nash equilibria for noncooperative n-person games in normal form, Siam Review, 23, 225-237, 1981.
pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy