進化ゲーム

進化ゲーム理論（しんかゲームりろん、英: evolutionary game theory）とは、ゲーム理論の枠組みを集団遺伝学や個体群動態論に応用して成立した理論である。ジョン・メイナード＝スミスとジョージ・プライスが進化的に安定な戦略を提唱した1973年の論文^[1]をもってその誕生とされ^[2]^[3]、1980年代になるとゲーム理論を生み出した経済学を含む社会科学に逆輸入された^[4]。

一般的な非協力ゲーム理論は、強支配される戦略の繰り返し消去による反復支配戦略均衡や後ろ向き帰納法による部分ゲーム完全均衡のように、「事前に」利得関数を把握し適切な戦略を計算してからゲームに臨む合理的なプレイヤーを想定してその意思決定を分析するが、進化ゲーム理論は、繰り返されるゲームの中でゲーム結果である利得に基づいて「事後的に」戦略を変更していくプレイヤー (の集団) を想定してその状態 (戦略分布) の変化を力学系として分析する理論で、一切の合理的思考を行わないプレイヤーをも扱える^[5]。どの戦略が安定して繁栄するのかを分析する安定性概念として進化的に安定な戦略^[2]^[6]^[7]^[8]などを、ある状態からどの安定状態に向かうのかを分析する動学的モデルとして、プレイヤーの出生死滅 (自然選択) で集団状態が変化するレプリケーターダイナミクス^[4]^[9]^[10]^[6]や、プレイヤーの学習によって戦略分布が変化する学習ダイナミクス^[11]などを用いる。

歴史

非協力ゲーム理論の創始者であるジョン・ナッシュはその1950年の博士論文において既に、混合戦略を含めたナッシュ均衡点の大衆行動 (mass-action) としての解釈について、ゲームの全体構造についての完全な知識や複雑な論理的思考の能力や性向を仮定せずに、可能な純粋戦略の相対的な利益についての経験的な情報の蓄積を仮定して論じていた^[12]^[13]。それから20年余りが経った1973年、ともに物理学の背景を持つ数理生物学者のジョン・メイナード＝スミスと集団遺伝学者のジョージ・プライスは戦略の突然変異について頑健な戦略として進化的に安定な戦略 (ESS) の概念を提唱し^[1]^[7]、その後、ピーター・テイラーとレオ・ジョンカーが1978年に自然選択に基づくレプリケーターダイナミクスを用いて戦略の動学的な安定性を検討した^[10]^[14]。1980年代後半には経済学や政治学などの社会科学分野に進化ゲーム理論の成果が逆輸入され^[4]、1990年代以降は試行錯誤や模倣といった単純な学習や、現在の集団状態への最適反応をとる、さらに相手の過去の行動から将来の行動を予測して最適反応をとる (仮想プレイを行う) 複雑な学習などによる戦略分布の変動を分析する学習ダイナミクス^[11]、選択が重視されてきた従来のダイナミクスに対して突然変異を選択圧を覆しうる強力な作用と捉える確率進化^[15]、ゲームをプレイする相手が完全な無作為抽出ではない選択的相互作用^[16]などが研究されている。

進化的に安定な戦略

→詳細は「進化的に安定な戦略」を参照

進化的に安定な戦略 (evolutionarily stable strategy, ESS) とは、「集団内のすべての個体がその戦略を採っている (既存戦略である) とき、いかなる他の戦略も、ある割合まで (この上限値を侵入障壁という) の小規模な侵入では既存戦略よりも低い期待利得しか得られない」ような戦略のことであり、適応度を利得にあてると、いかなる突然変異や集団外からの侵入であってもそれが単一の変異であり小規模であれば集団内に広まらず淘汰されることを意味する^[17]^[18]。混合戦略単体のどの面もコンパクトであることから、侵入障壁には下限が存在し、これを一様侵入障壁という^[19]。また、ESSは混合戦略単体上のある近傍に対して、自身以外のいかなる戦略に対しても相手戦略自身より高い利得を得るという局所的優越性を持つ^[20]。

ESSの条件を緩めた概念に以下の2つがある。

中立安定戦略 (neutrally stable strategy, NSS)

ESSは侵入後の状態において侵入戦略よりも厳密に高い期待利得を得ることを要求するのに対して、NSSは変異戦略に劣らなければよいとするもので、この弱い意味での侵入障壁について下限である一様弱侵入障壁を持ち、ある近傍について、自身以外のいかなる戦略に対しても相手自身に利得で劣らないという局所的弱優越性を持つ^[21]。

均衡侵入に対して頑健な (robust against equilibrium entrant, REE) 戦略

REE戦略はある障壁以下の侵入ではいかなる他の戦略も侵入後の状態に対する最適反応になりえないような戦略として定義され、言わば考慮する侵入戦略を侵入後に最適反応となるものに限定するものであり、実際、REE戦略をとりあう戦略プロファイルはプロパー均衡であるという意味で合理的な摂動に頑健である^[22]。

レプリケーターダイナミクス

→詳細は「レプリケーターダイナミクス」を参照

レプリケーターダイナミクス (replicator dynamics) または(自己)複製子動学とは、個体群のシェアが選択圧によって変化する動的な側面を力学系を用いて表現したものであり、安定性という静的な側面を表現したESSとは対照的な概念であり^[9]、また、自然選択による集団の変化に注目したものという意味でも、突然変異に注目して考案されたESSとは対照的である^{[注釈 1]}^[23]。ESSとレプリケーターダイナミクスの両者は「進化ゲーム理論におけるいわば車の両輪」^[9]とされる。また、レプリケーターダイナミクスは一般化ロトカ・ヴォルテラ方程式（英語版）として捉えることもできる^[24]

集団の状態(戦略分布)を同じ確率分布の混合戦略 $x$ で表現し、その状態における純粋戦略 $i$ のシェアを $x i$ で表すと、混合利得関数 $u$ のもとで、連続時間のレプリケーターダイナミクスは以下の時間に対する微分方程式で表現される自励系である^[23]。

{\dot {x_{i}}}=[u(e^{i},\,x)-u(x,\,x)]x_{i}

ここで、ドット符号は時間での微分を表し(ニュートンの記法)、 $e i$ は純粋戦略 $i$ を確率1でとる混合戦略を表す。このダイナミクスにおいては、反復強支配される戦略はシェアが0に収束し^[25]、対称ナッシュ均衡点は定常^[26]、NSSはリアプノフ安定^[27]、ESSは漸近安定^[28]となることが知られている。

また、差分方程式で表現される離散時間でのダイナミクスには、世代区分ダイナミクスと世代重複ダイナミクスとがある。世代区分ダイナミクスは背景利得を $α$ として

x_{i}(t+1)={\frac {p_{i}(t+1)}{p(t+1)}}={\frac {\alpha +u(e^{i},\,x(t))}{\alpha +u(x(t),\,x(t))}}x_{i}(t).

で表現される^[29]。この差分方程式の下では毎回全ての個体が死滅して新しい世代が一斉に生まれることになる。代わりに、単位時間あたり $r$ 回に分けて集団の $1 / r$ ずつを更新するモデルを考えよう。更新は等しい時間間隔 $τ = 1 / r$ で、背景利得は $β$ であるとすると、

x_{i}(t+\tau )={\frac {1-\tau +\tau [\beta +u(e^{i},\,x(t))]}{1-\tau +\tau [\beta +u(x(t),\,x(t))]}}x_{i}(t).

で表現される階数 $r$ 世代重複ダイナミクスが得られる^[30]。 $r = α - β + 1$ の場合は離散時間ダイナミクスである。また、階数を限りなく大きくする (つまり時間間隔 $τ$ が限りなく0に近づく) と、連続時間ダイナミクスに収束する。

脚注

[脚注の使い方]

注釈

^ ただし、ESSも突然変異侵入後のレプリケーターダイナミクスによる自然選択を暗に仮定している^[9]。

出典

^ ^a ^b Maynard Smith & Price 1973.
^ ^a ^b 石原 & 金井 2002, p. 151.
^ 岡田 2011, p. 405.
^ ^a ^b ^c 岡田 2011, pp. 415–416.
^ 石原 & 金井 2002, pp. 2–3, 99–102, 117.
^ ^a ^b 大浦 2008, pp. 24.
^ ^a ^b ウェイブル 1998, p. 41.
^ 岡田 2011, p. 406.
^ ^a ^b ^c ^d 石原 & 金井 2002, p. 126.
^ ^a ^b ウェイブル 1998, p. 90.
^ ^a ^b 大浦 2008, pp. 25–26.
^ ウェイブル 1998, p. xii.
^ Nash 1950, pp. 21–23.
^ Taylor & Jonker 1978.
^ 石原 & 金井 2002, pp. 176–181.
^ 石原 & 金井 2002, pp. 181–187.
^ 石原 & 金井 2002, pp. 152–153.
^ ウェイブル 1998, pp. 41–42.
^ ウェイブル 1998, pp. 54–56.
^ ウェイブル 1998, pp. 57–58.
^ ウェイブル 1998, pp. 58–61.
^ ウェイブル 1998, pp. 62–63.
^ ^a ^b ウェイブル 1998, p. 89.
^ 石原 & 金井 2002, pp. 138–139.
^ ウェイブル 1998, p. 105.
^ ウェイブル 1998, pp. 109–111.
^ ウェイブル 1998, pp. 132–133.
^ ウェイブル 1998, pp. 127–128.
^ ウェイブル 1998, pp. 155–156.
^ ウェイブル 1998, pp. 157–158.

文献

日本語

石原, 英樹、金井, 雅之『シリーズ〈意思決定の科学〉5　進化的意思決定』朝倉書店、2002年4月5日。ISBN 4-254-29515-4。
ウェイブル, ヨルゲン W.『進化ゲームの理論』大和瀬達二監訳、三澤哲也/赤尾健一/大阿久博/横尾昌紀訳、オフィスカノウチ、1998年3月31日（原著1995年）。ISBN 4-8301-0820-7。
大浦, 宏邦『社会科学者のための進化ゲーム理論　基礎から応用まで』勁草書房、2008年9月25日。ISBN 978-4-326-60213-1。
岡田, 章『ゲーム理論〔新版〕』有斐閣、2011年11月25日。ISBN 978-4-641-16382-9。

外国語

Maynard Smith, John; Price, George (1973). “The logic of animal conflict”. Nature 246: 15–18. doi:10.1038/246015a0.
Nash, John (1950). “Non-cooperative games”. Princeton University Library.
Taylor, Peter; Jonker, Leo (1978). “Evolutionary stable strategies and game dynamics”. Mathematical Biosciences 40: 145–156. doi:10.1016/0025-5564(78)90077-9.

表話編歴集団遺伝学
基礎・背景	古典遺伝学メンデルの法則ダーウィンの進化論個体群遺伝的変異対立遺伝子
遺伝子プールと遺伝子頻度（英語版）	ハーディー・ワインベルクの法則突然変異同類交配選択自然生存（英語版）性人為遺伝的浮動有効集団サイズ（英語版）小さい個体群（英語版）ボトルネック効果創始者効果中立進化説遺伝子流動適応度選択係数（英語版）頻度依存選択フィッシャーの基本定理プライス方程式（英語版）
遺伝的連鎖の影響	連鎖不平衡ヒッチハイク効果バックグラウンド選択（英語版）遺伝的組み換え
血縁と近交	近交係数血縁係数血縁度包括適応度血縁選択緑髭効果
遺伝的集団構造（英語版）	遺伝子多型 Shifting balance theory（英語版）群選択ヴァールント効果（英語版）ボールディング・ニコルズ・モデル（英語版）
進化ゲーム	進化的安定戦略レプリケーターダイナミクス
合祖理論	遺伝子系図 Identity by descent（英語版）最も近い共通祖先
研究者	ロナルド・フィッシャー J・B・S・ホールデンシューアル・ライトテオドシウス・ドブジャンスキーウィリアム・ドナルド・ハミルトンジョン・メイナード＝スミスジョージ・プライス木村資生
関連項目	生物統計学進化の総合説行動生態学育種学進化的計算優生思想

表話編歴ゲーム理論
定義	非協力ゲーム協力ゲーム標準型ゲーム展開型ゲームベイジアンゲーム簡潔ゲーム（英語版）情報集合信念の階層選好進化ゲームハイパーゲーム（英語版）行動ゲーム
解概念と精緻化	ナッシュ均衡部分ゲーム完全均衡 Mertens-stable equilibrium（英語版）ベイジアン・ナッシュ均衡完全ベイズ均衡摂動完全均衡プロパー均衡 ε均衡相関均衡（英語版、ドイツ語版）逐次均衡準完全均衡進化的安定戦略リスク支配コアシャープレイ値パレート効率性質的応答均衡自己確証均衡強ナッシュ均衡（英語版、ヘブライ語版）マルコフ完全均衡（英語版）戦略的補完性合理化可能性直観的基準
戦略	支配戦略混合戦略（英語版）しっぺ返し戦略トリガー戦略共謀（英語版）後ろ向き帰納法前向き帰納法マルコフ戦略（英語版）主人と奴隷
ゲームのクラス	対称ゲーム（英語版）完全情報完全情報ゲーム完備情報不完備情報ゲーム確実情報同時手番ゲーム逐次手番ゲーム（英語版）繰り返しゲームシグナリングゲームチープトークゼロ和非ゼロ和メカニズムデザイン交渉問題（英語版）確率ゲーム（英語版）大ポアソンゲーム（英語版）非推移的ゲームグローバルゲーム（英語版）特性関数型ゲーム二人零和有限確定完全情報ゲーム
ゲーム	囚人のジレンマ旅人のジレンマ（英語版）協調ゲーム（英語版）チキンゲームムカデゲーム（英語版）ボランティアのジレンマ（英語版）ドル・オークション（英語版）男女の争い（英語版）スタグハントゲームマッチングペニー（英語版）最後通牒ゲームじゃんけん海賊ゲーム（英語版）独裁者ゲーム（英語版）公共財ゲーム（英語版） Blotto games（英語版）消耗戦（英語版）エルファロル・バー問題公平分割行き詰まり（英語版）割り勘のジレンマ Guess 2/3 of the average（英語版）クーン・ポーカー交渉問題（英語版）スクリーニングゲーム（英語版）囚人と帽子のパズル（英語版） Trust game（英語版） Princess and monster game（英語版）モンティ・ホール問題クールノー競争ベルトラン競争シュタッケルベルグ競争
定理	ミニマックス法ナッシュの定理純化定理フォーク定理顕示原理（英語版）アローの不可能性定理
主要人物	ケネス・アローロバート・オーマンケン・ビンモアサミュエル・ボールズメルヴィン・ドレッシャー（英語版）メリル・フラッド（英語版）ドリュー・フューデンバーグ（英語版）ドナルド・ギリースジョン・ハーサニレオニード・ハーヴィッツデイヴィッド・レヴァイン（英語版）ダニエル・カーネマンハロルド・クーンエリック・マスキンジャン＝フランソワ・メルタン（英語版）ポール・ミルグロムオスカー・モルゲンシュテルンロジャー・マイヤーソンジョン・ナッシュジョン・フォン・ノイマンアリエル・ルービンシュタイントーマス・シェリングラインハルト・ゼルテンハーバート・サイモンロイド・シャープレージョン・メイナード＝スミスジャン・ティロールアルバート・タッカーウィリアム・ヴィックリーロバート・ウィルソンペイトン・ヤング（英語版）
関連項目	コモンズの悲劇 Tyranny of small decisions（英語版） All-pay auction（英語版）ゲーム理論におけるゲームの一覧（英語版） Confrontation analysis（英語版）ゲーム理論家の一覧（英語版）数学経済学進化論集団遺伝学オペレーションズリサーチ社会生物学環境社会学クープマンモデル
カテゴリ

歴史

進化的に安定な戦略

レプリケーターダイナミクス

脚注

注釈

出典

文献

関連項目

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.