Imai and Tingley(AJPS 2012) 混合分布モデルを用いた競合仮説の検証

社会科学ではある現象に対して複数の説明の仕方があることが多い.例えば競合する仮説が複数ある場合などが典型であり,そうした場合に混合分布モデル(Finite Mixture Model)が使えますというのを紹介した論文.さっとメモ.

Imai, K., & Tingley, D. (2012). A Statistical Method for Empirical Testing of Competing Theories. American Journal of Political Science, 56(1), 218–236. 

簡単にまとめると,混合分布モデルは,(1)競合する理論・仮説が想定する効果の推定,(2)競合する理論・仮説が妥当する場合の条件の推定をしようとしている.つまり,観察されたデータはどのモデルにどの程度整合的なのかを推定する.

セットアップ

  • ある現象を説明する M個の統計モデルがあるとする
  • モデル間でネストしているか,いないかはどちらでも良い
  • すべてのモデルについて特定している必要はない
  • 観察 iはモデル Z_i=1, 2, ..., Mから生成されているとする
  • どのモデルからデータが生成されているかわからないので, Z_iも同時に推定する

推定

わかること

  • 各モデルのパラメター推定値とモデル確率の推定値
  • 特定のモデルに整合的な観察 i
  • 特定のモデルの全体に占めるパフォーマンス

補足

  • 実装はflexmixMCMCpack
  • 競合する理論・仮説の統計モデルを f_m(y|x, \theta_m)とするとデータ生成過程は Y_i|X_i, Z_i \sim f_{Z_i}(Y_i|X_i, \theta_{Z_i}).ただし \theta_{Z_i} Z_iのパラメター
  • 観察が理論・仮説 mによって生成される確率は \pi_m(X_i, \psi_m) = Pr(Z_i=m|X_i)
  • 混合分布はどちらかといえば予測力を高める方法で因果効果の推定に向いているわけではない.ただしデザイン次第では因果推論もできる
  • 共変量が多いモデルが選ばれやすい
  • 変量効果モデルと違ってグループを事前に決める必要がない