読者です 読者をやめる 読者になる 読者になる

Gelman(2006) マルチレベルモデリングで出来ること出来ないこと

マルチレベルモデリングの有用性と限界が明確に述べてある論文.著者はData Analysis Using Regression and Multilevel/Hierarchical Modelsで有名なAndrew Gelman.

Gelman, A. 2006. “Multilevel (Hierarchical) Modeling: What It Can and Cannot DoTECHNOMETRICS 48(3): 432-435.

要旨は以下.

Multilevel (hierarchical) modeling is a generalization of linear and generalized linear modeling in which regression coefficients are themselves given a model, whose parameters are also estimated from data. We illustrate the strengths and limitations of multilevel modeling through an example of the prediction of home radon levels in U.S. counties. The multilevel model is highly effective for predictions at both levels of the model, but could easily be misinterpreted for causal inference.

結論から述べれば,マルチレベルモデリングは予測には役立つが因果推論として解釈するには困難があるということだ.ここでは肺がんを引き起こすといわれるラドンを例にとりマルチレベルモデリングを定式している.ラドンは地域によって偏りがあるらしく,本分析の目的はラドン分布の偏りを調べることであり,そうすれば各家庭はなんらかの対処ができるかもしれない.居住地(レベル1)は群(レベル2)にネストされていると考えよう.レベル1の説明変数は居住地(各家庭のこと)の地下で測定がされたか否か(ラドンは地下にあるため地下で測定していたらより高い値がでやすいと予想される).レベル2の説明変数は群で観測される土壌ウランの値.定式を以下とする.
{ \displaystyle
y_{ij}\sim N(\alpha_j+\beta x_{ij}, \sigma_y^2)
}
{ \displaystyle
\alpha_j\sim N(\gamma_0+\gamma_1 u_{j}, \sigma_\alpha^2)
}
上式をミネソタ州データ(919house, 85counties)を用いた階層ベイズ(Hierarchical Bayes Methods)で分析する.

Data Reduction
ここでは上式のマルチレベルモデリングを,すべてプールした{ \displaystyle y=\alpha+\beta x}とプールなしの{ \displaystyle y=\alpha_j+\beta x}と比較している.Fig1.からマルチレベルモデリングが他の2モデルに比べてData Reductionの面で優れていることが一目瞭然である.

Prediction
Gelmanはマルチレベルモデリングが最も役に立つのはこの「予測」であると述べている.どこかの群で新しい家が建てられた時に計測されるラドンの値を予測するのに適しているのだ.変量効果のおかげである.例えば,

We can use cross-validation to formally demonstrate the benefits of multilevel modeling. We perform two cross-validation tests: first removing single data points and checking the pre- diction from the model fit to the rest of the data, then removing single counties and performing the same procedure. For each cross-validation step, we compare complete-pooling, nopooling, and multilevel estimates. Other cross-validation tests for this example were performed by Price et al. (1996).

のようにして色々と試行錯誤できる.

Causal Inference
マルチレベルモデリングは因果推論として使えるのだろうか.つまり,地下測定ダミーの係数を因果効果として解釈できるのだろうか.かなり難しいというのがGelmanの結論である.問題はレベル1の変数とレベル2の誤差項の相関である.上式における尤度と事前密度をかけた場合には,事後密度ではレベル2の誤差項とレベル1の変数は独立であることを仮定している.この独立性はまず成立しないだろう.経済学でマルチレベルモデリングがあまり使われないのは,こういうところにあるのだろう.

In other settings, especially in social science, individual averages used as group-level predictors are often interpreted as “contextual effects.” For example, the presence of more basements in a county would somehow have a radon-lowering effect. This makes no sense here, but it serves as a warning that, with identical data of a social nature (e.g., consider substituting “income” for “radon level” and “ethnic minority” for “basement” in our study), it would be easy to leap to a misleading conclusion and find contextual effects where none necessarily exist.

要するにこれは生態学的誤謬の話であり,何の用心もなしにレベル2の係数を因果効果のように解釈することは危険である(ちなみにレベル2変数にIVを使う方法もあることはある).以上の点は,マルチレベルモデリングをよく理解している人にとっては「何をいまさら」という点であるが,分析目的に応じてマルチレベルモデリングを採用するか否かを決める必要がある(すべての分析手法について言えることですが).Gelmanはブログでもこういう分かりやすい記事を書いてくれるから重宝する.