Imai and Ratkovic(AoAS 2013) ランダム化プログラム評価における因果効果の異質性の推定

最新のPAでGrimmerらの因果効果の異質性論文がでたのでその関連でImai and Ratkovic(AoAS 2013)をメモ.

Imai, K. and Ratkovic, M. 2013. “ESTIMATING TREATMENT EFFECT HETEROGENEITY IN RANDOMIZED PROGRAM EVALUATION.The Annals of Applied Statistics, 7(1), pp.443-470.

因果効果を推定するというときにその多くはATEだったりATETだったりするわけだが,政策担当者からすると「どの介入方法が効果が大きいのか(小さいのか)」また「どの個体(unit)で効果が大きいのか(小さいのか)」を知りたいことがある.どういうトリートメントがどういうグループで因果効果が大きかったり小さかったりするのかを推定することは因果効果の異質性と呼ばれる.最近の因果推論ではホットなトピックであり,ポリサイ,エコン,ソシオでも多くの論文がでている.

本論文の肝は方法に関する説明があるsection2.分析枠組みはもちろんルービンのPO.後に提案する方法のテストで使うデータは有名なget-out-the-vote(GOTV)と障害のある労働者にジョブトレーニングをしたnational supported work(NSW)の2つ.GOTVはトリートメントが192種類,NSWはトレーニングを受けたか否かの1種類.モチベーションは2つ.(1)(GOTVの場合)正の効果があるトリートメントはどれで,そのうちトリートメントの効果が最も大きいのはどれか,(2)各トリートメントはどの個体に効果がある(ない)のか.

今回の方法のポイントは因果効果の異質性の推定を変数選択の問題とみている点.大まかに説明すると,プリトリートメント(ここではグループや個体と同義)変数と異なるトリートメント変数のパラメターそれぞれにLASSOの制約をかけながら(ペナルティ項が2つあるのがポイント),サポートベクターマシーン(具体的にはL2-SVM)で異なるパラメターを推定しているのである.推定のアルゴリズムは3段階で,まずは変数をリスケール(LASSOで必要になってくる),次にモデルをフィットさせる(例のようにペナルティ項の \lambdaを決めていく),最後にフィットの評価で一般化交差検証を用いる.FindItパッケージで色々試せる.

さてGOTVを例に推定した結果をみてみよう.トリートメント192種のうち因果効果がゼロでないとされたのは15種類であった.最も効果があったのは「訪問」「電話なし」「メールなし」だったそう.

NSWに例については,プリトリートメント変数が45あるので,どの個体に効果があったのかという点も検証できる.結果は,「学歴低」「高所得ヒスパニック」「大卒無職blacks」「高卒無職ヒスパニック」に大きな効果があったそうである.

因果効果の異質性について他にもたくさん論文があり,冒頭にあげたGrimmerたちがシミュレーションで比較しているようなので後でそちらもチェック.