Gerber and Green(2012) Field Experiment, Ch.2

先日からフィールド実験の勉強会に参加しているので,毎回の内容について簡単にメモをとることにした.テキストは以下.

Field Experiments: Design, Analysis, and Interpretation

Field Experiments: Design, Analysis, and Interpretation

2章は基本的なノテーションの確認なので,一般的な因果推論のテキストの冒頭と類似している.

2.1. Potential Outcome

 本章で取り上げられる論文がChattopadhyay and Duflo(ECTA 2004)であり,この論文は,村長の性別によって予算配分に違いがあるかを検討している.女性が村長になった場合には,男性に比べてより多くを水を綺麗にするために設備投資等に費やすと想定されるそうだ. 「処置=女性村長選出」とすればPotential Outcome(以下PO)は以下で定義される.
{ \displaystyle Y_i(1)}: 村iが女性村長の時のアウトカム
{ \displaystyle Y_i(0)}: 村iが男性村長の時のアウトカム

2.2 Average Treatment Effects

 各村における平均処置効果は,
{ \displaystyle \tau_i=Y_i(1)-Y_i(0)}
となり,各村の観察されるアウトカムは,
{ \displaystyle Y_i=d_iY_i(1)+(1-d_i)Y_i(0)}
と書ける.そして全体の平均処置効果(平均因果効果=Average Treatment Effects)は,
{ \displaystyle ATE\equiv\frac{1}{N}\sum_{i=1}^N\tau_i}

2.3. Random Sampling and Expectations

 POの期待値はATEに等しい.
{ \displaystyle 
E[Y_i(1)-Y_i(0)]=E[Y_i(1)]-E[Y_i(0)]=\frac{1}{N}\sum_{i=1}^N[Y_i(1)-Y_i(0)] 
}

2.4. Random Assignment and Unbiased Inference

 ランダムに割り当てされた処置{ \displaystyle D_i}は,実際に観察されるアウトカム{ \displaystyle Y_i}に影響を与えるが,POや共変量とは独立.
{ \displaystyle Y_i(0), Y_i(1), X \perp D_i}
不偏推定量とは{ \displaystyle E(\hat\theta)=\theta}であるが,ランダム割り当てがなされている時のATEは不偏推定量となる.

2.5. The Mechanics of Random Assignment

 単純なランダム割り当てはコイントスやサイコロを振って行われるが,サンプルサイズが小さい場合には実際には特定の値が出やすくなったりなかなかランダムにならない.著者らが完全ランダム割り当てとしてあげている方法はふたつ.

  1. 全対象者=N人の中から1人を選ぶ→N-1人の中から1人を選ぶ→処置群に入る数=m回繰り返す
  2. N人に番号をランダムに割り当て,順番にm番目の人を選ぶ

2.6. The Threat of Selection Bias When Random Assignment is not Used

 セレクションバイアスとはPOと処置が独立でないことなので,
{ \displaystyle 
E[Y_i(1)|D_i=1]=E[Y_i(0)|D_i=0]=E[Y_i(1)-Y_i(0)|D_i=1]+E[Y_i(1)|D_i=1]-E[Y_i(0)|D_i=0]
}
の中で{ \displaystyle 
E[Y_i(1)|D_i=1]-E[Y_i(0)|D_i=0]
}
がセレクションバイアスになる.

2.7. Two Core Assumption about Potential Outcomes

 「POは本人が処置を受けるか受けないかだけに依存する」という仮定がある.他人の処置に影響を受けないというのがSUTVAで,本人の処置「だけ」に依存するのが除外制約である.IVの文脈と同じである.