Westreich et al. (2019) ターゲット妥当性と研究デザインの階層

Daniel Westreich, Jessie K Edwards, Catherine R Lesko, Stephen R Cole, Elizabeth A Stuart, Target Validity and the Hierarchy of Study Designs, American Journal of Epidemiology, Volume 188, Issue 2, February 2019, Pages 438–443.

手元の分析結果から何が言えるのかについて、しばしば内的妥当性や外的妥当性という表現が用いられる。内的妥当性とは、特定の研究の文脈において、原因と結果に関する主張を根拠付ける程度である。外的妥当性とは、特定の研究の文脈における原因と結果に関する主張を、他の文脈においても根拠付けられるのかをあらわす程度である。本論文では、外的妥当性を、1)一般化可能性(generalizability)、2)移転可能性(transportability)の2つに分類している。一般化可能性は、研究標本を用いた分析結果が、研究標本を抽出した母集団にも一般化できるのかに焦点をあてる。移転可能性は、研究標本を用いた分析結果が、関心のある母集団以外のターゲット母集団においても移転できるのか(成り立つのか)に焦点をあてる。

著者らは、内的妥当性と外的妥当性が別個に扱われがちだと危惧している。例えば、大学生を被験者とするラボ実験では「内的妥当性は高いが、外的妥当性は低い点に注意が必要」という断りが多い。ある国に居住するすべての人をターゲット母集団とする場合、政策担当者はこのラボ実験から何を学べるのだろうか。具体的なケースでは、政策担当者は、「ターゲット母集団とは異なる母集団においてなされたランダム化比較実験の結果」と「ターゲット母集団をうまく代表する母集団においてなされた観察研究(とりあえずrandomizeの介入はしていないの意味)の結果」のどちらを採用すべきなのだろうか?著者らは、この点を評価するためには、内的妥当性と外的妥当性から構成される「ターゲット妥当性」を評価が必要だと述べている。ターゲット妥当性とはなんぞやということで、以下の2つの場合について定義してみる。

1.外的妥当性として一般化可能性を考える場合のターゲット妥当性

知りたい量としてリスク差を考えると、内的妥当性バイアスは、研究標本における真の因果リスク差と研究標本における推定リスク差との差として定義される。


BIAS_I^G=[E(Y^{A=1}|S=1)-E(Y^{A=0}|S=1)]-[\hat{E}(Y|A=1,S=1)-\hat{E}(Y|A=0,S=1)]

Yはアウトカム変数、Aは処置変数、Sは研究標本を示す変数。内的妥当性バイアスを考慮する際にSは省略されることが多いが、Sを明示的に考えることで後の外的妥当性バイアスを定義できる。一般的には、Aがランダマイズされていれば BIAS_I^{G}=0と想定する。続いて、一般化可能性としての外的妥当性バイアスとは、ターゲット母集団における真の因果効果(特定の研究標本Sに限定されない→Sを条件づけない)と、研究標本における真の因果効果(S=1)との差のことであるので、


BIAS_E^G=[E(Y^{A=1})-E(Y^{A=0}]-[E(Y^{A=1}|S=1)-E(Y^{A=0}|S=1)]

で定義される。研究標本がターゲット母集団から完全にランダムサンプリングされていて欠票・欠測もなければ*1 BIAS_E^{G}=0になると想定される。

以上の内的妥当性バイアスと外的妥当性バイアスの定義を用いて、一般化可能性の場合のターゲット妥当性バイアスを以下で定義する。


BIAS_T^G=BIAS_E^G+BIAS_I^G

上で定義した式を代入して整理すると、


BIAS_T^G=[E(Y^{A=1})-E(Y^{A=0}]-[\hat{E}(Y|A=1,S=1)-\hat{E}(Y|A=0,S=1)]

となる。したがって、一般化可能性の場合のターゲット妥当性バイアスは、単にターゲット母集団における真の因果リスク差と、研究標本における推定リスク差との差になる。

2.外的妥当性として移転可能性を考える場合のターゲット妥当性

内的妥当性バイアスは一般化可能性の場合と同様なので、


BIAS_I^T=BIAS_I^G

一般化可能性では、研究標本(S=1)は定義上ターゲット母集団(すべてのS)の中に含まれていたが、移転可能性を考える場合の研究標本(S=1)とは、定義上ターゲット母集団(S=0)に含まれてない(大学生を対象としたラボ実験の結果は高校生にもあてはまるかといったことを考えるのが移転可能性だから)。したがって、Sで条件付けしない母集団は、研究標本とターゲット母集団を混ぜた母集団に相当する。この点を踏まえると、移転可能性の場合の外的妥当性バイアスは以下となる。


BIAS_E^T=[E(Y^{A=1}|S=0)-E(Y^{A=0}|S=0)]-[E(Y^{A=1}|S=1)-E(Y^{A=0}|S=1)]

ターゲット妥当性バイアスは、上記で定義したように内的妥当性バイアスと外的妥当性バイアスの和なので以下となる。


BIAS_T^T=BIAS_E^T+BIAS_I^T

したがって、


BIAS_T^T=[E(Y^{A=1}|S=0)-E(Y^{A=0}|S=0]-[\hat{E}(Y|A=1,S=1)-\hat{E}(Y|A=0,S=1)]

簡単なまとめ

以上から、内的妥当性バイアスと外的妥当性バイアスを同時に評価する指標として、ターゲット妥当性バイアスが使えそうだということがわかる。そのうえで、著者らは、「観察研究(多くの場合に内的妥当性が低いとされるが外的妥当性はそこそこ?)よりRCT(多くの場合に内的妥当性は高いが外的妥当性はあんまり?)が上位の階層」だという考え方に疑問を呈している。その理由は単純で、ターゲット妥当性バイアスに着目すれば、内的妥当性バイアスと外的妥当性バイアスから構成されているため、両バイアスの大小を評価する必要があるからだ。もちろん、ターゲット母集団を代表する研究標本においてRCTは実施できるのであれば素晴らしい(ただしこの場合でも被験者が同意の上でRCTに参加するのであれば、セレクションなど代表性を脅かすような懸念が生じる)。本論文は、ターゲット妥当性を紹介することで、問いに対応するターゲット母集団はなんなのかを考えなさい、そのうえで注意深く研究デザインを練りなさい、分析結果から何が言えるのかについて慎重になりなさいというメッセージを発している。ちなみにターゲット妥当性のアイディアはImai et al. (2008)を拡張したものである*2

*1:標本サイズが大きいことも条件。なお欠票や欠損がある場合には適切に補正することで対処が可能な場合もある。

*2: Imai et al. (2008)では、因果効果の全体的なバイアスを、観察された/されない内的妥当性バイアスと、観察された/されない外的妥当性バイアスの4項目に分解できることを示している