Brand and Xie(ASR 2010) 最も教育リターンを受けているのは誰か?因果効果の異質性

大卒学歴が賃金に与える因果効果について,異なる個人に異なる因果効果(heterogeneous causal effects)を想定し検証した論文.

Brand, J. E., & Xie, Y. (2010). "Who benefits most from college? Evidence for negative selection in heterogeneous economic returns to higher education." American Sociological Review, 75(2), 273–302.

大卒と賃金に関する先行研究では,大学に行きそうな特性を持っている人(本人の能力が高かったり親が大卒だったり周囲も大学進学希望者が多かったり等)が最も教育リターンを受けているというpositive selection biasが指摘されている(Carneiro, Heckman and Vytlacil 2001; Carneiro, Hansen and Heckman 2003; Carneiro, Heckman and Vytlacil 2007; Heckman, Urzua and Vytlacil 2006).その一方で,大学に行かなそうな特性を持っている人(本人の能力が低かったり親が非大卒だったり周囲も大卒進学を希望していなかったり等)が最も教育リターンを受けているというnegative selection biasも指摘されている.positive selection hypothesisの背景には,個人は大学に進学することで得られるだろう金銭的リターンが授業料等のコストより大きい場合に進学すると想定されている.基本的に,効用は経済的リターンの関数であり,効用最大化に基づき意思決定を行う.個人にとっての大学進学が仮にこのような意思決定構造となっているならば,大学には大学に来ることでコストが回収できると思っている人ばかりが集まっているので,positive selectionが生じているだろう.一方で,negative selection hypothesisの背景には,positive selectionとは異なり,大学進学の意思決定には経済的要素以外に文化資本や人的資本の影響があり,大学に行きそうな特性を持っている人の場合には,定義上,文化資本や人的資本があるため,意思決定に際して経済的要素をあまり重視しないとの想定がある.例えば,親戚がみなハーバードに入っている家庭に育った人にとって,大学に行くことはいわば「フツー」のことであり,とりわけコストベネフィットを考慮して意思決定していないだろう.一方で,大学に行かなそうな特性を持っている人は,大学に行きそうな特性を持っている人に比べて,大学に行くという意思決定をするには何かしら明確な動機があると考えられ,negative selection hypothesisではその何かが経済的リターンだとされる.そのため,negative selection hypothesisでは大学に行かなそうな特性を持っている人が最も大学卒業による経済リターンを受けていると想定される.ここでポイントとなるのは,大学に行きそうな人と行かなそうな人とでは,大卒が賃金に与える効果が異なると想定されており,これは因果効果の異質性である.因果効果の異質性は,因果推論の課題としてしばしばトピックに挙がっており,subsampleで分析したりLATEの概念を使ったりと色々なやり方があるが,ここでは大卒{ \displaystyle d} を共変量{ \displaystyle {\bf X}}に回帰して傾向スコアを算出し,傾向スコアが高い者=大学に行きそうな特性を持っている人,傾向スコアが低い人が=大学に行かなそうな特性を持っている人としている.因果効果の異質性を考慮した推計式は以下である.
{ \displaystyle y_i=\alpha_i+\delta_id_i+{\bf \beta'X_i}+U_i}
このままでは識別できないので,ここでignorability assumptionを仮定する.ignorability assumptionは簡単に言ってしまえば,大卒{ \displaystyle d} は共変量{ \displaystyle {\bf X}}によってのみ決定されるということだ.この仮定を直接チェックすることはできないし実際に怪しいがここではモデルを単純が化するために妥協している.傾向スコアで層化した後に,マルチレベルの一種である階層線系モデル(HLM)で傾向スコア高低と大卒の交互作用効果をみている.

データはNational Longitudinal Survey of Youth(NLSY)とWisconsin Longitudinal Surveyの2つのパネルデータを用いている.2つを使うのはロバストネスチェックのためと使える共変量が異なるため.

分析結果は,NLSYデータでもWLSデータでもnegative selection biasを支持しているが,男性と女性ではlevel2の係数の大きさが違ったり,NLSYとWLSでは傾きが異なっている.後者については,サンプリングの問題があると指摘しているが,傾向スコアの低い人たちが最も大卒の効果が大きく,傾向スコアが高くなるにつれて大卒の効果は小さくなるというnegative selectionと概ね整合的な結果となっているというものである.なぜこういう結果になるかというと,傾向スコアの低い人たちは,大卒ではない場合に,能力や文化資本やネットワーク等の様々な面で傾向スコアの高い人たちより不利な立場にある.したがって,大卒プレミアムは傾向スコアの低い人たちの間で最も効果があるということだ.

例えば経済学のトップジャーナルのlabor系では,いかに政策や介入の効果を綺麗に識別できるかがアクセプトかリジェクトとかを分けると聞いたことがあるが,本論文のように,手持ちの観察された変数を用いて傾向スコアとHLMをあわせてtreatment effectを推計するというのは少なくともecon系ではあまり見かけないように思うし,綺麗に識別されているとは言い難いだろう.また本論文でignorability assumptionを仮定しているのに対して,positive selection(econで多く見かける仮説)の文献でも挙げられるヘックマンらの論文ではignorability assumptionを仮定していない点ももっと突っ込んで考えてみたい(その場合は傾向スコア調整では識別不可能).因果効果という点ではやはりグッドな操作変数やRDDが望ましいしeconでもこの方法が大多数だと思うが,因果効果の異質性を考慮した場合,subsampleで分析したりLATEのcompliersを考察したりという方法以外にどのような方法があるのか,また本論文のようなアプローチが計量屋(特にエコノメトリシャン)にとってどのように受け止められているのかが気になるところである.あとポリサイでは傾向スコアに関する方法論がたくさんでてきている印象だが,例えば最近のImai and Ratkovic(2014)のCBPSで再分析した場合に結果が変わったりしないのだろうかとか,色々知りたい点はある.とはいえ,ストーリーとしては面白いので,そのままの枠組みで日本のデータを用いて分析してみたり,アウトカムを変えて分析してみたりと,色々と試してみたい気はする.来年のASAネタにも使えるかもしれない.