Angrist and Pischke(2015) Mastering 'Metrics

実験学派のラスボス的存在アングリストとピシュケの新刊Mastering 'Metricsをやっと読んだ.本書の主眼,というか実験学派,というかlabor系の主眼が,いかに特定のtreatmentの因果効果を綺麗に識別するかであることを断っておく.

Mastering 'Metrics: The Path from Cause to Effect

Mastering 'Metrics: The Path from Cause to Effect

 

 レベルは前著のMostly Harmless Econometricsより低く,直感的な理解に重点を置いている.また扱っているトピックも5つでありシンプルである.数式もほとんど出てこないので,エコノメの因果効果でどういうことをやっているのかを大まかに理解するにはもってこいだろう.学部レベルの内容だが院生が読んでも勉強になる素晴らしい本だと思う.とはいえ,やはり内容はかなり基本的なものばかりなので,この分野にある程度明るい人ならばMostly Harmless Econometrics超える評価をしないだろう.ちなみに,人によってはアングリストらの文章がわかりにくいという声をよく聞くが,私は読みやすいと思っている.

Mostly Harmless Econometrics: An Empiricist's Companion

Mostly Harmless Econometrics: An Empiricist's Companion

 

 以下,各章の内容を簡潔に紹介してみよう.

1.Randomized Trials

Randomized Control Trials(RCT)からはじめるというのがこの本の特徴でもある.因果効果をみるためにはなぜRCTがベストなのかが丁寧に説明されている.Treatment groupsとControl groupのサンプルサイズが大きい場合には,大数の法則によって,セレクションバイアスが除去される.Random assignmentがうまくいっているかどうかは,多くの場合に,Treatment groupsとControl groupで共変量バランスをチェックする.すなわち,両グループで有意な差がないことを確認するのである.このあたりの説明は類書のなかでも抜群に分かりやすい記述になっていると感じた.

2.Regression

RCTができないときはどうすれば良いのだろうか.この流れを導入するために1章はRCTについて説明しているのだ.で,線形回帰モデルからはじまっている.単回帰から重回帰にモデルを拡張する際の説明として,Omitted Variables Bias(OVB)がどういったものかに注目している.これはモストリーハームレスでも同じである.メインツールがOLSの場合,モデルを拡張するなかでOVBを丁寧に考察している論文はあまり見かけないように思うが,後に説明するIVやRDDをセットで用いずにOLSだけでせめるならば,OVBの考察は決定的に重要であるだろう.なぜならOVBについて推論することはTreatment effectについて少しばかりの予測を可能にするからである.もちろん,OLSだけでジャーナルに載ることは今の時代考えにくいが.章末ではシンプルなRegressionではセレクションバイアスがかなり残ってるよねという話で次章につなげている.

3.Instrumental Variables

ここでIVが登場する.操作変数とは,Treatment Variableの内生性や観測誤差を取り除くために投入される変数だが,識別に満たすべき仮定は,IVがTreatment Variableの処置を強く予測する,Independence assumption,Exclusion restriction assumptionの3つがある.IVEの推計にしばしば用いられるのは2SLSだが,IVEの説明が丁寧である.すなわち,誘導系の係数を1st stageの係数で割ってやるとIVEになるよという話が具体的事例に基づいて説明されている.後半は局所平均効果(LATE)についての説明でこれもかなり分かりやすい.

4.Regression Discontinuity Designs

RDDについても簡潔な説明がなされている.cutoff付近ではRCTに近い状況が生じているだろうと,すなわちcutoffを超えるか超えないかは操作できないことがRDDにおけるcutoffの前提であることが分かりやすく説明されている.基本的な説明ばかりかと思いきや,cutfoff付近のバンド幅をどうやって決めるのかといった議論もしており,脚注にはこのトピックを扱った

Imbens, G., & Kalyanaraman, K. (2011). Optimal Bandwidth Choice for the Regression Discontinuity Estimator. The Review of Economic Studies, 79(3), 933–959. 

が紹介されている.もちろんSharp RDとFuzzy RDの説明もある.

5.Differences-in-Differences

最初にこの本をパラパラとめくったときにはRDDとDDの順番が逆じゃないのかと思ったが,DDの章を読んで構成を理解した.つまり,IVやRDDのようにうまい変数がみつからないときにどうするかという発想を導入するためにDDをRDDの後ろに持ってきている.とはいえ,DDも同じような悩みはあるだろう.DDが可能な前提としてCommon Trendを紹介したのちに,時間変化(time-varying)する変数をコントロールしたり,そして最後はTrendをコントロールするという流れである.DDをある程度知っている人は問題ないが,DDは固定効果モデルの一種なので,その話がないと初学者には理解が難しいかとも感じたが,紙幅の制約でパネル分析の話をできないので仕方ないという気もする.とはいえ,平均からの偏差と差をとるという程度の話はしている.DDについてはモストリーハムレスの方が明らかに分かりやすいように思う.

6.The Wage of Schooling

最終章ではこれまでに使った分析手法を順に使いながら復習をしている.このやり方は効果的だと感じる.この章の冒頭で紙幅が割かれているが,悪いコントロール変数に関する事例と説明の仕方は非常に明快である.基本的に,ここでいう悪いコントロール変数とは,treatment variableより時間軸で後に決定されている説明変数のことである.例えば,大卒/非大卒がランダムに割り当てられている状況を想像しよう.この時,賃金を学歴に回帰したい場合,コントロール変数として職業を入れたとしたらどうなるだろうか.大卒の人はホワイトカラーとなる傾向があり,非大卒がブルーカラーとなる傾向があるので,この場合,職業をコントロールしてしまっては職業効果に学歴効果がまじってしまいセレクションバイアスが生じるという具合である.後はmeasurement errorやattenuation biasの話があり,IV,DD,RDを使ってやってみたらどうなるかという流れである.

 

簡単な内容紹介だが,総じて,RCTができなくたって我々社会科学徒は色々と出来るということを簡潔に説明している良書である.終章のラストは以下の文で閉じている.

MASTER STEVEFU: Time for you to leave, Grasshopper. You must continue your journey alone. Remember, when you follow the 'metrics path, anything is possible.

MASTER JOSHWAY: Anything is possible, Grasshopper. Even so, always take the measure of the evidence.