Solon et al.(JHR 2015) 何のためのウェイティングか?

応用計量分析では様々な理由でウェイトをかけることがあるが,何のためにウェイトをかけているのか,またそれが適切なのかについては訓練された応用計量屋でも混乱したり間違うことがよくある. こうした問題を受けて,ウェイティングに関する理論,方法,目的を整理したのが本論文である.

Solon, G., Haider, S. J., & Wooldridge, J. M. (2015). "What Are We Weighting For?" Journal of Human Resources, 50(2), 301–316.

まず著者らは,研究目的を I) 母集団の記述に関心がある場合,II) 因果効果に関心がある場合の2つに分類し,それぞれにおいて必要とされるウェティングについて解説を行っている.

I. 母集団の記述に関心がある場合

 ある母集団を記述することが目的の研究がある.この場合は単純で,ウェイトを用いるか否かは,標本が母集団を代表しているか否かに依存している.例えば,アメリカの貧困率を記述することに関心があるとしよう.1968年センサスでは13%という値が分かっているが,この貧困率を標本調査である1968年PSIDを用いて記述したいとする.しかしながら,PSIDで貧困率を計算すると26%となり,これはPSIDがサンプリングにおいて低所得世帯を多くとる設計になっているためである.つまりPSIDでは,低所得層がオーバーサンプリングされているのだ(低所得層についてより精確な情報を知りたいので敢えてオーバーサンプリングしている).PSIDの標本から母集団の記述統計量は示すには,セレクション(センサスに比べてPSIDでどの程度オーバーサンプリングになっているか)の逆確率でウェイティングすれば良い.この処置を行ったところ,PSIDで計算した貧困率は12%となり,13%に近い値となった.

 同様の例として,人種と賃金の関係を記述したく,PSID標本を用いて,対数賃金を人種(whites,blacks),潜在経験年数に回帰することを想定しよう.その結果,blacksダミーの係数は-0.344であり,これはexp(-0.344)=0.71から,whitesの71%の賃金となる傾向を示している.しかしながら,PSIDは低所得層をオーバーサンプリングしているため,先述のような問題が生じる.ここでの解決策は,同様にセレクションの逆確率をウェイトとして用い,WLSでモデル推定することである.その結果,推定された係数の値は-0.260となり,blacksの賃金はwhitesの77%(exp(-0.260)=77)という傾向がわかる.

 以上からわかるように,記述統計量にしてもOLSにしても,標本が関心のある母集団を代表していない場合には,セレクション(センサス等でセレクションが分かっていなければならない)の逆確率をウェイトとして用いることができる.シンプルな解決法であり,特に厄介なことはない.

II. 因果効果に関心がある場合

母集団を記述するのとは異なり,因果関係を明らかにすることが研究目的の場合もある.こうなると母集団を記述する場合とは異なり,ウェイティングは厄介であり,使い方に注意が必要となる.著者らは,因果効果に関心がある場合のウェイティングの動機を以下の3つに分類する.

(1)不均一分散に対処しより精確な推定量を得る

(2) 内生的なサンプリングに対処し一致推定量を得る

(3)モデル化されない異質性下において平均部分効果(average partial effect)を識別する

いずれかの動機によって対処手続きが異なってくる.

(1)不均一分散に対処しより精確な推定量を得る

最もメジャーなのがこれだろう.多くのテキストが,ウェイティングを用いる理由として誤差項の不均一分散に対処するためだと書いている.著者らが挙げるのは,Friedberg(AER 1998)とWolfers(AER 2006)である.この研究は,アメリカの離婚法改正(双方の離婚合意なしに一方的な離婚が可能になったこと)が離婚率に与えた影響を検証している.年ごとの州のパネルデータを作成しDIDで分析し,ウェイトはよくあるように年毎の州の人口を用いている.Friedberg(1998)は人口サイズに関連する不均一分散に対処するためにこのウェイト利用を正当化している.問題は,より精確な推定をするためにウェイティングを用いると断っておきながら,結果を見るとOLSよりWLSの標準誤差が大きくなっていることだ.どうしてこのようなことが起こるのか.

 アウトカムがグループ平均で,かつグループ内サンプルサイズがグループ間で大きく異なる場合を考えよう.さらに議論を単純化するためにクロスセクションの以下のモデルを考える.
{ \displaystyle
 y_i=X_i\beta+\nu_i
}
グループ平均レベルの誤差項{ \displaystyle \nu_i }は説明変数と独立であり,また{ \displaystyle \sum_{j=1}^{J_i}\frac{\nu_{ij}}{J_i} }に等しいとしよう.{ \displaystyle \nu_{ij} }はグループiにおける個人jのミクロレベルの誤差項であり,{ \displaystyle J_i }はグループiにおいて観察される個人の数とする.この時,ミクロレベルの誤差項がiidならグループ平均レベルの誤差項は{ \displaystyle \nu_i=\frac{\sigma^2}{J_i} }.したがって,グループ平均レベルにいる個人の数{ \displaystyle J_i }がグループ間で大きく異なるならば不均一分散の程度は大きくなる.この場合,以下のWLSで推定することで不偏推定量を得る.
{ \displaystyle \sqrt{J_i}y_i=\sqrt{J_i}X_i\beta+\sqrt{J_i}\nu_i }
Friedberg(AER 1998)とWolfers(AER 2006)に戻ると,カリフォルニアとワイオミングでは人口が大きく異なるので,人口でウェイティングするのはより精確な推定量をもたらすと思われる.ではなぜ実際には標準誤差が大きくなってしまうのか.その理由は,個人レベルの誤差項{ \displaystyle \nu_{ij} }が独立であるという仮定が満たされていないからだ.観察されないグループレベルの共通要因によって,個人レベルの誤差項が互いに正の相関をもつことが多い.こうしたクラスター化した場合をモデルにすると,
{ \displaystyle \nu_{ij}=c_i+u_{ij} }
{ \displaystyle c_i, u_{ij} }がそれぞれ{ \displaystyle \sigma_c^2, \sigma_u^2 }でiidならば,グループ平均レベルの誤差項は{ \displaystyle \nu_i=\frac{\sigma^2}{J_i} }とはならず,
{ \displaystyle Var(\nu_i)=\sigma_c^2+\frac{\sigma_u^2}{J_i} }
{ \displaystyle \sigma_c^2 }{ \displaystyle J_i }が大きいならば,グループ平均レベルの分散{ \displaystyle Var(\nu_i) }{ \displaystyle \sigma_c^2 }に近似でき均一分散となる.つまりこの場合にはWLSよりOLSの方がBLUEに近い.WLSの場合には{ \displaystyle J_i\sigma_c^2+\sigma_u^2 }となりこれは不均一分散となる.
 で,応用屋はどうすれば良いのか.第1に,一般的な教科書にあるように修正ブロッシュ=ペーガン検定(modified Breusch-Pagan test)で不均一分散の検定をする.これはOLSの残差二乗をグループサイズの逆数{ \displaystyle \frac{1}{J_i} }に回帰し検定することを意味する.修正ブロッシュ=ペーガン検定の特徴は,切片が{ \displaystyle \sigma_c^2 },傾きが{ \displaystyle \sigma_u^2 }の一致推定量となる点である.以上の検定はグループ内サンプルサイズに対する誤差分散の関連を見ているに過ぎないが,説明変数の不均一分散についても調べることができる(Wooldridge 2013, Chapter 8).著者らがすすめるのは,不均一分散をはじめから問題とするのではなく,まずは適切な診断をしてあげること.第2に,ウェイティングを用いるのかどう用いるのかにかかわらず,真の分散構造は結局はわからないので,誤差項の不均一分散が残っているかもしれない.したがって著者らはheteroskedasticity-robust standard errorsを報告するよう薦めている.第3に,OLSとWLSの両方を報告し,ロバスト標準誤差を比較することである.これは先述のFriedberg(AER 1998)とWolfers(AER 2006)の例でみたように,WLSよりOLSの標準誤差が小さくなっていたら注意が必要ということだ.

(2) 内生的なサンプリングに対処し一致推定量を得る

内生的なサンプリングが生じている場合に一致推定量を得るためにウェイティングを用いるという動機がある.内生的なサンプリングとは,セレクション確率が説明変数で条件づけた上でも被説明変数によって変わってしまうサンプリングのことである.内生的なサンプリングの古典的な例としては,通勤手段(電車かバスか)の規定要因を調べた研究があげられる(Manski and Lerman 1977 ECTA).調査費用等の問題で,サンプリングが各人の住所地ではなく駅や駐車場で行われていたならば,それはランダムサンプリングではなく被説明変数の交通手段にセレクションが生じているだろう.他にも,対数賃金を教育年数に回帰する例を考えよう.労働経済学では教育年数の内生性を取り除くために様々な操作変数を見つけて推定を行ってきたが,先のPSIDを用いたIVEはやはりサンプリングの段階でセレクションが生じているため一致推定量とならない.これは(1)で扱った問題と似ているが,ここでは{ \displaystyle \sqrt{J_i}y_i=\sqrt{J_i}X_i\beta+\sqrt{J_i}\nu_i }{ \displaystyle J_i }がセレクションの逆確率を表す.この例はより一般的にWooldridge(ECTA 1999)がM推定として扱っているが,そこで強調されているのは,サンプリング確率が内生的でなく外生的に決まっているのならばウェイティングは必要ないということだ.換言すれば,被説明変数のサンプリング確率が説明変数のみに基づいて決定されてるのであればウェイティングは必要ない.
 で,応用屋はどうすれば良いのか.第1に,サンプリング確率が内生的に決まっている場合にはセレクションの逆確率でウェイティングせよ.第2に,ウェイティングはロバスト標準誤差とセットで.第3に,サンプリング確率が外生的ならば,ウェイト有り/無しの両方を報告せよ.両推定量は一致推定量となるが,ウェト無しの方がより精確である.両方を報告するのは,比較がmodel specificationに役立つためである.

(3)モデル化されない異質性下において平均部分効果を識別する

グループで異なる効果の異質性がある場合には,モデルスペシフィケーションを誤るとWLSでも問題が生じる.ユニットで効果が異なるという異質性については,社会学者が強く関心を抱く点なので要チェックだろう.一般的には,(I)の記述の例で見たようにWLSによって母集団での割合をウェイト付けることでpopulation average partial effectの一致推定量が得られると考えられるが,実はそうではない.
 このことを理解するために,以下のモデルを考えよう.
{ \displaystyle y_i=\beta_1+\beta_2X_i+\beta_3D_i+\beta_4X_iD_i+\nu_i }
{ \displaystyle D_i }は都市ダミーで{ \displaystyle \nu_i }は説明変数と独立であるとする.すると{ \displaystyle X_i }の効果は異質である.つまり,地方効果が{ \displaystyle \beta_2 }で都市効果が{ \displaystyle \beta_2+\beta_4 }となるからだ.母集団における都市人口の割合を{ \displaystyle \pi }とすると,population average effectは{ \displaystyle \beta_2+\beta_4\pi }である.
 モデルスペシフィケーションを誤って交差項を入れず,かつ都市でのオーバーサンプリングが生じた結果として都市人口割合が{ \displaystyle p > \pi }であると仮定しよう.この時,{ \displaystyle p\neq\pi }なので,a)OLSEは特定の地方・都市効果について一致推定量となるが母集団についてはその限りでない.さらに,b)説明変数{ \displaystyle X }の異常値が推定の影響を与えるため,OLSEは{ \displaystyle  X}のグループ内分散がグループ間でどのように異なっているかに依存する.同じモデルをセレクションの逆確率でウェイティングしたWLSを考えると,WLSが解決するのはa)だけであり,OLSとWLSはそれぞれ異なるpopulation average partial effectを推定するが,両方ともpopulation average effectを識別できない.
 で,応用屋はどうすれば良いのか.第1に,モデル化されていない異質性がある(と考えられる)場合には,「母集団の構成を反映したウェイティングをすればpopulation average partial effectを識別できる」という話を信じないこと.先の例で言えば,モデルスペシフィケーションが誤っている場合には,WLSでaverage partial effect({ \displaystyle \beta_2+\beta_4\pi })すら求められない.また都市と地方で分散が同じならば,WLSでpopulataion average partial effectが求めれる(ただし大体は分散が異なるので求められない).第2に,ウェイト有りと無しを比較してモデルスペシフィケーションを考える.この作業でうまい交差項が見つかるかもしれない.第3に,効果の異質性が大きいと考えられるならば,異質性に着目せよ.average partial effectだけでなく,効果の異質性も重要である.

 以上,(III)は対処に少し厄介だが,いずれのケースでもなぜウェイティングをするのかを明確にし,適切な診断が必要となる.共通して重要なのは,ウェイト有りと無しを比較してあれこれ考えることだ.ちなみにこうした比較はロバスト標準誤差についても同様である(KIng and Roberts 2015 PA).