Western and Bloome(SM 2009) Variance Function Regressionによる不平等の分析

最近Bruce Westernがよく使っているVariance Function Regression(VFR)を本人が解説した論文.国内学会の報告等でもVFRは最近みかける.

Western, B., and Bloome, D. 2009. "VARIANCE FUNCTION REGRESSIONS FOR STUDYING INEQUALITY." Sociological Methodology 39(1): 293-326.

通常の回帰分析は女性より男性のほうが高い賃金を予測するとか,大卒者が非大卒より高い階層帰属意識であるとか,グループ間の比較(between-group)を主眼としている.それに対してVFRはグループ内(within-group)の分散に着目し,女性や男性の賃金の不平等のばらつきに何が影響を与えているのかに関心がある.簡潔に述べれば,回帰分析で推定された残差分散を分析するのがVFRである.手順としては,第1に被説明変数を説明変数に回帰して{ \displaystyle
\beta_{ki}
}を推定し残差を保存,第2に(対数)残差二乗をさらに説明変数に回帰し{ \displaystyle
\lambda_{ki}
}を得る.平均値と分散は逆の動きをすることが多いので{ \displaystyle
\beta_{ki}
}{ \displaystyle
\lambda_{ki}
}はだいたいが逆の符号になるが,{ \displaystyle
\beta_{ki}
}{ \displaystyle
\lambda_{ki}
}が同じ符号になっていればストーリとしては面白くなるだろう.推定方法について,本稿で取り上げられているのは,(1)GLM,(2)ML,(3) REML,(4)Bayesである.GLM以外は先の手順を繰り返す.著者らはモンテカルロシミュレーションを行い,バイアスが小さいのは(3) REMLと(4)Bayesでありこれらを用いることを推奨している.VFRを用いれば不平等変化の要因分解も可能である.不平等の変化は,a)between-group不平等,b)within-group不平等,c)グループ(集団)比率の変化に分解できる.この計算は簡単にできるし,少しのプログラムでベイズでもできる.要因分解についてはLemieux(AER 2006)に従っているのでそちらを参照するほうが分かりやすいし詳しい.VFRは記述的な分析なので,モデルを慎重にたてる必要がある.とりわけステップ2を意識して欠落変数バイアスにご注意あれ.ちなみにstataでのVFRの一例は以下.

reg Y ‘X’;
predict R, r;
gen R2=Rˆ2;
glm R2 ‘Z’, family(gamma) link(log); predict S2, mu;
gen LOGLIK=−.5∗(ln(S2)+(R2/S2)); egen LL0 = sum(LOGLIK);
di LL0;
∗Updating beta and lambda coefficients; gen DLL=1;
while DLL > .00001 {;
drop R;
quietly: reg Y ‘X’ [aw=1/S2]; drop S2;
predict R, r;
replace R2=Rˆ2;
est store BETA;
quietly:
glm R2 ‘Z’, family(gamma) link(log); predict S2, mu;
est store LAMBDA;
replace LOGLIK=−.5∗(ln(S2)+(R2/S2)); egen LLN = sum(LOGLIK);
di LLN;
replace DLL=LLN-LL0; replace LL0=LLN; drop LLN;
};
est table BETA LAMBDA, b se;