岩波データサイエンスvol3, P37式展開に関するメモ

おうち時間で暇なので因果推論を勉強しようと思い岩波データサイエンスvol3を読んでいます。今日はP37の式展開で若干詰まったのでそれに関するメモ書きです。

詰まったところ

P37、XYの期待値をとって(3)を導出するところ。
(以下引用)

\displaystyle{
X = \beta_{X,Y}Z \\
Y= \beta_{X,Y}X + \beta_{Z,Y}Z  \tag{2}
}

のとき、Xと誤差\epsilonは独立であると仮定して、式(2)の最後の式(の誤差項 \epsilonを明示したもの)の両辺にXをかけると、

\displaystyle{
XY= \beta_{X,Y}X^2 + \beta_{Z,Y}XZ+X\epsilon  
}

となります。この式の両辺に期待値をとると、

\displaystyle{
cov(X,Y)= \beta_{X,Y}var(X) + \beta_{Z,Y}cov(X,Z)  \tag{3}
}

という式が得られます。

式変換メモ

使った公式は以下の4つ。

\displaystyle{
\begin{eqnarray}
E( \alpha X) &=& \alpha E(X) \\
E(X+Y) &=& E(X) + E(Y)\\
cov(X,Y)&=& E(XY) - E(X)E(Y) \\
Var(X) &=& E(X^2) - E(X)^2 \\
\end{eqnarray}
}

便宜上先にE(X)E(Y)を求めておく。

\displaystyle{
\begin{eqnarray}
E(X) &=& E(\beta_{Z,Y}Z) \\
 &=& \beta_{Z,Y}E(Z) \\
E(Y) &=& E( \beta_{X,Y}X + \beta_{Z,Y}Z) \\
 &=& \beta_{X,Y}E(X) + \beta_{Z,Y}E(Z)\\
 &=&  \beta_{X,Y}\beta_{Z,Y}E(Z) + \beta_{Z,Y}E(Z)
\end{eqnarray}
}

詰まったところの途中式

\displaystyle{
\begin{eqnarray}
E(XY)&=& E(\beta_{X,Y}X^2 + \beta_{Z,Y}XZ+X\epsilon)  \\
E(XY)&=& \beta_{X,Y}E(X^2) + \beta_{Z,Y}E(XZ)+E(X\epsilon)  \\
cov(X,Y) + E(X)E(Y)&=& \beta_{X,Y}\{Var(X) + E(X)^2\} + \beta_{Z,Y}\{cov(X,Z)+E(X)E(Z)\} \\
cov(X,Y)&=& \beta_{X,Y}Var(X) + \beta_{Z,Y}cov(X,Z) - E(X)E(Y) +  \beta_{X,Y}E(X)^2 + \beta_{Z,Y}E(X)E(Z) \\
cov(X,Y)&=& \beta_{X,Y}Var(X) + \beta_{Z,Y}cov(X,Z) - E(X)\{ E(Y) +  \beta_{X,Y}E(X) + \beta_{Z,Y}E(Z)\} \\
cov(X,Y)&=& \beta_{X,Y}Var(X) + \beta_{Z,Y}cov(X,Z) + E(X)\{ - \beta_{X,Y}\beta_{Z,Y}E(Z) - \beta_{Z,Y}E(Z) +  \beta_{X,Y}\beta_{Z,Y}E(Z) + \beta_{Z,Y}E(Z)\} \\
cov(X,Y)&=& \beta_{X,Y}Var(X) + \beta_{Z,Y}cov(X,Z)
\end{eqnarray}
}

無事に式(3)を導出できました。

最後に

式展開で詰まった以上にはてなに数式を書くことにハマりました・・・

7shi.hateblo.jp