変量の変換(2)

【問題】 変量 $x, y$ について次が成り立っているとする。 変量 $z, w$ をそれぞれ \[ z = x+y, \quad w = x-y \] によって定めるとき、次の問に答えよ。数値が割り切れない場合は小数第2位まで答えよ(小数第3位を四捨五入せよ)。

[1] 平均値 $\bar{z}$ は  である。  
[2] 平均値 $\bar{w}$ は  である。  
[3] 分散 $s_z^2$ は  である。  
[4] 分散 $s_w^2$ は  である。  
[5] 共分散 $s_{zw}$ は  である。  
[6] 相関係数 $r_{zw}$ は  である。  

【余談】 標準化や偏差値で見たように、1変量の変換はスケールや単位の異なるデータを同一の基準に揃え、相対的な位置関係を比較可能にするために用いられる。 一方、2変量の変換は、目的に応じて都合の良い座標系を取り直す操作と解釈できる。 例えば、部屋番号 $i$ の室温を複数の測定機で測るとき、測定機Xによる測定値を $x_i$, 測定機Yによる測定値を $y_i$ とする。 このとき、 \[ z_i = \frac{x_i + y_i}{2}, \quad w_i = x_i - y_i \] と変換すると、変量 $z$ は(誤差が平均化される分)真の値に近い測定値とみなすことができ、変量 $w$ は真の値が打ち消され誤差の情報のみが反映された量といえる。 したがって、理想的な状況下では変量 $z, w$ は無相関であることが期待されるが、実際のデータにおいて相関が観測される場合には「誤差になんらかの傾向が生じている」と推測できる。 例えば、「測定機Xは大きい値を過大評価しているのではないか」といった考察が可能になる。 このように、2変量の変換では、変換後に期待される関係を検討することにより、誤差の独立性や測定機の偏りといった、前提条件や設定の妥当性を検証することができる。