変量の変換(2)
【問題】 変量 $x, y$ について次が成り立っているとする。
変量 $z, w$ をそれぞれ
\[ z = x+y, \quad w = x-y \]
によって定めるとき、次の問に答えよ。数値が割り切れない場合は小数第2位まで答えよ(小数第3位を四捨五入せよ)。
[1] 平均値 $\bar{z}$ は である。
[2] 平均値 $\bar{w}$ は である。
[3] 分散 $s_z^2$ は である。
[4] 分散 $s_w^2$ は である。
[5] 共分散 $s_{zw}$ は である。
[6] 相関係数 $r_{zw}$ は である。
【余談】
標準化や偏差値で見たように、1変量の変換はスケールや単位の異なるデータを同一の基準に揃え、相対的な位置関係を比較可能にするために用いられる。
一方、2変量の変換は、目的に応じて都合の良い座標系を取り直す操作と解釈できる。
例えば、部屋番号 $i$ の室温を複数の測定機で測るとき、測定機Xによる測定値を $x_i$, 測定機Yによる測定値を $y_i$ とする。
このとき、
\[ z_i = \frac{x_i + y_i}{2}, \quad w_i = x_i - y_i \]
と変換すると、変量 $z$ は(誤差が平均化される分)真の値に近い測定値とみなすことができ、変量 $w$ は真の値が打ち消され誤差の情報のみが反映された量といえる。
したがって、理想的な状況下では変量 $z, w$ は無相関であることが期待されるが、実際のデータにおいて相関が観測される場合には「誤差になんらかの傾向が生じている」と推測できる。
例えば、「測定機Xは大きい値を過大評価しているのではないか」といった考察が可能になる。
このように、2変量の変換では、変換後に期待される関係を検討することにより、誤差の独立性や測定機の偏りといった、前提条件や設定の妥当性を検証することができる。