統計量の思い出し方

このページは区間推定で用いる統計量の簡単なまとめである。
 
[ 基本事項 ]
$a$ を実数とし、$X, Y$ を確率変数とすると以下が成り立つ。
\[ \begin{aligned} E[X+Y] &= E[X] + E[Y] \\ E[aX] &= aE[X] \\ V[aX] &= a^2 V[X] \end{aligned} \] これに加え、もし $X, Y$ が独立ならば \[ V[X+Y] = V[X] + V[Y] \] も成り立つ。

母分散 $\sigma^2$ が既知の場合に母平均 $\mu$ を推定する

$X_1, \dots, X_n$ を正規分布 $N(\mu, \sigma^2)$ に従う独立な確率変数とする。 このとき、和 $\sum_{i=1}^n X_i$ は $N(n\mu, n\sigma^2)$ に従う。 したがって標本平均 \[ \overline{X} = \frac{1}{n} \sum_{i=1}^n X_i \] は $N(\mu, \frac{\sigma^2}{n})$ に従う。 母分散既知の場合の母平均の区間推定は、これを標準化した \[ \frac{\overline{X} - \mu}{ \sigma / \sqrt{n} } \] が標準正規分布 $N(0,1)$ に従うことを使う。
 
 
母分散 $\sigma^2$ が未知の場合に母平均 $\mu$ を推定する

母分散が未知の場合、先の式で $\sigma$ が使えないので、$\sigma$ を不偏分散 $U^2$ の正の平方根 $U$ で置き換えて \[ \frac{\overline{X} - \mu}{ U / \sqrt{n} } \] が自由度 $n-1$ の $t$ 分布 $t_{n-1}$ に従うことを使う。
 
 

母比率 $p$ を推定する

$0 \leq p \leq 1$ とする。確率変数 $X$ が成功確率 $p$ のベルヌーイ型確率変数であるとは $P(X=1) = p, P(X=0) = 1-p$ を満たすことをいう。 成功確率(母比率)$p$ を推定したい。ベルヌーイ型確率変数 $X$ の平均値と分散はそれぞれ \[ \begin{aligned} E[X] &= 1 \cdot p + 0 \cdot (1-p) = p, \\ V[X] &= E[X^2] - E[X]^2 = p - p^2 = p(1-p) \end{aligned} \] と計算できる。 したがって、成功確率 $p$ の独立な $n$ 個のベルヌーイ型確率変数 $X_1 ,\dots, X_n$ の和 $\sum_{i=1}^n X_i$ は平均値が $np$ で分散が $np(1-p)$ である。 よって、標本平均 \[ \overline{X} = \frac{1}{n} \sum_{i=1}^n X_i \] は平均値が $p$ で分散が $\frac{p(1-p)}{n}$ である。 一方、$\overline{X}$ は成功回数の割合(標本比率)を表している。以下、$\overline{X}$ を $\hat{p}$ と表記する。 $\hat{p}$ は標本平均であるから、$n$ が十分大きい場合は中心極限定理により近似的に正規分布に従う。 実践的には $n$ が十分大きいという条件のもとで \[ \hat{p} \sim N \left(p, \frac{p(1-p)}{n} \right) \] と考えてよい。母比率の区間推定は、これを標準化した \[ \frac{\hat{p} - p}{\sqrt{ \frac{p(1-p)}{n} }} \] が標準正規分布に(近似的に)従うことを使って計算する…が、実践的には大数の法則を根拠に、分母に登場する $p$ も $\hat{p}$ に置き換えて \[ \frac{\hat{p} - p}{\sqrt{ \frac{\hat{p}(1-\hat{p})}{n}}} \] が標準正規分布に従うとみなして計算する。
 
 

カイ2乗分布について

$Z_1, \dots, Z_n$ を標準正規分布 $N(0, 1)$ に従う独立な確率変数とする。 このとき、2乗和 $Z_1^2 + \cdots + Z_n^2$ が従う分布を自由度 $n$ のカイ2乗分布 $\chi_{n}^2$ という。 したがって、正規分布 $N(\mu, \sigma^2)$ に従う独立な確率変数 $X_1, \dots, X_n$ について、それらの標準化の2乗和 \[ \sum_{i=1}^n \left( \frac{X_i - \mu}{\sigma} \right)^2 \] は自由度 $n$ のカイ2乗分布 $\chi_{n}^2$ に従う。
 
 
(母平均が未知の場合に)母分散を推定する

母平均が未知の場合、先の式で $\mu$ を標本平均 $\overline{X}$ で置き換えて \[ \sum_{i=1}^n \left( \frac{X_i - \overline{X}}{\sigma} \right)^2 \quad \left( \, = \frac{1}{\sigma^2} \sum_{i=1}^n (X_i - \overline{X})^2 = \frac{nS^2}{\sigma^2} \, \right)\] が自由度 $n-1$ のカイ2乗分布 $\chi_{n-1}^2$ に従うことを用いて母分散を推定する。