統計量の思い出し方
このページは区間推定で用いる統計量の簡単なまとめである。
[ 基本事項 ]
$a$ を実数とし、$X, Y$ を確率変数とすると以下が成り立つ。
\[ \begin{aligned}
E[X+Y] &= E[X] + E[Y] \\
E[aX] &= aE[X] \\
V[aX] &= a^2 V[X]
\end{aligned} \]
これに加え、もし $X, Y$ が独立ならば
\[ V[X+Y] = V[X] + V[Y] \]
も成り立つ。
母分散 $\sigma^2$ が既知の場合に母平均 $\mu$ を推定する
$X_1, \dots, X_n$ を正規分布 $N(\mu, \sigma^2)$ に従う独立な確率変数とする。
このとき、和 $\sum_{i=1}^n X_i$ は $N(n\mu, n\sigma^2)$ に従う。
したがって標本平均
\[ \overline{X} = \frac{1}{n} \sum_{i=1}^n X_i \]
は $N(\mu, \frac{\sigma^2}{n})$ に従う。
母分散既知の場合の母平均の区間推定は、これを標準化した
\[ \frac{\overline{X} - \mu}{ \sigma / \sqrt{n} } \]
が標準正規分布 $N(0,1)$ に従うことを使う。
母分散 $\sigma^2$ が未知の場合に母平均 $\mu$ を推定する
母分散が未知の場合、先の式で $\sigma$ が使えないので、$\sigma$ を不偏分散 $U^2$ の正の平方根 $U$ で置き換えて
\[ \frac{\overline{X} - \mu}{ U / \sqrt{n} } \]
が自由度 $n-1$ の $t$ 分布 $t_{n-1}$ に従うことを使う。
母比率 $p$ を推定する
$0 \leq p \leq 1$ とする。確率変数 $X$ が成功確率 $p$ のベルヌーイ型確率変数であるとは $P(X=1) = p, P(X=0) = 1-p$ を満たすことをいう。
成功確率(母比率)$p$ を推定したい。ベルヌーイ型確率変数 $X$ の平均値と分散はそれぞれ
\[ \begin{aligned} E[X] &= 1 \cdot p + 0 \cdot (1-p) = p, \\ V[X] &= E[X^2] - E[X]^2 = p - p^2 = p(1-p) \end{aligned} \]
と計算できる。
したがって、成功確率 $p$ の独立な $n$ 個のベルヌーイ型確率変数 $X_1 ,\dots, X_n$ の和 $\sum_{i=1}^n X_i$ は平均値が $np$ で分散が $np(1-p)$ である。
よって、標本平均
\[ \overline{X} = \frac{1}{n} \sum_{i=1}^n X_i \]
は平均値が $p$ で分散が $\frac{p(1-p)}{n}$ である。
一方、$\overline{X}$ は成功回数の割合(標本比率)を表している。以下、$\overline{X}$ を $\hat{p}$ と表記する。
$\hat{p}$ は標本平均であるから、$n$ が十分大きい場合は中心極限定理により近似的に正規分布に従う。
実践的には $n$ が十分大きいという条件のもとで
\[ \hat{p} \sim N \left(p, \frac{p(1-p)}{n} \right) \]
と考えてよい。母比率の区間推定は、これを標準化した
\[ \frac{\hat{p} - p}{\sqrt{ \frac{p(1-p)}{n} }} \]
が標準正規分布に(近似的に)従うことを使って計算する…が、実践的には大数の法則を根拠に、分母に登場する $p$ も $\hat{p}$ に置き換えて
\[ \frac{\hat{p} - p}{\sqrt{ \frac{\hat{p}(1-\hat{p})}{n}}} \]
が標準正規分布に従うとみなして計算する。
カイ2乗分布について
$Z_1, \dots, Z_n$ を標準正規分布 $N(0, 1)$ に従う独立な確率変数とする。
このとき、2乗和 $Z_1^2 + \cdots + Z_n^2$ が従う分布を自由度 $n$ のカイ2乗分布 $\chi_{n}^2$ という。
したがって、正規分布 $N(\mu, \sigma^2)$ に従う独立な確率変数 $X_1, \dots, X_n$ について、それらの標準化の2乗和
\[ \sum_{i=1}^n \left( \frac{X_i - \mu}{\sigma} \right)^2 \]
は自由度 $n$ のカイ2乗分布 $\chi_{n}^2$ に従う。
(母平均が未知の場合に)母分散を推定する
母平均が未知の場合、先の式で $\mu$ を標本平均 $\overline{X}$ で置き換えて
\[ \sum_{i=1}^n \left( \frac{X_i - \overline{X}}{\sigma} \right)^2
\quad \left( \, = \frac{1}{\sigma^2} \sum_{i=1}^n (X_i - \overline{X})^2 = \frac{nS^2}{\sigma^2} \, \right)\]
が自由度 $n-1$ のカイ2乗分布 $\chi_{n-1}^2$ に従うことを用いて母分散を推定する。