このページの問題は教科書の p97, 問7.3 の改題である。 ページを再読み込みしても新しい問題は生成されない。
【背景】
戦争において敵国の情報を把握することは極めて重要である。
わずかな情報であっても、戦況に決定的な影響を与えることがあるからだ。
第二次世界大戦中、西側連合国は「ドイツがどれほどの数の戦車を生産しているか」を把握しようと試みた。
当然のことながら、ドイツが正確な生産台数を公表することはないため、連合国は別の情報源から推定する必要があった。
そこで注目されたのが、捕獲した戦車や破壊された戦車の部品などに刻印されたシリアルナンバー(固有の番号)である。
ここでは、$N$ 台の戦車があるとして、各戦車には固有の番号 $1,2, \dots, N$ が一意に割り当てられていると仮定する。
未知の $N$ の値を推定したい。
【問題】
集合 $\{ 1,2, \dots, N \}$ から無作為非復元抽出で選んだサイズ $2$ の標本を $X_1$, $X_2$ として、$T = \max \{ X_1, X_2 \}$ とおく。
例えば、実際にとった標本が $5, 12$ であったとき、確率変数 $T$ の実現値は $t = \max \{ 5,12 \} = 12$ である。
なお、標本は非復元抽出で選んでいるので $X_1$ と $X_2$ の実現値は常に異なることに注意せよ。
$N$ は十分大きい整数であるとして、次の問に答えよ。
[1] $P(T=2)$ を求めよ。
[2] $P(T=3)$ を求めよ。
[3] $2 \leq k \leq N$ を満たす整数 $k$ に対して $P(T = k)$ を求めよ。
[4] $E[T]$ を求めよ。
[5] $\frac{3}{2}T - 1$ が $N$ の不偏推定量であることを示せ。
[1] $\{ 1,2, \dots, N \}$ から無作為非復元抽出でサイズ $2$ の標本を選ぶ方法の総数は $\binom{N}{2}$ 通りである。
このうち、$T = 2$ となる標本の取り方は $\{1,2\}$ の $1$ 組である。よって
\[ P(T=2) = \frac{1}{\binom{N}{2}} = \frac{2}{N(N-1)} \]
である。
[2] $T = 3$ となる標本は $\{1,3\}, \{2,3\}$ の $2$ 組であるから、
\[ P(T=3) = \frac{2}{\binom{N}{2}} = \frac{4}{N(N-1)} \]
である。
[3] $T = k$ となる標本は、ひとつは $k$ を含み、もう一方は $1,2,\dots,k-1$ のどれかでなければならない。
したがって、該当する標本は $k-1$ 組である。
よって、
\[ P(T=k) = \frac{k-1}{\binom{N}{2}} = \frac{2(k-1)}{N(N-1)} \]
である。
[4] 期待値の定義にしたがって次のように計算する。
\[ \begin{aligned}
E[T] &= \sum_{k=2}^N k P(T=k) \\
&= \sum_{k=2}^N \frac{2k(k-1)}{N(N-1)} \\
&= \frac{2}{N(N-1)} \sum_{k=1}^N k(k-1) \\
&= \frac{2}{N(N-1)} \cdot \frac{N(N+1)(N-1)}{3} \\
&= \frac{2}{3}(N+1)
\end{aligned} \]
[5] $E[\frac{3}{2}T - 1] = N$ を示せばよい。[4]の結果を用いて
\[ E \left[ \frac{3}{2}T - 1 \right] = \frac{3}{2}E[T] - 1 = \frac{3}{2} \cdot \frac{2}{3}(N+1) - 1 = N \]
と計算できる。