チェビシェフの不等式

このページは再読み込みしても新しい問題を生成しない。

[定理] (チェビシェフの不等式) 確率変数 $X$ の平均値を $\mu$ とし、分散を $\sigma^2$ とすると、 任意の $\varepsilon> 0$ に対して \[ P(|X - \mu| \geq \varepsilon) \leq \frac{\sigma^2}{\varepsilon^2} \] が成り立つ。

授業でも触れたように、チェビシェフの不等式は(平均値と分散が存在する限り)任意の確率分布に対して成り立つ、という点で非常に一般性の高い不等式である。 しかし、具体的な分布に適用した場合、その上界としては必ずしも鋭いとは限らない。 例えば、上記の定理において $\varepsilon = 2\sigma$ ととると、 \[ P(|X - \mu| \geq 2\sigma) \leq \frac{\sigma^2}{(2\sigma)^2} = \frac{1}{4} \quad (= 25 \%) \] という評価が得られるが、もし $X$ が正規分布に従うならば、左辺の実際の確率は $5\%$ 程度に過ぎない。 このように、チェビシェフの不等式は一般性の高い不等式であるがゆえに、個々の分布に対する評価としてはしばしば過大となる。 そこで、以下では正規分布とは異なる分布の具体例を通じて、この不等式による上界が実際の確率と比べてどの程度過大であるかを検討してみることにする。

【問題】
$a < b$ に対し、確率密度関数が \[ f(x) = \begin{cases} \frac{1}{b-a}, &\quad a \leq x \leq b \\ 0 &\quad \text{その他} \end{cases} \] で与えられる確率分布を区間 $[a,b]$ 上の一様分布という。 $X$ を区間 $[a,b]$ 上の一様分布に従う確率変数とするとき、次の問に答えよ。

[1] $E[X]$ を求めよ。
[2] $V[X]$ を求めよ。
[3] $E[X] = \mu, V[X] = \sigma^2$ とするとき、$P(|X - \mu| \geq 2\sigma)$ を求めよ。  

[1] $E[X] = \frac{a+b}{2}$ である。(計算の詳細は教科書の定理 6.8 の証明を参照せよ。)
[2] $V[X] = \frac{(b-a)^2}{12}$ である。(計算の詳細は教科書の定理 6.8 の証明を参照せよ。)
[3] [1], [2] より $\mu = \frac{a+b}{2}, \sigma = \frac{b-a}{2\sqrt{3}}$ である。 よって、 \[ \begin{aligned} P ( |X - \mu| \geq 2\sigma) &= P \left( \left| X - \frac{a+b}{2} \right| \geq \frac{b-a}{\sqrt{3}} \right) \\ &= P \left( X - \frac{a+b}{2} \leq -\frac{b-a}{\sqrt{3}} \right) + P \left( \frac{b-a}{\sqrt{3}} \leq X - \frac{a+b}{2} \right) \\ &= P \left( X \leq \frac{a+b}{2} -\frac{b-a}{\sqrt{3}} \right) + P \left( \frac{a+b}{2} + \frac{b-a}{\sqrt{3}} \leq X \right) \\ \end{aligned} \] と計算できるが、 \[ \frac{a+b}{2} -\frac{b-a}{\sqrt{3}} < a, \qquad b < \frac{a+b}{2} + \frac{b-a}{\sqrt{3}} \] なので \[ P \left( X \leq \frac{a+b}{2} -\frac{b-a}{\sqrt{3}} \right) = P \left( \frac{a+b}{2} + \frac{b-a}{\sqrt{3}} \leq X \right) = 0 \] である。よって、$P ( |X - \mu| \geq 2\sigma) = 0$ である。
(この解答の意味が分かりにくい場合は、まず $a=0, b=1$ として計算を追ってみるとよい。)