本稿では、確率漸化式を用いることで超幾何分布の最頻値を導出しています。計算の途中でやや工夫を要するところもあり、離散型確率分布の最頻値を求める問題としては、煩雑な部類に入ります。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
【定理】超幾何分布の確率漸化式と最頻値
【定理】
超幾何分布の確率漸化式と最頻値
Recurrence Relation and Mode of Hypergeometric Distribution
確率変数 $X$ が超幾何分布
\begin{align}
X \sim \mathrm{HG} \left(N,k,n\right)
\end{align}
に従うとき、
$P \left(X\right)$ と $P \left(X+1\right)$ の比について、
\begin{align}
\frac{P \left(X+1\right)}{P \left(X\right)}=\frac{ \left(k-x\right) \left(n-x\right)}{ \left(x+1\right) \left(N-k-n+x+1\right)}
\end{align}
が成り立ち、
最頻値は、
(i)$\frac{ \left(n+1\right) \left(k+1\right)}{N+2}$ が整数のとき
\begin{align}
X=\frac{ \left(n+1\right) \left(k+1\right)}{N+2}-1,X=\frac{ \left(n+1\right) \left(k+1\right)}{N+2}
\end{align}
(ii)$\frac{ \left(n+1\right) \left(k+1\right)}{N+2}$ が整数でないとき
\begin{align}
X= \left\lceil\frac{ \left(n+1\right) \left(k+1\right)}{N+2}\right\rceil
\end{align}
ただし、$ \left\lceil x\right\rceil$ は、「$x$ を超えない最大の整数」を表す。
で与えられる。
証明
確率関数の定義式を用いて、比を計算すると、
\begin{align}
\frac{P \left(X+1\right)}{P \left(X\right)}&=\frac{\displaystyle\frac{{}_{k}C_{x+1} \cdot {}_{N-k}C_{n-x-1}}{{}_{N}C_n}}{\displaystyle\frac{{}_{k}C_x \cdot {}_{N-k}C_{n-x}}{{}_{N}C_n}}\\
&=\frac{{}_{k}C_{x+1} \cdot {}_{N-k}C_{n-x-1}}{{}_{k}C_x \cdot {}_{N-k}C_{n-x}}\\
&=\frac{\displaystyle\frac{k!}{ \left(x+1\right)! \left\{k- \left(x+1\right)\right\}!}}{\displaystyle\frac{k!}{x! \left(k-x\right)!}} \cdot \frac{\displaystyle\frac{ \left(N-k\right)!}{ \left(n-x-1\right)! \left\{ \left(N-k\right)- \left(n-x-1\right)\right\}!}}{\displaystyle\frac{ \left(N-k\right)!}{ \left(n-x\right)! \left\{ \left(N-k\right)- \left(n-x\right)\right\}!}}\\
&=\frac{ \left(k-x\right) \left(n-x\right)}{ \left(x+1\right) \left(N-k-n+x+1\right)}
\end{align}
この漸化式は、2つの比が
1よりも小さいときは、$P \left(X\right)$ の方が大きい
1のときは、$P \left(X\right)$ と $P \left(X+1\right)$ が等しい
1よりも大きいときは、$P \left(X+1\right)$ の方が大きい
すなわち、
\begin{gather}
\frac{P \left(X+1\right)}{P \left(X\right)} \lt 1\Leftrightarrow P \left(X+1\right) \lt P \left(X\right)\\
1=\frac{P \left(X+1\right)}{P \left(X\right)}\Leftrightarrow P \left(X\right)=P \left(X+1\right)\\
1 \lt \frac{P \left(X+1\right)}{P \left(X\right)}\Leftrightarrow P \left(X\right) \lt P \left(X+1\right)
\end{gather}
ということを意味している。
比が1のときの $X$ の値を求めると、
\begin{gather}
1=\frac{ \left(k-x\right) \left(n-x\right)}{ \left(x+1\right) \left(N-k-n+x+1\right)}\\
\left(x+1\right) \left(N-k-n+x+1\right)= \left(k-x\right) \left(n-x\right)\\
\left(N-k-n+x+1\right)x+ \left(N-k-n+x+1\right)=kn-kx-nx+x^2\\
Nx-kx-nx+x^2+x+N-k-n+x+1=kn-kx-nx+x^2\\
Nx+2x+N-k-n+1=kn\\
Nx+2x+N+1=kn+k+n\\
\end{gather}
両辺に1を足すと、
\begin{gather}
Nx+2x+N+2=kn+k+n+1\\
\left(N+2\right) \left(x+1\right)= \left(n+1\right) \left(k+1\right)\\
x+1=\frac{ \left(n+1\right) \left(k+1\right)}{N+2}\\
x=\frac{ \left(n+1\right) \left(k+1\right)}{N+2}-1
\end{gather}
したがって、$P \left(X\right)$ は、
$x \lt \frac{ \left(n+1\right) \left(k+1\right)}{N+2}-1$ で単調増加
$\frac{ \left(n+1\right) \left(k+1\right)}{N+2}-1 \lt x$ で単調減少
すなわち
\begin{gather}
x \lt \frac{ \left(n+1\right) \left(k+1\right)}{N+2}-1\Leftrightarrow P \left(X\right) \lt P \left(X+1\right)\\
\frac{ \left(n+1\right) \left(k+1\right)}{N+2}-1 \lt x\Leftrightarrow P \left(X+1\right) \lt P \left(X\right)
\end{gather}
最頻値を $m$ とすると、
\begin{align}
P \left(0\right) \lt P \left(1\right) \lt \cdots \lt P \left(m-1\right) \lt P \left(m\right) \geq P \left(m+1\right) \gt \cdots \gt P \left(n\right)
\end{align}
となる。
したがって、最頻値の定義より、
(i)$\frac{ \left(n+1\right) \left(k+1\right)}{N+2}$ が整数のとき
\begin{align}
X=\frac{ \left(n+1\right) \left(k+1\right)}{N+2}-1 \quad X+1=\frac{ \left(n+1\right) \left(k+1\right)}{N+2}
\end{align}
において、確率が最大になる。
(ii)$\frac{ \left(n+1\right) \left(k+1\right)}{N+2}$ が整数でないとき、
\begin{align}
X+1= \left\lceil\frac{ \left(n+1\right) \left(k+1\right)}{N+2}\right\rceil
\end{align}
すなわち、
$\lambda$ を超えない最大の整数
のとき、確率が最大になる。
$\blacksquare$
参考文献
- 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.111 練習問題 ex.3.2.4
0 件のコメント:
コメントを投稿