本稿では、任意の順序統計量の分布を導出しています。標本最大値や標本最小値の分布は、この問題の特別な場合です。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
【定理】順序統計量の分布
【定理】
順序統計量の分布
Distribution of Order Statistics
累積分布関数 $F \left(x\right)$ をもつ任意の母集団分布(離散型・連続型いずれでもよい)からの無作為標本 \begin{align} \boldsymbol{X}= \left\{X_1,X_2, \cdots ,X_n\right\} \end{align} の $i$ 番目の順序統計量 \begin{align} X_{ \left(i\right)} \end{align} の累積分布関数 $F_i \left(x\right)$ は、 \begin{align} F_i \left(x\right)=\sum_{k=i}^{n}{{}_{n}C_k \left\{F \left(x\right)\right\}^k \left\{1-F \left(x\right)\right\}^{n-k}} \end{align} で与えられる。 また、$\boldsymbol{X}$ が連続型確率変数であり、確率密度関数 $f \left(x\right)$ をもつとき、$X_{ \left(i\right)}$ の確率密度関数は、 \begin{align} f_i \left(x\right)=\frac{n!}{ \left(i-1\right)! \left(n-i\right)!} \left\{F \left(x\right)\right\}^{i-1} \cdot \left\{1-F \left(x\right)\right\}^{n-i} \cdot f \left(x\right) \end{align} で与えられる。
証明
(i)累積分布関数
$x$ を固定し、
$X_i$ が $x$ 以下のときは「成功」、
$x$ を越えるときは「失敗」
とすると、形式的にベルヌーイ試行であると見ることができる。
したがって、$X_i \le x$ となるデータの個数を $Y$ とすると、$Y$ は二項分布
\begin{align}
Y \sim \mathrm{B} \left\{n,F \left(x\right)\right\}
\end{align}
に従う。
ゆえに、二項分布の確率関数の定義式より、
\begin{align}
f \left(y\right)=P \left(Y=y\right)={}_{n}C_y \left\{F \left(x\right)\right\}^y \left\{1-F \left(x\right)\right\}^{n-y}\tag{1}
\end{align}
ここで、累積分布関数の定義式より、
\begin{align}
F_i \left(x\right)=P \left[X_{ \left(i\right)} \le x\right]
\end{align}
すなわち、$i$ 番目の値が $x$ となるためには、
$X_i \le x$ となるデータの個数が $i$ 個以上
となればよいので、
式 $(1)$ を用いると、
\begin{align}
F_i \left(x\right)=\sum_{y=i}^{n}{{}_{n}C_y \left\{F \left(x\right)\right\}^y \left\{1-F \left(x\right)\right\}^{n-y}}
\end{align}
$\blacksquare$
(ii)連続型の場合の確率密度関数
累積分布関数と確率密度関数の関係 $f \left(x\right)=\frac{d}{dx}F \left(x\right)$ から、積の微分公式より、
\begin{align}
f_i \left(x\right)&=\sum_{y=i}^{n}{{}_{n}C_y \left[y \left\{F \left(x\right)\right\}^{y-1} \cdot \left\{1-F \left(x\right)\right\}^{n-y} \cdot f \left(x\right)+ \left\{F \left(x\right)\right\}^y \cdot \left(n-y\right) \left\{1-F \left(x\right)\right\}^{n-y-1} \cdot \left\{-f \left(x\right)\right\}\right]}\\
&=\sum_{y=i}^{n}{{}_{n}C_yy \left\{F \left(x\right)\right\}^{y-1} \left\{1-F \left(x\right)\right\}^{n-y}f \left(x\right)}-\sum_{y=i}^{n}{{}_{n}C_y \left(n-y\right) \left\{F \left(x\right)\right\}^y \left\{1-F \left(x\right)\right\}^{n-y-1}f \left(x\right)}
\end{align}
右辺第1項の $y=i$ の項を外に出すと、
\begin{multline}
f_i \left(x\right)={}_{n}C_ii \left\{F \left(x\right)\right\}^{i-1} \left\{1-F \left(x\right)\right\}^{n-i}f \left(x\right)\\+\sum_{y=i+1}^{n}{{}_{n}C_yy \left\{F \left(x\right)\right\}^{y-1} \left\{1-F \left(x\right)\right\}^{n-y}f \left(x\right)}\\-\sum_{y=i}^{n}{{}_{n}C_y \left(n-y\right) \left\{F \left(x\right)\right\}^y \left\{1-F \left(x\right)\right\}^{n-y-1}f \left(x\right)}
\end{multline}
さらに変形すると、右辺第3項の $y=n$ のときの項は、0だから、
\begin{multline}
f_i \left(x\right)=\frac{n!}{ \left(i-1\right)! \left(n-i\right)!} \left\{F \left(x\right)\right\}^{i-1} \cdot \left\{1-F \left(x\right)\right\}^{n-i} \cdot f \left(x\right)\\+\sum_{y=i}^{n-1}{{}_{n}C_{y+1} \left(y+1\right) \left\{F \left(x\right)\right\}^y \left\{1-F \left(x\right)\right\}^{n-k-1}f \left(x\right)}\\-\sum_{y=i}^{n-1}{{}_{n}C_y \left(n-y\right) \left\{F \left(x\right)\right\}^y \left\{1-F \left(x\right)\right\}^{n-y-1}f \left(x\right)}
\end{multline}
ここで、
\begin{align}
{}_{n}C_{y+1} \left(y+1\right)=\frac{n!}{y! \left(n-y-1\right)!}={}_{n}C_y \left(n-y\right)
\end{align}
したがって、第2項と第3項が相殺されるので、
\begin{align}
f_i \left(x\right)=\frac{n!}{ \left(i-1\right)! \left(n-i\right)!} \left\{F \left(x\right)\right\}^{i-1} \cdot \left\{1-F \left(x\right)\right\}^{n-i} \cdot f \left(x\right)
\end{align}
$\blacksquare$
参考文献
- 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.172-173
- 竹村 彰通 著. 現代数理統計学. 創文社, 1991, p.80-81
- 久保川 達也 著, 新井 仁之, 小林 俊行, 斎藤 毅, 吉田 朋広 編. 現代数理統計学の基礎. 共立出版, 2017, p.101-103
0 件のコメント:
コメントを投稿