本稿では、独立な二項分布に対し、事象の発生数の総数が与えられた下での片方の確率変数の条件付き分布が二項分布になることを証明しています。この事実は、生物統計学において平均発生率の正確な信頼区間を求める際などに応用されます。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
【命題】ポアソン分布の和に関する条件付き分布
【命題】
ポアソン分布の和に関する条件付き分布
A Conditional Distribution of Poisson Distribution
確率変数 $X,Y$ がそれぞれ独立にポアソン分布 \begin{align} X \sim \mathrm{Po} \left(\lambda_1\right) \quad Y \sim \mathrm{Po} \left(\lambda_2\right) \end{align} に従うとき、 確率変数 $X$ と $Y$ の和を \begin{align} Z=X+Y \end{align} とすると、 $Z=z$ が与えられているときの確率変数 $X$ の条件付き分布は、二項分布 \begin{align} \left.X\right|Z \sim \mathrm{B} \left(z,\frac{\lambda_1}{\lambda_1+\lambda_2}\right) \end{align} となる。
証明
ポアソン分布の再生性より、 \begin{align} Z \sim \mathrm{Po} \left(\lambda_1+\lambda_2\right) \end{align} 条件付き確率の定義式 $P \left(x\middle| z\right)=\frac{P \left(Z=x,Z=z\right)}{P \left(Z=z\right)}$ より、 \begin{gather} P \left(x\middle| z\right)=\frac{P \left(Z=x,Y=z-x\right)}{P \left(Z=z\right)}\\ g \left(x\middle| z\right)=\frac{f \left(x,z-x\right)}{k \left(z\right)} \end{gather} 確率関数の独立性の定義 $f \left(x,y\right)=g \left(x\right) \cdot h \left(y\right)$ より、 \begin{align} g \left(x\middle| z\right)&=\frac{\lambda_1^xe^{-\lambda_1}}{x!} \cdot \frac{\lambda_2^{z-x}e^{-\lambda_2}}{ \left(z-x\right)!} \cdot \frac{z!}{ \left(\lambda_1+\lambda_2\right)^ze^{- \left(\lambda_1+\lambda_2\right)}}\\ &=\frac{z!}{x! \left(z-x\right)!} \cdot \frac{e^{- \left(\lambda_1+\lambda_2\right)}}{e^{- \left(\lambda_1+\lambda_2\right)}} \cdot \frac{\lambda_1^x\lambda_2^{z-x}}{ \left(\lambda_1+\lambda_2\right)^z}\\ &={}_{z}C_x \cdot \left(\frac{\lambda_1}{\lambda_1+\lambda_2}\right)^x \cdot \left(\frac{\lambda_2}{\lambda_1+\lambda_2}\right)^{z-x}\\ &={}_{z}C_x \cdot \left(\frac{\lambda_1}{\lambda_1+\lambda_2}\right)^x \cdot \left(1-\frac{\lambda_1}{\lambda_1+\lambda_2}\right)^{z-x} \end{align} これは、二項分布の確率関数 \begin{align} f \left(x\right)={}_{n}C_xp^x \left(1-p\right)^{n-x} \end{align} において、 \begin{align} n\rightarrow z \quad p=\frac{\lambda_1}{\lambda_1+\lambda_2} \end{align} と置き換えたものとみなすことができる。 したがって、確率関数の一意性により、確率変数 $X$ の条件付き分布は、二項分布 \begin{align} \left.X\right|Z \sim \mathrm{B} \left(z,\frac{\lambda_1}{\lambda_1+\lambda_2}\right) \end{align} となる。 $\blacksquare$
参考文献
- 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.116 練習問題 ex.3.3.7
- 稲垣 宣生 著. 数理統計学. 裳華房, 2003, p.63 演習問題4.2
- 黒木 学 著. 数理統計学:統計的推論の基礎. 共立出版, 2020, p.96 演習問題5.1
0 件のコメント:
コメントを投稿