本稿では、フィッシャー・ネイマンの因子分解定理を証明しています。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
【定理】フィッシャー・ネイマンの因子分解定理
【定理】
フィッシャー・ネイマンの因子分解定理
Fisher-Neyman Factorization Theorem
統計量 $T \left(\boldsymbol{X}\right)$ がパラメータ $\theta$ に対する十分統計量であるための必要十分条件は、
$\boldsymbol{X}= \left(X_1,X_2, \cdots ,X_n\right)$ の同時確率(密度)関数
\begin{align}
f_n \left(\boldsymbol{x};\theta\right)
\end{align}
が
$\theta$ に依存する部分($\theta$ と $x$ の積で表される部分)と
そうでない部分($x$ のみの関数になっている部分)
に分解でき、
$\theta$ に依存する部分は、$T=T \left(\boldsymbol{X}\right)$ を通してのみ、$x$ に依存する
すなわち、
\begin{align}
f_n \left(\boldsymbol{x};\theta\right)=g \left(t;\theta\right) \cdot h \left(x\right) \quad g \left(t;\theta\right) \geq 0 \quad h \left(x\right) \geq 0
\end{align}
と表されることである。
また、十分統計量の1-1対応の関数もまた十分統計量である。
証明:離散型確率変数の場合
(i)十分性
$\boldsymbol{X}= \left(X_1,X_2, \cdots ,X_n\right)$ の同時確率関数を $f \left(\boldsymbol{x};\theta\right)$ として、与式のような分解
\begin{align}
f \left(\boldsymbol{x};\theta\right)=g \left(t;\theta\right) \cdot h \left(\boldsymbol{x}\right)
\end{align}
ができるような非負の関数
\begin{align}
g \left(t;\theta\right),h \left(\boldsymbol{x}\right)
\end{align}
が存在するとする。
ここで、統計量 $T \left(\boldsymbol{X}\right)$ は、確率関数ベクトル $\boldsymbol{X}$ の関数なので、$\boldsymbol{X}$ の値(の組み合わせ)によって1つに定まる。よって、$T \left(\boldsymbol{X}\right)=t$ となるような $\boldsymbol{X}$ の同時確率を考えることで、統計量 $T$ の確率質量関数は、
\begin{align}
f \left(t;\theta\right)&=\sum_{\boldsymbol{X}:T \left(\boldsymbol{X}\right)=t} f \left(\boldsymbol{x};\theta\right)\\
&=\sum_{\boldsymbol{X}:T \left(\boldsymbol{X}\right)=t}{g \left(t;\theta\right) \cdot h \left(\boldsymbol{x}\right)}\\
&=g \left(t;\theta\right)\sum_{\boldsymbol{X}:T \left(\boldsymbol{X}\right)=t} h \left(\boldsymbol{x}\right)
\end{align}
と表すことができる。
このとき、$T=t$ が与えられているときの $\boldsymbol{X}= \left(X_1,X_2, \cdots ,X_n\right)$ の条件付き確率分布は、条件付き確率の定義より
\begin{align}
P \left(\ \boldsymbol{X}=\boldsymbol{x}\ \middle|\ T=t\ \right)=\frac{P \left(\boldsymbol{X}=\boldsymbol{x},T=t\right)}{P \left(T=t\right)}
\end{align}
$T \left(\boldsymbol{x}\right)=t$ という条件下 $P \left(\boldsymbol{X}=\boldsymbol{x},T=t\right)=P \left(\boldsymbol{X}=\boldsymbol{x}\right)$ なので、
\begin{align}
P \left(\ \boldsymbol{X}=\boldsymbol{x}\ \middle|\ T=t\ \right)&=\frac{P \left(\boldsymbol{X}=\boldsymbol{x}\right)}{P \left(T=t\right)}\\
&=\frac{f \left(\boldsymbol{x};\theta\right)}{f \left(t;\theta\right)}\\
&=\frac{g \left(t;\theta\right) \cdot h \left(x\right)}{g \left(t;\theta\right)\sum_{\boldsymbol{X}:T \left(\boldsymbol{X}\right)=t} h \left(\boldsymbol{x}\right)}\\
&=\frac{h \left(\boldsymbol{x}\right)}{\sum_{\boldsymbol{X}:T \left(\boldsymbol{X}\right)=t} h \left(\boldsymbol{x}\right)}
\end{align}
したがって、$T=t$ が与えられているときの $\boldsymbol{X}= \left(X_1,X_2, \cdots ,X_n\right)$ の条件付き確率分布は、$\theta$ に依存しない。よって、$T$ は十分統計量である。
(ii)必要性
$T$ を十分統計量とし、$P \left(\boldsymbol{X}=\boldsymbol{x}\right)=0$ のときは、$h \left(\boldsymbol{x}\right)=0$ とし、すべての $T$ の値 $t$ に関して、
\begin{align}
\begin{matrix}h \left(\boldsymbol{x}\right)=P \left(\ \boldsymbol{X}=\boldsymbol{x}\ \middle|\ T=t:\theta\ \right)=P \left(\ \boldsymbol{X}=\boldsymbol{x}\ \middle|\ T=t\ \right)&g \left(t;\theta\right)=P \left(T=t:\theta\right)\\\end{matrix}
\end{align}
とおくと、
確率の乗法定理 $P \left(\boldsymbol{X}=\boldsymbol{x},T=t\right)=P \left(T=t\right) \cdot P \left(\ \boldsymbol{X}=\boldsymbol{x}\ \middle|\ T=t\ \right)$ より、
\begin{align}
f \left(\boldsymbol{x};\theta\right)&=P \left(\boldsymbol{X}=\boldsymbol{x}:\theta\right)\\
&=P \left(\boldsymbol{X}=\boldsymbol{x},T=t\right)\\
&=P \left(T=t\right) \cdot P \left(\ \boldsymbol{X}=\boldsymbol{x}\ \middle|\ T=t\ \right)\\
&=g \left(t;\theta\right) \cdot h \left(\boldsymbol{x}\right)
\end{align}
となり与式のように分解できる。
$\blacksquare$
$T$ を十分統計量とし、$T^\prime=r \left(T\right)$ を1-1対応とすると、$t=r^{-1} \left(t^\prime\right)$ であり、因子分解定理により、
\begin{align}
f \left(\boldsymbol{x};\theta\right)=g \left(t;\theta\right) \cdot h \left(\boldsymbol{x}\right)=g \left\{r^{-1} \left(t^\prime\right);\theta\right\} \cdot h \left(\boldsymbol{x}\right)=g^\prime \left(t^\prime;\theta\right) \cdot h \left(\boldsymbol{x}\right)
\end{align}
$\blacksquare$
参考文献
- 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.199-201
- 久保川 達也 著, 新井 仁之, 小林 俊行, 斎藤 毅, 吉田 朋広 編. 現代数理統計学の基礎. 共立出版, 2017, p.118
0 件のコメント:
コメントを投稿