本稿では、t分布の定義と概要についてまとめています。確率密度関数であることの証明、確率密度関数の導出、期待値・分散、の紹介が含まれます。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
t分布
定義・意味
確率変数 $Z$ と $W$ がそれぞれ独立に標準正規分布と $\chi^2$分布 \begin{align} Z \sim \mathrm{N} \left(0,1\right) \quad W \sim \chi^2 \left(n\right) \end{align} に従うとき、 これらの確率変数を用いて作られる確率変数 \begin{align} t=\frac{\sqrt n Z}{\sqrt W} \end{align} が従う連続型確率分布を自由度 $n$ の$\mathrm{t}$分布 t-distribution という。
確率密度関数
確率密度関数 $f(x)$ は、 \begin{gather} \begin{matrix}f \left(t\right)=\displaystyle\frac{\Gamma \left(\frac{n+1}{2}\right)}{\sqrt{n\pi} \cdot \Gamma \left(\frac{n}{2}\right)} \left(1+\frac{t^2}{n}\right)^{-\frac{n+1}{2}}&-\infty \le t \le \infty\\\end{matrix}\\ n= \left\{1,2, \cdots \right\} \end{gather} または、ベータ関数を用いると、 \begin{gather} \begin{matrix}f \left(t\right)=\displaystyle\frac{1}{\sqrt n \cdot B \left(\frac{n}{2},\frac{1}{2}\right)} \left(1+\frac{t^2}{n}\right)^{-\frac{n+1}{2}}&-\infty \le t \le \infty\\\end{matrix}\\ n= \left\{1,2, \cdots \right\} \end{gather} で与えられる。
略記法
また、$\mathrm{t}$分布は、 \begin{align} t \left(n\right) \end{align} と略記されることがある。
確率密度関数であることの証明
(i)すべての $x$ に関して、$f \left(x\right) \geq 0$ \begin{gather} 0 \lt n,0 \lt B \left(\frac{n}{2},\frac{1}{2}\right)\Rightarrow0 \lt \frac{1}{\sqrt n \cdot B \left(\frac{n}{2},\frac{1}{2}\right)}\\ 0 \lt x^2\Rightarrow0 \lt \left(1+\frac{x^2}{n}\right)^{-\frac{n+1}{2}}\\ \end{gather} したがって、 \begin{align} f \left(x\right)=\frac{1}{\sqrt n \cdot B \left(\frac{n}{2},\frac{1}{2}\right)} \left(1+\frac{x^2}{n}\right)^{-\frac{n+1}{2}} \geq 0 \end{align} (ii)すべての確率の和が1 \begin{align} \int_{-\infty}^{\infty}f \left(x\right)dx&=\int_{-\infty}^{\infty}{\frac{1}{\sqrt n \cdot B \left(\frac{n}{2},\frac{1}{2}\right)} \left(1+\frac{x^2}{n}\right)^{-\frac{n+1}{2}}dx}\\ &=\frac{1}{\sqrt n \cdot B \left(\frac{n}{2},\frac{1}{2}\right)}\int_{-\infty}^{\infty}{ \left(1+\frac{x^2}{n}\right)^{-\frac{n+1}{2}}dx} \end{align} ここで、$f \left(x\right)$ は、偶関数 $f \left(x\right)=f \left(-x\right)$ なので、偶関数の性質 $\int_{-a}^{a}f \left(x\right)dx=2\int_{0}^{a}f \left(x\right)dx$ より、 \begin{align} \int_{-\infty}^{\infty}f \left(x\right)dx=\frac{2}{\sqrt n \cdot B \left(\frac{n}{2},\frac{1}{2}\right)}\int_{0}^{\infty}{ \left(1+\frac{x^2}{n}\right)^{-\frac{n+1}{2}}dx} \end{align} ここで、以下のように変数変換すると、 \begin{gather} \left(1+\frac{x^2}{n}\right)^{-1}=u\Leftrightarrow x=\sqrt{n \left(\frac{1}{u}-1\right)}\\ \frac{dx}{du}=-\frac{\sqrt n}{2u^2\sqrt{ \left(\frac{1}{u}-1\right)}}\Rightarrow dx=-\frac{\sqrt n}{2u^2\sqrt{ \left(\frac{1}{u}-1\right)}}du\\ x:0\rightarrow\infty \quad \Rightarrow \quad t:1\rightarrow0 \end{gather} となるので、 置換積分法により、 \begin{align} \int_{-\infty}^{\infty}f \left(x\right)dx&=\frac{2}{\sqrt n \cdot B \left(\frac{n}{2},\frac{1}{2}\right)}\int_{1}^{0}{u^\frac{n+1}{2} \left\{-\frac{\sqrt n}{2u^2\sqrt{ \left(\frac{1}{u}-1\right)}}\right\}du}\\ &=\frac{1}{B \left(\frac{n}{2},\frac{1}{2}\right)}\int_{0}^{1}{u^{\frac{n+1}{2}-2-\frac{1}{2}} \cdot \frac{1}{\sqrt{ \left(1-u\right)}}du}\\ &=\frac{1}{B \left(\frac{n}{2},\frac{1}{2}\right)}\int_{0}^{1}{u^{\frac{n}{2}-2} \left(1-u\right)^{-\frac{1}{2}}du}\\ \end{align} ベータ関数の定義式 $B \left(\alpha,\beta\right)=\int_{0}^{1}{x^{\alpha-1} \left(1-x\right)^{\beta-1}dx}$ により、 \begin{align} \int_{-\infty}^{\infty}f \left(x\right)dx=\frac{1}{B \left(\frac{n}{2},\frac{1}{2}\right)} \cdot B \left(\frac{n}{2},\frac{1}{2}\right)=1 \end{align} よって、確率密度関数の定義を満たしているため、確率密度関数である。 $\blacksquare$
【定理】t分布の確率密度関数の導出
【定理】
$\mathrm{t}$分布の確率密度関数の導出
Derivation of t-Distribution
確率変数 $Z$ と $W$ がそれぞれ独立に標準正規分布と $\chi^2$分布 \begin{align} Z \sim \mathrm{N} \left(0,1\right) \quad W \sim \chi^2 \left(n\right) \end{align} に従うとき、 これらの確率変数を用いて作られる確率変数 \begin{align} t=\frac{\sqrt n Z}{\sqrt W} \end{align} は自由度 $n$ の $\mathrm{t}$分布に従う。
導出
確率変数 $Z,W$ の確率密度関数は、 \begin{gather} \begin{matrix}g \left(z\right)=\frac{1}{\sqrt{2\pi}}e^{-\frac{z^2}{2}}&-\infty \lt z \lt \infty\\\end{matrix}\\ h \left(w\right)= \left\{\begin{matrix}\frac{1}{2^\frac{n}{2} \cdot \Gamma \left(\frac{n}{2}\right)}w^{\frac{n}{2}-1}e^{-\frac{w}{2}}&0 \le w\\0&w \lt 0\\\end{matrix}\right. \end{gather} 確率変数の独立性の定義式 $f \left(x,y\right)=g \left(x\right) \cdot h \left(y\right)$ より、同時確率密度関数は、 \begin{align} f \left(w,z\right)=\frac{1}{2^\frac{n}{2} \cdot \Gamma \left(\frac{n}{2}\right)}w^{\frac{n}{2}-1}e^{-\frac{w}{2}} \cdot \frac{1}{\sqrt{2\pi}}e^{-\frac{z^2}{2}} \end{align} ここで、以下のように変数変換すると、 \begin{gather} \left\{\begin{matrix}u=w\\t=\frac{z\sqrt n}{\sqrt w}\\\end{matrix}\right.\Rightarrow \left\{\begin{matrix}w=u\\z=\frac{\sqrt u}{\sqrt n}t\\\end{matrix}\right.\\ \begin{matrix}w:0\rightarrow\infty\\z:-\infty\rightarrow\infty\\\end{matrix} \quad \Rightarrow \quad \begin{matrix}u:0\rightarrow\infty\\t:-\infty\rightarrow\infty\\\end{matrix} \end{gather} 変数変換のヤコビアンは、 \begin{align} \left|J\right|&= \left|\begin{matrix}\frac{\partial w}{\partial u}&\frac{\partial z}{\partial u}\\\frac{\partial w}{\partial t}&\frac{\partial z}{\partial t}\\\end{matrix}\right|\\ &= \left|\begin{matrix}1&\frac{t}{2\sqrt{un}}\\0&\frac{\sqrt u}{\sqrt n}\\\end{matrix}\right|\\ &= \left|\frac{\sqrt u}{\sqrt n}+0\right|\\ &=\frac{\sqrt u}{\sqrt n} \end{align} 変数変換後の同時確率密度関数の公式 $g \left(u,t\right)=f \left\{w \left(u,t\right),z \left(u,t\right)\right\} \left|J\right|$ より、 \begin{align} g \left(u,t\right)&=\frac{1}{2^\frac{n}{2} \cdot \Gamma \left(\frac{n}{2}\right)}u^{\frac{n}{2}-1}e^{-\frac{u}{2}} \cdot \frac{1}{\sqrt{2\pi}}e^{-\frac{u}{2n}t^2} \cdot \frac{\sqrt u}{\sqrt n}\\ &=\frac{1}{\sqrt{2\pi} \cdot 2^\frac{n}{2} \cdot \Gamma \left(\frac{n}{2}\right)} \cdot u^{\frac{n}{2}-1} \cdot e^{-\frac{u}{2} \left(1+\frac{t^2}{n}\right)} \cdot \frac{\sqrt u}{\sqrt n} \end{align} 周辺確率分布の定義式 $g \left(x\right)=\int_{-\infty}^{\infty}f \left(x,y\right)dy$ より、 \begin{align} k \left(t\right)&=\int_{0}^{\infty}{\frac{1}{\sqrt{2\pi} \cdot 2^\frac{n}{2} \cdot \Gamma \left(\frac{n}{2}\right)} \cdot u^{\frac{n}{2}-1} \cdot e^{-\frac{u}{2} \left(1+\frac{t^2}{n}\right)} \cdot \frac{\sqrt u}{\sqrt n}du}\\ &=\frac{1}{\sqrt{2n\pi} \cdot 2^\frac{n}{2} \cdot \Gamma \left(\frac{n}{2}\right)}\int_{0}^{\infty}{u^{\frac{n}{2}+\frac{1}{2}-1} \cdot e^{-\frac{u}{2} \left(1+\frac{t^2}{n}\right)}du} \end{align} ガンマ関数の公式 $\frac{\Gamma \left(\alpha\right)}{\beta^\alpha}=\int_{0}^{\infty}{x^{\alpha-1}e^{-\beta x}dx}$ より、$\alpha=\frac{n+1}{2},\beta=\frac{1}{2} \left(1+\frac{t^2}{n}\right)$ とすると、 \begin{align} k \left(t\right)&=\frac{1}{\sqrt{2n\pi} \cdot 2^\frac{n}{2} \cdot \Gamma \left(\frac{n}{2}\right)}\Gamma \left(\frac{n+1}{2}\right) \cdot 2^\frac{n+1}{2} \cdot \left(1+\frac{t^2}{n}\right)^{-\frac{n+1}{2}}\\ &=\frac{\Gamma \left(\frac{n+1}{2}\right)}{\sqrt{n\pi} \cdot \Gamma \left(\frac{n}{2}\right)} \left(1+\frac{t^2}{n}\right)^{-\frac{n+1}{2}} \end{align} また、ガンマ関数の性質 $\Gamma \left(\frac{1}{2}\right)=\sqrt\pi$ より、 \begin{align} k \left(t\right)=\frac{\Gamma \left(\frac{n+1}{2}\right)}{\sqrt n \cdot \Gamma \left(\frac{1}{2}\right)\Gamma \left(\frac{n}{2}\right)} \left(1+\frac{t^2}{n}\right)^{-\frac{n+1}{2}} \end{align} ベータ関数とガンマ関数の関係 $B \left(\alpha,\beta\right)=\frac{\Gamma \left(\alpha\right)\Gamma \left(\beta\right)}{\Gamma \left(\alpha+\beta\right)}$ より、 \begin{align} k \left(t\right)=\frac{1}{\sqrt n \cdot B \left(\alpha,\beta\right)} \left(1+\frac{t^2}{n}\right)^{-\frac{n+1}{2}} \end{align} $\blacksquare$
重要事項のまとめ
略記法
\begin{align} t \left(n\right) \end{align}
パラメータ
\begin{gather} n= \left\{1,2, \cdots \right\} \end{gather}
確率密度関数
\begin{gather} \begin{matrix}f \left(t\right)=\displaystyle\frac{\Gamma \left(\frac{n+1}{2}\right)}{\sqrt{n\pi} \cdot \Gamma \left(\frac{n}{2}\right)} \left(1+\frac{t^2}{n}\right)^{-\frac{n+1}{2}}&-\infty \le t \le \infty\\\end{matrix} \end{gather} または、 \begin{gather} \begin{matrix}f \left(t\right)=\displaystyle\frac{1}{\sqrt n \cdot B \left(\frac{n}{2},\frac{1}{2}\right)} \left(1+\frac{t^2}{n}\right)^{-\frac{n+1}{2}}&-\infty \le t \le \infty\\\end{matrix} \end{gather}
期待値
\begin{align} E \left(X\right)=0 \end{align}
分散
\begin{align} V \left(X\right)=\frac{n}{n-2} \end{align}
参考文献
- 小寺 平治 著. 数理統計:明解演習. 共立出版, 1986, p.p.57, p100-101
- 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.153-155
- 竹村 彰通 著. 現代数理統計学. 創文社, 1991, p.68-71
- 稲垣 宣生 著. 数理統計学. 裳華房, 2003, p.90-92
- 久保川 達也 著, 新井 仁之, 小林 俊行, 斎藤 毅, 吉田 朋広 編. 現代数理統計学の基礎. 共立出版, 2017, p.89-92
- 黒木 学 著. 数理統計学:統計的推論の基礎. 共立出版, 2020, p.119-123
0 件のコメント:
コメントを投稿