本稿では、確率変数変換についてまとめています。変数変換後の確率密度関数の求め方、線形変換と標準化、確率積分変換、変数変換後の独立性、多次元連続型確率変数の変数変換公式、確率変数のたたみこみなどの定義や性質の紹介が含まれます。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
変数変換後の確率関数の求め方
この節では、確率変数 $X$ の分布が与えられているとき、新たに確率変数 $Y$ を $X$ のある関数、$Y=h \left(X\right)$ として定義し、その $Y$ の分布を考えていく。
離散型確率変数 $X$ の確率関数が $f \left(x\right)$ で与えられているとき、$Y=g \left(X\right)$ の確率関数 $h \left(y\right)$ は、 \begin{align} h \left(y\right)=P \left(Y=y\right)=P \left\{g \left(X\right)=y\right\}=\sum_{x:g \left(x\right)=y} f \left(x\right) \end{align} で求められる。
変数変換後の確率密度関数の求め方
連続型確率変数 $X$ の分布関数と確率密度関数が $F \left(x\right),f \left(x\right)$ で与えられているとき、$Y=g \left(X\right)$ の分布関数 $H \left(y\right)$ は、 \begin{align} H \left(y\right)=P \left(Y \le y\right)=P \left\{g \left(X\right) \le y\right\}=\int_{x:g(x) \le y} f \left(x\right)dx \end{align} で求められる。 確率変数 $Y$ もまた連続型確率変数であればその分布関数が微分可能な点 $y$ で確率密度関数 $h \left(y\right)$ は、 \begin{align} h \left(y\right)=\frac{d}{dy}H \left(y\right) \end{align} で求められる。
変数変換後の確率密度関数
$X$ の確率密度関数から直接 $Y=h \left(x\right)$ の確率密度関数を導ける場合もある。
【公式】
変数変換後の確率密度関数
Probability Density Function after Transformation
連続型確率変数 $X$ の累積分布関数と確率密度関数をそれぞれ \begin{align} F \left(x\right) \quad f \left(x\right) \end{align} とし、 $X$ の標本空間を \begin{align} \Omega= \left\{x:a \le X \le b\right\}\Leftrightarrow P \left(a \le X \le b\right)=1 \end{align} とする。
関数 $h$ が区間 $ \left(a,b\right)$ において、連続、かつ狭義単調関数ならば、$Y=h \left(x\right)$ の確率密度関数 $g \left(y\right)$ は、 \begin{align} g \left(y\right)=f \left[h^{-1} \left(y\right)\right] \left|\frac{d}{dy}h^{-1} \left(y\right)\right| \end{align} で与えられる。 ただし、 \begin{align} x\in \left(a,b\right)\Leftrightarrow h \left(x\right)\in \left(\alpha,\beta\right) \end{align} 区間 $ \left(\alpha,\beta\right)$ で $h$ の逆関数 $h^{-1}$ は微分可能 であるとする。
線形変換と標準化
確率変数 $X$ の変数変換のうち、 \begin{align} Y=aX+b \end{align} のかたちのものを線形変換 liner transformation という。 特に、期待値 $\mu$ と標準偏差 $\sigma$ を用いた、 \begin{align} Z=\frac{X-\mu}{\sigma} \end{align} を標準変換といい、この操作を標準化 standardization という。
確率積分変換
【命題】
確率積分変換
Probability Integral Transformation
\begin{gather} Y=F \left(X\right) \end{gather} という変数変換をすると、 $Y$ は一様分布 \begin{gather} Y \sim \mathrm{U} \left(0,1\right) \end{gather} に従う。
実際に乱数表や乱数生成器などで得た一様分布に従う確率変数から、ある特定の分布関数をもつ確率変数を作ることができる。この方法を逆分布関数法 Inverse distribution function method と呼ぶことがある。
変数変換後の独立性
次に多次元確率変数の変換を考えてみる。まず、互いに独立な確率変数は、変数変換を施しても互いに独立であることが知られている。
【定理】
変数変換後の独立性
Independence of Transformed Random Variables
確率変数 \begin{align} X_1,X_2, \cdots ,X_n \end{align} が互いに独立であれば、 \begin{align} Y_1=h \left(X_1\right),Y_2=h \left(X_2\right), \cdots ,Y_n=h \left(X_n\right) \end{align} という変数変換を行った後の確率変数 \begin{align} Y_1,Y_2, \cdots ,Y_n \end{align} もまた互いに独立である。
多次元離散型確率変数の変数変換公式
離散型確率変数 $\boldsymbol{X}= \left\{X_1,X_2, \cdots ,X_n\right\}$ の同時確率関数を $f \left(x_1,x_2, \cdots ,x_n\right)$ として、 \begin{gather} Y_1=h_1 \left(X_1,X_2, \cdots ,X_n\right)\\ Y_2=h_2 \left(X_1,X_2, \cdots ,X_n\right)\\ \vdots\\ Y_m=h_m \left(X_1,X_2, \cdots ,X_n\right) \end{gather} という変数変換を行う。 このとき、$\boldsymbol{Y}= \left\{y_1,y_2, \cdots ,y_m\right\}$ の同時確率関数は、 \begin{align} g \left(y_1,y_2, \cdots ,y_m\right)=\sum f \left(x_1,x_2, \cdots ,x_n\right) \end{align} で与えられる。 なお、この和は \begin{gather} y_1=h_1 \left(X_1,X_2, \cdots ,X_n\right)\\ y_2=h_2 \left(X_1,X_2, \cdots ,X_n\right)\\ \vdots\\ y_m=h_m \left(X_1,X_2, \cdots ,X_n\right) \end{gather} となるすべての $ \left(x_1,x_2, \cdots ,x_n\right)$ についてである。
多次元連続型確率変数の変数変換公式
$n$ 次元連続型確率変数 $\boldsymbol{X}= \left\{X_1,X_2, \cdots ,X_n\right\}$ の同時確率密度関数を $f \left(x_1,x_2, \cdots ,x_n\right)$ として、 \begin{gather} Y_1=h_1 \left(X_1,X_2, \cdots ,X_n\right)\\ Y_2=h_2 \left(X_1,X_2, \cdots ,X_n\right)\\ \vdots\\ Y_m=h_m \left(X_1,X_2, \cdots ,X_n\right) \end{gather} という変数変換を行う。
(I)$Y=h \left(X_1,X_2, \cdots ,X_n\right)$ の分布関数は、 \begin{align} G \left(y\right)&=P \left(Y \le y\right)=P \left\{h \left(X_1,X_2, \cdots ,X_n\right) \le y\right\}\\ &=\int{ \cdots \int_{A}{f \left(x_1,x_2, \cdots ,x_n\right)dx_1 \cdots d x_n}}\\ A&= \left\{ \left(x_1,x_2, \cdots ,x_n\right)\in\boldsymbol{R}^n;h \left(X_1,X_2, \cdots ,X_n\right) \le y\right\} \end{align} で与えられる。 (II)$\boldsymbol{x}$ に関する $n$ 次元空間の領域 $S$ と $\boldsymbol{y}$ に関する $n$ 次元空間の領域 $T$ は、1対1対応である、すなわち、 \begin{align} \left(x_1,x_2, \cdots ,x_n\right)\in S\Leftrightarrow \left(y_1,y_2, \cdots ,y_n\right)\in T \end{align} とする。
また、次の仮定、
(i)$ \left(y_1,y_2, \cdots ,y_n\right)\in T$ に対して、$T$ から $S$ への逆関数が存在する。
\begin{gather}
x_1=r_1 \left(X_1,X_2, \cdots ,X_n\right)\\
x_2=r_2 \left(X_1,X_2, \cdots ,X_n\right)\\
\vdots\\
x_n=r_n \left(X_1,X_2, \cdots ,X_n\right)
\end{gather}
(ii)偏導関数
\begin{align}
\frac{\partial r_i}{\partial y_i} \quad \left(i=1,2, \cdots ,n\right)
\end{align}
が $T$ において存在し、連続である。
(iii)変数変換のヤコビアン(拡大・縮小率) $J$ が $T$ において0でない
\begin{align}
J= \left|\begin{matrix}\frac{\partial r_1}{\partial y_1}&\frac{\partial r_1}{\partial y_2}& \cdots &\frac{\partial r_1}{\partial y_n}\\\frac{\partial r_2}{\partial y_1}&\frac{\partial r_2}{\partial y_2}& \cdots &\frac{\partial r_2}{\partial y_n}\\\vdots&\vdots&\ddots&\vdots\\\frac{\partial r_n}{\partial y_1}&\frac{\partial r_n}{\partial y_2}& \cdots &\frac{\partial r_n}{\partial y_n}\\\end{matrix}\right| \neq 0
\end{align}
が満たされるとき、
$\boldsymbol{Y}= \left\{Y_1,Y_2, \cdots ,Y_n\right\}$ の同時確率密度関数は、
\begin{align}
g \left(y_1,y_2, \cdots ,y_n\right)= \left\{\begin{matrix}f \left(r_1,r_2, \cdots ,r_n\right) \left|J\right|& \left(y_1,y_2, \cdots ,y_n\right)\in T\\0&\mathrm{other}\\\end{matrix}\right.
\end{align}
で与えられる。
行列を用いた変換における公式
$n$ 次元連続型確率変数 $ \left(X_1,X_2, \cdots ,X_n\right)$ の同時確率密度関数を \begin{gather} f \left(x_1,x_2, \cdots ,x_n\right) \end{gather} とする。
$\boldsymbol{A}$ を任意の $n\times n$ の正則行列とし、 \begin{gather} \boldsymbol{Y}= \left(\begin{matrix}Y_1\\Y_2\\\vdots\\Y_n\\\end{matrix}\right),\boldsymbol{X}= \left(\begin{matrix}X_1\\X_2\\\vdots\\X_n\\\end{matrix}\right) \end{gather} とするとき、 \begin{gather} \boldsymbol{Y}=\boldsymbol{AX} \end{gather} という変数変換後の同時確率密度関数は、 \begin{align} g \left(\boldsymbol{y}\right)=f \left(\boldsymbol{A}^{-1}\boldsymbol{y}\right)\frac{1}{ \left|\boldsymbol{A}\right|} \end{align} ただし、$\boldsymbol{A}^{-\boldsymbol{1}}$ は $\boldsymbol{A}$ の逆行列、$ \left|\boldsymbol{A}\right|$ は $\boldsymbol{A}$ の行列式とする。 として求めることができる。
2次元確率変数の四則演算後の確率密度関数
連続型確率変数 $X,Y$ の同時確率密度関数を \begin{gather} f \left(x,y\right) \end{gather} とするとき、 \begin{gather} S=X+Y\\ T=X-Y\\ U=XY\\ V=\frac{X}{Y} \end{gather} の確率密度関数は、それぞれ
\begin{align} g \left(s\right)=\int_{-\infty}^{\infty}f \left(x,s-x\right)dx\\ g \left(t\right)=\int_{-\infty}^{\infty}f \left(v+y,y\right)dy\\ g \left(u\right)=\int_{-\infty}^{\infty}{f \left(x,\frac{u}{x}\right)\frac{1}{ \left|x\right|}}dx\\ g \left(v\right)=\int_{-\infty}^{\infty}f \left(vy,y\right) \left|y\right|dy \end{align} で与えられる。
確率変数のたたみこみ
互いに独立な連続型確率変数 $X.Y$ の同時確率密度関数を \begin{align} f \left(x,y\right) \end{align} それぞれの確率密度関数を \begin{align} g \left(x\right) \quad h \left(y\right) \end{align} とするとき、 \begin{gather} Z=X+Y \end{gather} という変数変換を行ったときの 確率密度関数は、 \begin{align} k \left(z\right)=\int_{-\infty}^{\infty}{g \left(x\right) \cdot h \left(s-x\right)}dx \end{align} で与えられる。 なお、離散型の場合も同様に、 \begin{align} k \left(z\right)=\sum_{x=-\infty}^{\infty}{g \left(x\right) \cdot h \left(s-x\right)} \end{align} で与えられる。
参考文献
- 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.60-68
- 竹村 彰通 著. 現代数理統計学. 創文社, 1991, p.41-45
- 黒木 学 著. 数理統計学:統計的推論の基礎. 共立出版, 2020, p.67-72
0 件のコメント:
コメントを投稿