本稿では、中央値の性質を証明しています。中央値は、観測値からの距離の期待値を最小化する値であるという性質です。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
【命題】中央値の性質
【命題】
中央値の性質
Basic Property of Median
確率変数 $X$ の従う確率分布の中央値 $m$ について、任意の実数 $a$ に対して \begin{align} E \left[ \left|X-m\right|\right] \le E \left[ \left|X-a\right|\right] \end{align} が成り立つ。
証明
期待値の定義式 $E \left(X\right)=\int_{-\infty}^{\infty}{x \cdot f \left(x\right)dx}$ より、 \begin{align} E \left[ \left|X-m\right|\right]&=\int_{-\infty}^{m}{ \left(-x+m\right) \cdot f \left(x\right)dx}+\int_{m}^{\infty}{ \left(x-m\right) \cdot f \left(x\right)dx}\\ &=-\int_{-\infty}^{m}{x \cdot f \left(x\right)dx}+m\int_{-\infty}^{m}f \left(x\right)dx+\int_{m}^{\infty}{x \cdot f \left(x\right)dx}-m\int_{m}^{\infty}f \left(x\right)dx\\ &=-\int_{-\infty}^{m}{x \cdot f \left(x\right)dx}+\int_{m}^{\infty}{x \cdot f \left(x\right)dx}+m \left[\int_{-\infty}^{m}f \left(x\right)dx-\int_{m}^{\infty}f \left(x\right)dx\right] \end{align} 中央値の定義 $\int_{-\infty}^{m}f \left(x\right)dx=\int_{m}^{\infty}f \left(x\right)dx=\frac{1}{2}$ より、 \begin{align} E \left[ \left|X-m\right|\right]=-\int_{-\infty}^{m}{x \cdot f \left(x\right)dx}+\int_{m}^{\infty}{x \cdot f \left(x\right)dx}\tag{1} \end{align}
(i)$a \lt m$ のとき
期待値の定義式 $E \left(X\right)=\int_{-\infty}^{\infty}{x \cdot f \left(x\right)dx}$ より、
\begin{align}
E \left[ \left|X-a\right|\right]&=\int_{-\infty}^{a}{ \left(-x+a\right) \cdot f \left(x\right)dx}+\int_{a}^{\infty}{ \left(x-a\right) \cdot f \left(x\right)dx}\\
&=\int_{-\infty}^{m}{ \left(-x+a\right) \cdot f \left(x\right)dx}-\int_{a}^{m}{ \left(-x+a\right) \cdot f \left(x\right)dx}+\int_{a}^{m}{ \left(x-a\right) \cdot f \left(x\right)dx}+\int_{m}^{\infty}{ \left(x-a\right) \cdot f \left(x\right)dx}\\
&=\int_{-\infty}^{m}{ \left(-x+a\right) \cdot f \left(x\right)dx}+\int_{m}^{\infty}{ \left(x-a\right) \cdot f \left(x\right)dx}+2\int_{a}^{m}{ \left(x-a\right) \cdot f \left(x\right)dx}\\
&=-\int_{-\infty}^{m}{x \cdot f \left(x\right)dx}+\int_{m}^{\infty}{x \cdot f \left(x\right)dx}+2\int_{a}^{m}{ \left(x-a\right) \cdot f \left(x\right)dx}+a\int_{-\infty}^{m}f \left(x\right)dx-a\int_{m}^{\infty}f \left(x\right)dx
\end{align}
式 $(1)$ より、
\begin{align}
E \left[ \left|X-a\right|\right]=E \left[ \left|X-m\right|\right]+2\int_{m}^{a}{ \left(-x+a\right) \cdot f \left(x\right)dx}+a\int_{-\infty}^{m}f \left(x\right)dx-a\int_{m}^{\infty}f \left(x\right)dx
\end{align}
中央値の定義 $\int_{-\infty}^{m}f \left(x\right)dx=\int_{m}^{\infty}f \left(x\right)dx=\frac{1}{2}$ より、
\begin{align}
E \left[ \left|X-a\right|\right]=E \left[ \left|X-m\right|\right]+2\int_{a}^{m}{ \left(x-a\right) \cdot f \left(x\right)dx}
\end{align}
$a \lt m,0 \lt f \left(x\right)$ より、$a \lt x \lt m$ において、
\begin{align}
0 \lt \left(x-a\right) \cdot f \left(x\right)\Rightarrow0 \lt \int_{a}^{m}{ \left(x-a\right) \cdot f \left(x\right)dx}
\end{align}
したがって、
\begin{align}
E \left[ \left|X-m\right|\right] \le E \left[ \left|X-a\right|\right]
\end{align}
(ii)$m \lt a$ のとき
期待値の定義式 $E \left(X\right)=\int_{-\infty}^{\infty}{x \cdot f \left(x\right)dx}$ より、
\begin{align}
E \left[ \left|X-a\right|\right]&=\int_{-\infty}^{a}{ \left(-x+a\right) \cdot f \left(x\right)dx}+\int_{a}^{\infty}{ \left(x-a\right) \cdot f \left(x\right)dx}\\
&=\int_{-\infty}^{m}{ \left(-x+a\right) \cdot f \left(x\right)dx}+\int_{m}^{a}{ \left(-x+a\right) \cdot f \left(x\right)dx}-\int_{m}^{a}{ \left(x-a\right) \cdot f \left(x\right)dx}+\int_{m}^{\infty}{ \left(x-a\right) \cdot f \left(x\right)dx}\\
&=\int_{-\infty}^{m}{ \left(-x+a\right) \cdot f \left(x\right)dx}+\int_{m}^{\infty}{ \left(x-a\right) \cdot f \left(x\right)dx}+2\int_{m}^{a}{ \left(-x+a\right) \cdot f \left(x\right)dx}\\
&=-\int_{-\infty}^{m}{x \cdot f \left(x\right)dx}+\int_{m}^{\infty}{x \cdot f \left(x\right)dx}+2\int_{m}^{a}{ \left(-x+a\right) \cdot f \left(x\right)dx}+a\int_{-\infty}^{m}f \left(x\right)dx-a\int_{m}^{\infty}f \left(x\right)dx\\
\end{align}
式 $(1)$ より、
\begin{align}
E \left[ \left|X-a\right|\right]=E \left[ \left|X-m\right|\right]+2\int_{m}^{a}{ \left(-x+a\right) \cdot f \left(x\right)dx}+a\int_{-\infty}^{m}f \left(x\right)dx-a\int_{m}^{\infty}f \left(x\right)dx
\end{align}
中央値の定義 $\int_{-\infty}^{m}f \left(x\right)dx=\int_{m}^{\infty}f \left(x\right)dx=\frac{1}{2}$ より、
\begin{align}
E \left[ \left|X-a\right|\right]=E \left[ \left|X-m\right|\right]+2\int_{m}^{a}{ \left(-x+a\right) \cdot f \left(x\right)dx}
\end{align}
$m \lt a,0 \lt f \left(x\right)$ より、$m \lt x \lt a$ において、
\begin{align}
0 \lt \left(-x+a\right) \cdot f \left(x\right)\Rightarrow0 \lt \int_{m}^{a}{ \left(-x+a\right) \cdot f \left(x\right)dx}
\end{align}
したがって、
\begin{align}
E \left[ \left|X-m\right|\right] \le E \left[ \left|X-a\right|\right]
\end{align}
(i)(ii)より、任意の実数 $a$ に対して \begin{align} E \left[ \left|X-m\right|\right] \le E \left[ \left|X-a\right|\right] \end{align} $\blacksquare$
参考文献
- 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.77-78
- 黒木 学 著. 数理統計学:統計的推論の基礎. 共立出版, 2020, p.56 演習問題3.2
0 件のコメント:
コメントを投稿