標本分散の期待値と分散の導出

公開日:

【2023年4月2週】 【B000】数理統計学 【B060】標本分布

この記事をシェアする
  • B!
サムネイル画像

本稿では、標本分散の期待値と分散を導出しています。ここでは真正面からひたすら計算することで、標本分散が不偏推定量ではなく、標本不偏分散が不偏推定量であることを示しています。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。

【命題】標本分散の式変形

【命題】
標本分散の式変形
Deformation of Sample Variance

任意の母集団分布からの大きさ n の無作為標本 X={X1,X2,,Xn} の標本分散について、 Sn2=1ni=1n(XiX¯n)2=1ni=1nXi2X¯n2=12n2i=1nj=1n(XiXj)2 が成り立つ。

証明

証明

(i) Sn2=1ni=1n(XiX¯n)2=1ni=1n(Xi22XiX¯n+X¯n2)=1n{i=1nXi22X¯ni=1nXi+X¯n2i=1n1}=1n{i=1nXi22X¯nnX¯n+nX¯n2}=1n{i=1nXi2nX¯n}=1ni=1nXi2X¯n

(ii)確率変数 XiXj について、常に (XiXj)2=Xi22XiXj+Xj2 確率変数 Xj の和を取ると、Xi は定数であると考えて、 j=1n(XiXj)2=j=1n(Xi22XiXj+Xj2)=nXi22nXiX¯n+j=1nXj2 確率変数 Xi の和を取ると、 i=1nj=1n(XiXj)2=ni=1nXi22nX¯ni=1nXi+i=1nj=1nXj2=ni=1nXi22nX¯ni=1nXi+nj=1nXj2 i=1nXi=nX¯n の関係があるから、 i=1nj=1n(XiXj)2=ni=1nXi22nnX¯n+nj=1nXj2 i=1nXi2=j=1nXj2 なので、 i=1nj=1n(XiXj)2=2ni=1nXi22n2X¯n2 両辺を 2n2 で割ると、 12n2i=1nj=1n(XiXj)2=1ni=1nXi2X¯n=Sn2

【命題】標本分散の期待値と分散

【命題】
標本分散の期待値と分散
Expected Value and Variance of Sample Variance

平均と分散がそれぞれ μσ2 である任意の母集団分布 P(μ,σ2) からの大きさ n の無作為標本 X={X1,X2,,Xn} についての 標本分散と標本不偏分散の期待値と分散は、 μ4=E[(Xμ)4] として、 (I)標本分散 E(S2)=n1nσ2V(S2)=(n1)2n3(μ4n3n1σ4) (II)標本不偏分散 E(s2)=σ2V(s2)=1n(μ4n3n1σ4) で与えられる。

導出

導出

(I)標本分散
(i)期待値
標本平均と母平均の差を表す式を変形すると、 X¯μ=1ni=1nXi1nnμ=1ni=1n(Xiμ) したがって、 (1)i=1n(Xiμ)=n(X¯μ) いっぽう、観測値と標本平均の偏差平方和の式を変形すると、 i=1n(XiX¯)2=i=1n[(Xiμ)+(μX¯)]2=i=1n[(Xiμ)22(Xiμ)(X¯μ)+(X¯μ)2]=i=1n(Xiμ)22(X¯μ)i=1n(Xiμ)+i=1n(X¯μ)2=i=1n(Xiμ)22(X¯μ)i=1n(Xiμ)+n(X¯μ)2(1) より、 i=1n(XiX¯)2=i=1n(Xiμ)22(X¯μ)n(X¯μ)+n(X¯μ)2(2)=i=1n(Xiμ)2n(X¯μ)2 両辺の期待値を取ると、 E[i=1n(XiX¯)2]=E[i=1n(Xiμ)2]nE[(X¯μ)2]=i=1nE[(Xiμ)2]nE[(X¯μ)2] 分散の定義式 V(X)=E[(Xμ)2] より、 E[i=1n(XiX¯)2]=i=1nV(Xi)nV(X¯)=nσ2σ2=(n1)σ2 したがって、 E(S2)=E[1ni=1n(XiX¯)2]=1nE[i=1n(XiX¯)2]=n1nσ2

(ii)分散
Yi=Xiμ,Y¯=X¯μ とおくと、 S2=1ni=1n{(Yi+μ)(Y¯+μ)}2=1ni=1n(YiY¯)2(2) より、 S2=1n(i=1nYi2nY¯) 両辺を2乗すると、 S4=1n2(i=1nYi2nY¯)2=1n2{(i=1nYi2)22ni=1nYi2Y¯2+n2Y¯4} 両辺の期待値を取ると、 E(S4)=1n2E[(i=1nYi2)22ni=1nYi2Y¯2+n2Y¯4](3)=1n2{E[(i=1nYi2)2]2nE[i=1nYi2Y¯2]+n2E[Y¯4]}(3) の右辺第1項、第2項、第3項をそれぞれ、以下のようにおき、計算していく。 A=E[(i=1nYi2)2]B=E[i=1nYi2Y¯2]C=E[Y¯4]

(a) (i=1nYi2)2={(Y1Y¯)2+(Y2Y¯)2++(YnY¯)2}{(Y1Y¯)2+(Y2Y¯)2++(YnY¯)2}=i=1nYi2j=1nYj2 この式を展開していくと、
(a1)i=j となる項
これは、i=j=1,2,nn 個ある。 (a2)ij となる項
i の選び方が n 通り
j の選び方が n1 通り
なので、 全部で n(n1) 個ある。 (a1)、(a2)より、 i=1nYi2j=1nYj2=nYi4+n(n1)Yi2Yj2 両辺の期待値を取ると、 A=E[nYi4+n(n1)Yi2Yj2]=nE[Yi4]+n(n1)E[Yi2Yj2] ここで、ij ならば、Yi,Yj が独立なので、期待値の性質 E{g(X)h(Y)}=E{g(X)}E{h(Y)} より、 A=nE[Yi4]+n(n1)E[Yi2]E[Yj2] 分散の定義式 V(X)=E[(Xμ)2] より、μ4=E[(Xμ)4] とすると、 A=nμ4+n(n1)σ2σ2(4)=nμ4+n(n1)σ4

(b) i=1nYi2Y¯2=(i=1nYi2)(1nj=1nYj)(1nk=1nYk)=1n2(i=1nYi2j=1nYjk=1nYk) 両辺の期待値を取ると、 B=1n2E[i=1nYi2j=1nYjk=1nYk] (a)と同様に考えると、
(b1)3つとも同じ数字となる項(i=j=k
これは、i=j=k=1,2,nn 個ある。 (b2-1)3つのうち2つが同じ数字となる項①(i=jk,i=kj
1種類目の数字の選び方が n 通り
2種類目の数字の選び方が n1 通り
i と同じになるアルファベットの選び方が 2 通り
なので、 全部で 2n(n1) 個ある。 (b2-2)3つのうち2つが同じ数字となる項②(ij=k
1種類目の数字の選び方が n 通り
2種類目の数字の選び方が n1 通り
なので、 全部で n(n1) 個ある。 (b3)3つとも違う数字となる項(ijk
1種類目の数字の選び方が n 通り
2種類目の数字の選び方が n1 通り
3種類目の数字の選び方が n2 通り
なので、 全部で n(n1)(n2) 個ある。 (b1)~(b3)より、 B=1n2{nE[Yi4]+2n(n1)E[Yi3Yj]+n(n1)E[Yi2Yj2]+n(n1)(n2)E[Yi2YjYk]}=1n{E[Yi4]+2(n1)E[Yi3Yj]+(n1)E[Yi2Yj2]+(n1)(n2)E[Yi2YjYk]} 期待値の性質 E{g(X)h(Y)}=E{g(X)}E{h(Y)} より B=1n{E[Yi4]+2(n1)E[Yi3]E[Yj]+(n1)E[Yi2]E[Yj2]+(n1)(n2)E[Yi2]E[Yj]E[Yk]} 期待値周りの1次モーメントは E[Yj]=E[Xiμ]=0 なので、 B=1n{E[Yi4]+(n1)E[Yi2]E[Yj2]} 分散の定義式 V(X)=E[(Xμ)2] より、 B=1n{μ4+(n1)σ2σ2}(5)=1n{μ4+(n1)σ4}

(c) Y¯4=(1ni=1nYi)(1nj=1nYj)(1nk=1nYk)(1nl=1nYl)=1n4(i=1nYij=1nYjk=1nYkl=1nYl) 両辺の期待値を取ると、 C=1n4E[i=1nYij=1nYjk=1nYkl=1nYl] これまでと同様に考えると、
(c1)4つとも同じ数字となる項(i=j=k=lこれは、i=j=k=l=1,2,nn 個ある。 (c2)4つのうち3つが同じ数字となる項(i=j=kl など) 1種類目の数字の選び方が n 通り
2種類目の数字の選び方が n1 通り
そして、同じ数字となるアルファベットの選び方が 4C3=4 通り
なので、 全部で 4n(n1) 個ある。 (c3)4つのうち2つが同じ数字のペアが2つとなる項(i=jk=l など) 1種類目の数字の選び方が n 通り
2種類目の数字の選び方が n1 通りある。
同じ数字となるアルファベットの選び方は、 i と同じとなるアルファベットの選び方が 3C1=3 通りあり、
残り2つのアルファベットを自動的に同じ数字
とすればいいので、 全部で 3n(n1) 個ある。 (c4)4つとも違う数字となる項(ijkl 1種類目の数字の選び方が n 通り
2種類目の数字の選び方が n1 通り
3種類目の数字の選び方が n2 通り
4種類目の数字の選び方が n3 通り
なので、 全部で n(n1)(n2)(n3) 個ある。 (c1)~(c4)より、 C=1n4{nE[Yi4]+4n(n1)E[Yi3Yj]+3n(n1)E[Yi2Yj2]+n(n1)(n2)(n3)E[YiYjYkYl]}=1n3{E[Yi4]+4(n1)E[Yi3Yj]+3(n1)E[Yi2Yj2]+(n1)(n2)(n3)E[YiYjYkYl]} 期待値の性質 E{g(X)h(Y)}=E{g(X)}E{h(Y)} より、 C=1n3{E[Yi4]+4(n1)E[Yi3]E[Yj]+3(n1)E[Yi2]E[Yj2]+(n1)(n2)(n3)E[Yi]E[Yj]E[Yk]E[Yl]} 期待値周りの1次モーメントは E[Yj]=E[Xiμ]=0 なので、 C=1n3{E[Yi4]+3(n1)E[Yi2]E[Yj2]} 分散の定義式 V(X)=E[(Xμ)2] より、 C=1n3{μ4+3(n1)σ2σ2}(6)=1n3{μ4+3(n1)σ4}

(4),(5),(6) を式 (3) に代入すると、 E(S4)=1n2{nμ4+n(n1)σ42n1n{μ4+(n1)σ4}+n21n3{μ4+3(n1)σ4}}=1n2[(n22n+1n)μ4+(n1){n2+3n}σ4]=1n2[(n1)2nμ4+(n1){n22n+3n}σ4]=(n1)2n2[1nμ4+n22n+3n(n1)σ4] 分散の公式 V(X)=E(X2){E(X)}2 より、 V(S2)=(n1)2n2[1nμ4+n22n+3n(n1)σ4](n1)2n2σ4=(n1)2n2[1nμ4+{n22n+3n(n1)1}σ4]=(n1)2n2[1nμ4+{n22n+3n2+nn(n1)}σ4]=(n1)2n2[1nμ4{n3n(n1)}σ4]=(n1)2n3[μ4n3n1σ4]

(II)標本不偏分散
期待値の性質 E(aX)=aE(X) より、 E(s2)=E(nn1S2)=nn1E(S2)=nn1n1nσ2=σ2 また、分散の性質 V(aX)=a2V(X) より、 V(s2)=V(nn1S2)=n2(n1)2V(S2)=n2(n1)2(n1)2n3(μ4n3n1σ4)=1n(μ4n3n1σ4)

参考文献

  • 野田 一雄, 宮岡 悦良 著. 入門・演習数理統計. 共立出版, 1990, p.168-170

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ