統計検定 1級 2024年 医薬生物学 問4 多重比較法・用量反応関係

公開日: 更新日:

【A000】生物統計学 【D000】統計検定 過去問

この記事をシェアする
  • B!
サムネイル画像

本稿には、2024年に実施された統計検定1級『医薬生物学』 問4の自作解答案を掲載しています。なお、閲覧にあたっては、以下の点にご注意ください。

  • 統計検定の問題の使用に関する規約により禁止されているため、問題文は掲載することができません。公式サイトで公開されているものなどをご参照ください。
  • この答案は、あくまでも筆者が自作したものであり、公式なものではありません。正式な答案については、公式問題集をご参照ください。
  • 計算ミスや誤字・脱字などがありましたら、コメントなどでご指摘いただければ大変助かります。
  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。

〔1〕検定を繰り返すことによる第1種の過誤の増大

3つの帰無仮説のうち、少なくとも1つの帰無仮説が棄却される確率は、「すべての帰無仮説が棄却されない」という事象の余事象なので、 \begin{align} \mathrm{FWER}&=1- \left(1-0.025\right)^3\\ &=1-{0.975}^3\\ &\cong0.073 \end{align} $\blacksquare$

〔2〕ボンフェローニ法

ボンフェローニ法とは、$ \left|x\right|\ll1$ のとき、 \begin{align} \left(1-x\right)^n\cong1-nx \end{align} という近似が可能であることを用いる多重比較法である。 求める調整有意水準を $a$ とすると、〔1〕と同様に考えて、 \begin{align} \mathrm{FWER}&=1- \left(1-a\right)^3\\ &\cong1- \left(1-3a\right)\\ &=3a \end{align} $\mathrm{FWER}=\alpha$ のとき、 \begin{align} 3a&=\alpha\\ a&=\frac{\alpha}{3} \end{align} $\blacksquare$

〔3〕FWERの制御方法

パターン① 分散分析の帰無仮説が真である場合

本問で設定されている一元配置分散分析の帰無仮説 \begin{align} H_0\colon\mu_0=\mu_1=\mu_2=\mu_3 \end{align} は、論理的に〔1〕の3つの帰無仮説 \begin{align} H_{01}\colon\mu_0=\mu_1 \quad H_{02}\colon\mu_0=\mu_2 \quad H_{03}\colon\mu_0=\mu_3 \end{align} がすべて真である場合と同値な命題である。 $H_0$ が真である場合、一元配置分散分析の有意水準が $\alpha$ に設定されていることから、第1種の過誤の確率は、$\alpha$ 以下に制御されている。

パターン② 分散分析の帰無仮説が偽である場合

いっぽう、$H_0$ が偽である場合、〔1〕の3つの検定を行うとき、$H_0$ は正しく棄却されているので、第1種の過誤は生じていない。この際、検定を行う命題について、3つのうち、(1)1つが真で2つが偽、(2)2つが真で1つが偽、(3)すべてが偽、(4)すべてが真というパターンが考えられる。このうち、(4)は先に検討しており、(3)については、$FWER$ は「全ての仮説の中で少なくとも1つの正しい帰無仮説が誤って棄却されてしまう第1種の過誤の確率」であるから、真である帰無仮説がないこのパターンは $FWER$ の概念に馴染まない。したがって、(1)と(2)について検討すると、

(1)「1つが真で2つが偽」の場合

この場合、偽である2つの検定に関して、第1種の過誤は生じない。いっぽう、真である1つの検定については、有意水準が $\alpha$ に設定されていることから、第1種の過誤の確率は、$\alpha$ 以下に制御されている。

(2)「2つが真で1つが偽」の場合

この場合、偽である1つの検定に関して、第1種の過誤は生じない。いっぽう、真である2つの検定については、〔1〕、〔2〕で検証したように、検定を繰り返すことにより、第1種の過誤の確率は約 $2\alpha$ となり、$\alpha$ 以下に制御されていない。

(3)「すべてが偽」の場合(クリックで表示)

この場合、偽である3つの検定に関して、第1種の過誤は生じない。したがって、この場合、第1種の過誤の確率は $0$ となる。

結論

以上より、各群の人数によらず、$FWER$ が $\alpha$ 以下に制御に制御されるための $\mu_j$ 条件は、①$H_0$ が真、または、②$H_{01},H_{02},H_{03}$ のうち、1つだけが真のいずれかである。 $\blacksquare$

〔4〕検定統計量どうしの相関係数①

正規分布の再生性などから、標本平均は、 \begin{align} {\bar{Y}}_j \sim \mathrm{N} \left(\mu_j,\frac{\sigma^2}{n_j}\right) \end{align} 正規分布の再生性から、 \begin{align} {\bar{Y}}_j-{\bar{Y}}_0 \sim \mathrm{N} \left(\mu_j-\mu_0,s_j^2\right) \quad s_j^2=\frac{\sigma^2}{n_j}+\frac{\sigma^2}{n_0} \end{align} 帰無仮説 \begin{align} H_0\colon\mu_0=\mu_1=\mu_2=\mu_3=\mu \end{align} のもとでは、 \begin{align} {\bar{Y}}_j-{\bar{Y}}_0 \sim \mathrm{N} \left(0,s_j^2\right) \end{align} これを標準化した値は、 \begin{gather} Z_j=\frac{{\bar{Y}}_j-{\bar{Y}}_0}{s_j}\\ Z_j \sim \mathrm{N} \left(0,1\right) \end{gather}

相関係数の定義より、共分散を \begin{align} \mathrm{Cov} \left(Z_jZ_k\right)=\sigma_{jk} \end{align} とすると、 \begin{align} \rho_{jk}&=\frac{\sigma_{jk}}{\sqrt{V \left(Z_j\right)}\sqrt{V \left(Z_k\right)}}\\ &=\frac{\sigma_{jk}}{1 \cdot 1}\\ &=\sigma_{jk} \end{align} 共分散の公式より、 \begin{align} \sigma_{jk}&=E \left(Z_jZ_k\right)-E \left(Z_j\right) \cdot E \left(Z_k\right)\\ &=E \left(Z_jZ_k\right)-0 \cdot 0\\ &=E \left(Z_jZ_k\right) \end{align}

分散の公式の変形より、 \begin{align} E \left({\bar{Y}}_j^2\right)=V \left({\bar{Y}}_j\right)+ \left\{E \left({\bar{Y}}_j\right)\right\}^2 \end{align} 異なる群の標本平均は互いに独立であることから、 \begin{align} E \left({\bar{Y}}_j{\bar{Y}}_0\right)=E \left({\bar{Y}}_j\right)E \left({\bar{Y}}_0\right) \end{align}

積の期待値を計算すると、 \begin{align} E \left(Z_jZ_k\right)&=E \left(\frac{{\bar{Y}}_j-{\bar{Y}}_0}{s_j} \cdot \frac{{\bar{Y}}_k-{\bar{Y}}_0}{s_k}\right)\\ &=\frac{E \left[ \left({\bar{Y}}_j-{\bar{Y}}_0\right) \left({\bar{Y}}_k-{\bar{Y}}_0\right)\right]}{s_js_k}\\ &=\frac{E \left({\bar{Y}}_j{\bar{Y}}_k\right)-E \left({\bar{Y}}_0\right) \left\{E \left({\bar{Y}}_j\right)+E \left({\bar{Y}}_k\right)\right\}+E \left({\bar{Y}}_0^2\right)}{s_js_k}\\ &=\frac{E \left({\bar{Y}}_j\right) \cdot E \left({\bar{Y}}_0\right)-E \left({\bar{Y}}_j\right) \cdot E \left({\bar{Y}}_0\right)-E \left({\bar{Y}}_k\right) \cdot E \left({\bar{Y}}_0\right)+V \left({\bar{Y}}_0\right)+ \left\{E \left({\bar{Y}}_0\right)\right\}^2}{s_js_k}\\ &=\frac{1}{s_js_k} \left(\mu^2-2\mu^2+\frac{\sigma^2}{n_0}+\mu^2\right)\\ &=\frac{n_0}{\sigma^2} \cdot \frac{\sqrt{n_jn_k}}{\sqrt{ \left(n_j+n_0\right) \left(n_k+n_0\right)}} \cdot \frac{\sigma^2}{n_0}\\ &=\frac{\sqrt{n_jn_k}}{\sqrt{ \left(n_j+n_0\right) \left(n_k+n_0\right)}} \end{align} したがって、 \begin{align} \rho_{jk}=\frac{\sqrt{n_jn_k}}{\sqrt{ \left(n_j+n_0\right) \left(n_k+n_0\right)}} \end{align} $\blacksquare$

〔5〕多重対比法における対比ベクトル

直線的な用量反応関係においては、一般に $r$ を正の整数として、 \begin{align} \boldsymbol{c}= \left\{\begin{matrix} \left(-r,-r+1, \cdots ,-1,0,1, \cdots r-1,r\right)&K=2r+1\\ \left(-2r+1,-2r+3, \cdots ,-1,0,1, \cdots 2r-3,2r+1\right)&K=2r\\\end{matrix}\right. \end{align} という対比ベクトルを定めるのが合理的とされている。 したがって、本問の場合 $r=2$ として、 \begin{align} \boldsymbol{c}= \left(-3,-1,1,3\right) \end{align} と定めればよい。 特に、$\sum_{j=0}^{3}c_j^2=1$ となるように調整する場合は、 \begin{align} \sum_{j=0}^{3}c_j^2&= \left(-3\right)^2+ \left(-1\right)^2+1^2+3^2\\ &=9+1+1+9\\ &=20 \end{align} したがって、 \begin{align} \boldsymbol{c}= \left(-\frac{3}{2\sqrt5},-\frac{1}{2\sqrt5},\frac{1}{2\sqrt5},\frac{3}{2\sqrt5}\right) \end{align} と定めればよい。 $\blacksquare$

〔6〕検定統計量どうしの相関係数②

各群の人数を \begin{align} n_0=n_1=n_2=n_3=n \end{align} とすると、 多重対比法における検定統計量間の相関係数の公式より、 \begin{align} \rho_{56}&=\frac{\sum_{i=0}^{3}{c_{5i}c_{6i}/n}}{\sqrt{ \left(\sum_{i=0}^{3}{c_{5i}^2/n}\right) \left(\sum_{i=0}^{3}{c_{6i}^2/n}\right)}}\\ &=\frac{\sum_{i=0}^{3}{c_{5i}c_{6i}}}{\sqrt{ \left(\sum_{i=0}^{3}c_{5i}^2\right) \left(\sum_{i=0}^{3}c_{6i}^2\right)}} \end{align} それぞれの値を求めると、 \begin{align} \sum_{i=0}^{3}{c_{5i}c_{6i}}&= \left(-3\right) \left(-3\right)+ \left(-1\right) \cdot 1+1 \cdot 1+3 \cdot 1\\ &=9-1+1+3\\ &=12 \end{align} \begin{align} \sum_{i=0}^{3}c_{5i}^2&= \left(-3\right)^2+ \left(-1\right)^2+1^2+3^2\\ &=9+1+1+9\\ &=20 \end{align} \begin{align} \sum_{i=0}^{3}c_{6i}^2&= \left(-3\right)^2+1^2+1^2+1^2\\ &=9+1+1+1\\ &=12 \end{align} したがって、 \begin{align} \rho_{56}&=\frac{12}{\sqrt{20 \cdot 12}}\\ &=\frac{\sqrt{12}}{\sqrt{20}}\\ &\cong0.775 \end{align} $\blacksquare$

多重対比法における検定統計量間の相関係数の公式の導出

導出過程(クリックで表示)
前提条件の整理

本問と同様、群 $j \left(j=1,2, \cdots ,K\right)$ の試験参加者 $i \left(i=1,2, \cdots ,n_j\right)$ の結果変数 $Y_{ij}$ は分散が既知であり、かつすべての群で等しい正規分布 \begin{align} Y_{ij} \sim \mathrm{N} \left(\mu_j,\sigma^2\right) \end{align} に従うとする。 また、各群の結果変数の標本平均を \begin{align} {\bar{Y}}_j=\frac{1}{n_j}\sum_{i=1}^{n_j}Y_{ij} \end{align} とする。 このとき、正規分布の再生性などから、標本平均は、 \begin{align} {\bar{Y}}_j \sim \mathrm{N} \left(\mu_j,\frac{\sigma^2}{n_j}\right) \end{align}

検定統計量が従う分布

直線的な用量反応関係が成り立つよう、 \begin{align} \sum_{j=1}^{K}c_{lj}=0 \end{align} を満たすように対比ベクトルを設定し、 検定統計量を \begin{align} Z_l=\frac{\sum_{j=1}^{K}{c_{lj}{\bar{Y}}_j}}{s_l}, \quad s_l^2=\sigma^2\sum_{j=1}^{K}\frac{c_{lj}^2}{n_j} \end{align} とすると、 正規分布の再生性などから、検定統計量は帰無仮説 \begin{align} \sum_{j=1}^{K}{c_{lj}\mu_j}=0 \end{align} のもとで、 標準正規分布 \begin{align} Z_l \sim \mathrm{N} \left(0,1\right) \end{align} に従う。

相関係数の計算

相関係数の定義より、共分散を \begin{align} \mathrm{Cov} \left(Z_lZ_m\right)=\sigma_{lm} \end{align} とすると、 \begin{align} \rho_{lm}&=\frac{\sigma_{lm}}{\sqrt{V \left(Z_l\right)}\sqrt{V \left(Z_m\right)}}\\ &=\frac{\sigma_{lm}}{1 \cdot 1}\\ &=\sigma_{lm} \end{align} 共分散の公式より、 \begin{align} \sigma_{lm}&=E \left(Z_lZ_m\right)-E \left(Z_l\right) \cdot E \left(Z_m\right)\\ &=E \left(Z_lZ_m\right)-0 \cdot 0\\ &=E \left(Z_lZ_m\right) \end{align} したがって、積の期待値を計算すると、 \begin{align} E \left(Z_lZ_m\right)&=E \left[ \left(\frac{\sum_{j=1}^{K}{c_{lj}{\bar{Y}}_j}}{s_l}\right) \left(\frac{\sum_{j=1}^{K}{c_{mj}{\bar{Y}}_j}}{s_m}\right)\right]\\ &=\frac{1}{s_ls_m}E \left[ \left(\sum_{j=1}^{K}{c_{lj}{\bar{Y}}_j}\right) \left(\sum_{j=1}^{K}{c_{mj}{\bar{Y}}_j}\right)\right]\\ &=\frac{1}{\sqrt{\sigma^2 \left(\sum_{j=1}^{K}{c_{lj}^2/n_j}\right)}} \cdot \frac{1}{\sqrt{\sigma^2 \left(\sum_{j=1}^{K}{c_{mj}^2/n_j}\right)}} \cdot E \left[ \left(\sum_{j=1}^{K}{c_{lj}{\bar{Y}}_j}\right) \left(\sum_{j=1}^{K}{c_{mj}{\bar{Y}}_j}\right)\right]\\ &=\frac{1}{\sigma^2\sqrt{ \left(\sum_{j=1}^{K}{c_{lj}^2/n_j}\right) \left(\sum_{j=1}^{K}{c_{mj}^2/n_j}\right)}} \cdot E \left[ \left(\sum_{j=1}^{K}{c_{lj}{\bar{Y}}_j}\right) \left(\sum_{j=1}^{K}{c_{mj}{\bar{Y}}_j}\right)\right] \end{align} 期待値の部分を計算すると、 \begin{align} E \left[ \left(\sum_{j=1}^{K}{c_{lj}{\bar{Y}}_j}\right) \left(\sum_{j=1}^{K}{c_{mj}{\bar{Y}}_j}\right)\right]&=E \left[ \left(c_{l1}{\bar{Y}}_1+ \cdots +c_{lK}{\bar{Y}}_K\right) \left(c_{m1}{\bar{Y}}_1+ \cdots +c_{mK}{\bar{Y}}_K\right)\right]\\ &=E \left[ \left(\sum_{j=1}^{K}{c_{lj}c_{mj}{\bar{Y}}_j^2}\right)+ \left(\sum_{j=1}^{K}\sum_{q \neq j}{c_{lj}c_{mq}{\bar{Y}}_j{\bar{Y}}_q}\right)\right]\\ &= \left\{\sum_{j=1}^{K}{c_{lj}c_{mj}E \left({\bar{Y}}_j^2\right)}\right\}+ \left\{\sum_{j=1}^{K}\sum_{q \neq j}{c_{lj}c_{mq}E \left({\bar{Y}}_j{\bar{Y}}_q\right)}\right\} \end{align} ここで分散の公式の変形より、 \begin{align} E \left({\bar{Y}}_j^2\right)=V \left({\bar{Y}}_j\right)+ \left\{E \left({\bar{Y}}_j\right)\right\}^2 \end{align} 異なる群の標本平均は互いに独立であることから、 \begin{align} E \left({\bar{Y}}_j{\bar{Y}}_q\right)=E \left({\bar{Y}}_j\right)E \left({\bar{Y}}_q\right) \end{align} したがって、 \begin{align} E \left[ \left(\sum_{j=1}^{K}{c_{lj}{\bar{Y}}_j}\right) \left(\sum_{j=1}^{K}{c_{mj}{\bar{Y}}_j}\right)\right]&= \left[\sum_{j=1}^{K}{c_{lj}c_{mj} \left\{V \left({\bar{Y}}_j\right)+ \left\{E \left({\bar{Y}}_j\right)\right\}^2\right\}}\right]+ \left\{\sum_{j=1}^{K}\sum_{q \neq i}{c_{lj}c_{mq}E \left({\bar{Y}}_j\right)E \left({\bar{Y}}_q\right)}\right\}\\ &= \left\{\sum_{j=1}^{K}{c_{lj}c_{mj}V \left({\bar{Y}}_j\right)}\right\}+ \left\{\sum_{j=1}^{K}{c_{lj}c_{mj}E \left({\bar{Y}}_j\right) \cdot E \left({\bar{Y}}_j\right)}\right\}+ \left\{\sum_{j=1}^{K}\sum_{q \neq i}{c_{lj}c_{mq}E \left({\bar{Y}}_j\right)E \left({\bar{Y}}_q\right)}\right\}\\ &= \left\{\sum_{j=1}^{K}{c_{lj}c_{mj}V \left({\bar{Y}}_j\right)}\right\}+ \left\{\sum_{j=1}^{K}\sum_{q=1}^{K}{c_{lj}c_{mq}E \left({\bar{Y}}_j\right)E \left({\bar{Y}}_q\right)}\right\}\\ &=\sigma^2\sum_{j=1}^{K}\frac{c_{lj}c_{mj}}{n_j}+\sum_{j=1}^{K}\sum_{q=1}^{K} \left(c_{lj}c_{mq} \cdot \mu_j\mu_q\right) \end{align} 右辺第2項を計算すると、 \begin{align} \sum_{j=1}^{K}\sum_{q=1}^{K} \left(c_{lj}c_{mq} \cdot \mu_j\mu_q\right)&=c_{l1}\mu_1 \left(c_{m1}\mu_1+ \cdots +c_{mK}\right)+ \cdots +c_{lK}\mu_K \left(c_{m1}\mu_1+ \cdots +c_{mK}\right)\\ &=\sum_{j=1}^{K} \left\{c_{lj}\mu_j \cdot \left(\sum_{q=1}^{K}{c_{mq}\mu_q}\right)\right\}\\ &=\sum_{j=1}^{K} \left(c_{lj}\mu_j \cdot 0\right)\\ &=0 \end{align} したがって、 \begin{align} E \left(Z_lZ_m\right)&=\frac{\sigma^2\sum_{j=1}^{K}{c_{lj}c_{mj}/n_j}}{\sigma^2\sqrt{ \left(\sum_{j=1}^{K}{c_{lj}^2/n_j}\right) \left(\sum_{j=1}^{K}{c_{mj}^2/n_j}\right)}}\\ &=\frac{\sum_{j=1}^{K}{c_{lj}c_{mj}/n_j}}{\sqrt{ \left(\sum_{j=1}^{K}{c_{lj}^2/n_j}\right) \left(\sum_{j=1}^{K}{c_{mj}^2/n_j}\right)}} \end{align} ゆえに、 \begin{align} \rho_{lm}=\frac{\sum_{j=1}^{K}{c_{lj}c_{mj}/n_j}}{\sqrt{ \left(\sum_{j=1}^{K}{c_{lj}^2/n_j}\right) \left(\sum_{j=1}^{K}{c_{mj}^2/n_j}\right)}} \end{align} $\blacksquare$

関連記事

参考文献

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

QooQ