本稿は、ジョン・ラチン(2020)『医薬データのための統計解析』の「問題8.8」の自作解答例です。二値共変量に対するポアソン回帰モデルの最尤推定に関する問題です。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
- 曝露(発症)状況を表す右下の添え字は、「0」である場合($n_0,\pi_0$ など)や「2」である場合($n_2,\pi_2$ など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。
- 著作権の関係上、問題文は、掲載しておりません。上述の参考書をお持ちの方は、お手元にご用意してご覧ください。
- この解答例は、筆者が自作したものであり、公式なものではありません。あくまでも参考としてご覧いただければ幸いです。
問題8.8.1:帰無仮説のもとでの最尤推定量
〔1〕対立仮説
曝露群・非曝露群の強度はそれぞれ、
\begin{align}
\log{ \left\{\lambda \left(x_i\right)\right\}}&=\alpha+1 \cdot \beta\\
&=\alpha+\beta\\
\lambda_1&=e^{\alpha+\beta}\\
\log{ \left\{\lambda \left(x_i\right)\right\}}&=\alpha+0 \cdot \beta\\
&=\alpha\\
\lambda_2&=e^\alpha
\end{align}
尤度関数は、
\begin{align}
L \left(\boldsymbol{\theta}\right)=\prod_{i=1}^{N}\frac{ \left\{\lambda \left(x_i\right)t_i\right\}^{d_i} \cdot e^{-\lambda \left(x_i\right)t_i}}{d_i!}
\end{align}
対数尤度関数は、
\begin{align}
l \left(\boldsymbol{\theta}\right)&=\sum_{i=1}^{N} \left[d_i\log{ \left\{\lambda \left(x_i\right) \cdot t_i\right\}}-\log{ \left(d_i!\right)}-\lambda \left(x_i\right)t_i\right]\\
l \left(\alpha,\beta\right)&=\sum_{i=1}^{N} \left[d_i \left\{\alpha+x_i\beta+\log{t_i}\right\}-\log{ \left(d_i!\right)}-t_i \cdot e^{\alpha+x_i\beta}\right]\\
&=\sum_{i=1}^{N} \left[\alpha d_i+d_ix_i\beta-d_i\log{ \left(d_i!\right)}-t_i \cdot e^{\alpha+x_i\beta}\right]
\end{align}
パラメータ $\alpha$ のスコア関数 $U_\alpha \left(\boldsymbol{\theta}\right)=\frac{\partial}{\partial\alpha}l \left(\boldsymbol{\theta}\right)$ は、
\begin{align}
U_\alpha \left(\boldsymbol{\theta}\right)=\sum_{i=1}^{N}d_i-\sum_{i=1}^{N}{t_i \cdot e^{\alpha+x_i\beta}}
\end{align}
パラメータ $\beta$ のスコア関数は、$U_\beta \left(\boldsymbol{\theta}\right)=\frac{\partial}{\partial\beta}l \left(\boldsymbol{\theta}\right)$ は、
\begin{align}
U_\beta \left(\boldsymbol{\theta}\right)=\sum_{i=1}^{N}{x_i \left(d_i-e^{\alpha+x_i\beta} \cdot t_i\right)}
\end{align}
尤度方程式は、
\begin{gather}
\sum_{i=1}^{N}d_i-\sum_{i=1}^{N}{t_i \cdot e^{\alpha+x_i\beta}}=0\tag{1}\\
\sum_{i=1}^{N}{x_i \left(d_i-e^{\alpha+x_i\beta} \cdot t_i\right)}=0\tag{2}
\end{gather}
式 $(1)$ より、
\begin{align}
d_{\bullet }&=\sum_{i=1}^{N}{t_i \cdot e^{\alpha+x_i\beta}}\\
&=\sum_{i=1}^{n_1}{t_i \cdot e^{\alpha+\beta}}+\sum_{j=1}^{n_2}{e^\alpha \cdot t_j}\\
&=e^{\alpha+\beta} \cdot t_{1\bullet }+e^\alpha \cdot t_{2\bullet }\tag{3}
\end{align}
式 $(2)$ より、
\begin{gather}
\sum_{i=1}^{n_1}{1 \cdot \left(d_i-e^{\alpha+\beta} \cdot t_i\right)}+\sum_{j=1}^{n_2}{0 \cdot \left(d_j-e^\alpha \cdot t_j\right)}=0\\
\sum_{i=1}^{n_1}d_i-e^{\alpha+\beta}\sum_{i=1}^{N}t_i=0\\
e^{\alpha+\beta} \cdot t_{1\bullet }=d_{1\bullet }\tag{4}
\end{gather}
式 $(3),(4)$ より、各群のハザードの最尤推定量は、
\begin{gather}
{\hat{\lambda}}_1=e^{\hat{\alpha}+\hat{\beta}}=\frac{d_{1\bullet }}{t_{1\bullet }}\\
{\hat{\lambda}}_2=e^{\hat{\alpha}}=\frac{d_{2\bullet }}{t_{2\bullet }}
\end{gather}
〔2〕帰無仮説
帰無仮説 $H_0:\beta=\beta_0=0$ のもとでのパラメータ $\alpha_0$ の最尤推定量は、
\begin{gather}
U_\alpha \left(\boldsymbol{\theta}_\boldsymbol{0}\right)=\sum_{i=1}^{N}d_i-\sum_{i=1}^{N}{t_i \cdot e^{\hat{\alpha}}}=0\\
e^{\hat{\alpha}}=\frac{d_{\bullet }}{t_{\bullet }}
\end{gather}
帰無仮説のもとでのパラメータ $\beta_0$ のスコア関数は、
\begin{align}
U_\beta \left({\hat{\boldsymbol{\theta}}}_\boldsymbol{0}\right)&=\sum_{i=1}^{N}{x_i \left(d_i-e^{\hat{\alpha}} \cdot t_i\right)}\\
&=\sum_{i=1}^{n_1}{1 \cdot \left(d_i-e^{\hat{\alpha}} \cdot t_i\right)}-\sum_{j=1}^{n_2}{0 \cdot \left(d_i-e^{\hat{\alpha}} \cdot t_i\right)}\\
&=\sum_{i=1}^{n_1}d_i-e^{\hat{\alpha}}\sum_{i=1}^{n_1}t_i\\
&=d_{1\bullet }-\frac{d_{\bullet } \cdot t_{1\bullet }}{t_{\bullet }}\\
&=\frac{ \left(t_{1\bullet }+t_{2\bullet }\right) \cdot d_{1\bullet }}{t_{\bullet }}-\frac{t_{1\bullet } \left(d_{1\bullet }+d_{2\bullet }\right)}{t_{\bullet }}\\
&=\frac{t_{2\bullet } \cdot d_{1\bullet }-t_{1\bullet } \cdot d_{2\bullet }}{t_{\bullet }}\\
\end{align}
$\blacksquare$
問題8.8.2:帰無仮説のもとでの期待情報量
このとき、期待情報行列の各成分の推定量は、 \begin{align} I_\alpha \left({\hat{\boldsymbol{\theta}}}_\boldsymbol{0}\right)&=\sum_{i=1}^{N}{t_i \cdot e^{\hat{\alpha}+x_i\beta_0}}\\ &=\sum_{i=1}^{N}{t_i \cdot e^{\hat{\alpha}}}\\ &=t_{\bullet } \cdot \frac{d_{\bullet }}{t_{\bullet }}\\ &=d_{\bullet } \end{align} \begin{align} I_\beta \left({\hat{\boldsymbol{\theta}}}_\boldsymbol{0}\right)&=\sum_{i=1}^{N}{x_i^2t_i \cdot e^{\hat{\alpha}+x_i\beta_0}}\\ &=\sum_{i=1}^{N}{x_i^2t_i \cdot e^{\hat{\alpha}}}\\ &=\frac{d_{\bullet }}{t_{\bullet }} \left(\sum_{i=1}^{n_1}{1 \cdot t_i}+\sum_{j=1}^{n_2}{0 \cdot t_j}\right)\\ &=\frac{t_{1\bullet } \cdot d_{\bullet }}{t_{\bullet }} \end{align} \begin{align} I_{\alpha\beta} \left({\hat{\boldsymbol{\theta}}}_\boldsymbol{0}\right)&=\sum_{i=1}^{N}{x_it_i \cdot e^{\hat{\alpha}+x_i\beta_0}}\\ &=\sum_{i=1}^{N}{x_it_i \cdot e^{\hat{\alpha}}}\\ &=\frac{d_{\bullet }}{t_{\bullet }} \left(\sum_{i=1}^{n_1}{1 \cdot t_i}+\sum_{j=1}^{n_2}{0 \cdot t_j}\right)\\ &=\frac{t_{1\bullet } \cdot d_{\bullet }}{t_{\bullet }} \end{align} したがって、 \begin{align} I \left({\hat{\boldsymbol{\theta}}}_\boldsymbol{0}\right)= \left[\begin{matrix}d_{\bullet }&\frac{t_{1\bullet } \cdot d_{\bullet }}{t_{\bullet }}\\\frac{t_{1\bullet } \cdot d_{\bullet }}{t_{\bullet }}&\frac{t_{1\bullet } \cdot d_{\bullet }}{t_{\bullet }}\\\end{matrix}\right]\\ \end{align} \begin{align} \left|I \left({\hat{\boldsymbol{\theta}}}_\boldsymbol{0}\right)\right|&=d_{\bullet } \cdot \frac{t_{1\bullet } \cdot d_{\bullet }}{t_{\bullet }}-\frac{t_{1\bullet } \cdot d_{\bullet }}{t_{\bullet }} \cdot \frac{t_{1\bullet } \cdot d_{\bullet }}{t_{\bullet }}\\ &=\frac{t_{1\bullet } \cdot d_{\bullet }^2}{t_{\bullet }} \left(1-\frac{t_{1\bullet }}{t_{\bullet }}\right)\\ &=\frac{t_{1\bullet } \cdot t_{2\bullet } \cdot d_{\bullet }^2}{t_{\bullet }^2} \end{align} \begin{align} I \left({\hat{\boldsymbol{\theta}}}_\boldsymbol{0}\right)^{-1}=\frac{t_{\bullet }^2}{t_{1\bullet } \cdot t_{2\bullet } \cdot d_{\bullet }^2} \left[\begin{matrix}\frac{t_{1\bullet } \cdot d_{\bullet }}{t_{\bullet }}&-\frac{t_{1\bullet } \cdot d_{\bullet }}{t_{\bullet }}\\-\frac{t_{1\bullet } \cdot d_{\bullet }}{t_{\bullet }}&d_{\bullet }\\\end{matrix}\right] \end{align} $\blacksquare$
問題8.8.3:有効スコア検定
有効スコア検定の検定統計量は、 \begin{align} U \left({\hat{\boldsymbol{\theta}}}_\boldsymbol{0}\right)= \left[\begin{matrix}0&U_\beta \left({\hat{\boldsymbol{\theta}}}_\boldsymbol{0}\right)\\\end{matrix}\right] \end{align} として、 \begin{align} \chi^2&=U \left({\hat{\boldsymbol{\theta}}}_\boldsymbol{0}\right)^TI \left({\hat{\boldsymbol{\theta}}}_\boldsymbol{0}\right)^{-1}U \left({\hat{\boldsymbol{\theta}}}_\boldsymbol{0}\right)\\ &=\frac{t_{2\bullet } \cdot d_{1\bullet }-t_{1\bullet } \cdot d_{2\bullet }}{t_{\bullet }} \cdot \frac{t_{\bullet }^2}{t_{1\bullet } \cdot t_{2\bullet } \cdot d_{\bullet }} \cdot \frac{t_{2\bullet } \cdot d_{1\bullet }-t_{1\bullet } \cdot d_{2\bullet }}{t_{\bullet }}\\ &=\frac{ \left(d_{1\bullet }t_{2\bullet }-d_{2\bullet }t_{1\bullet }\right)^2}{t_{1\bullet }t_{2\bullet }d_{\bullet }} \end{align} また、 \begin{align} {\hat{\lambda}}_1=\frac{d_{1\bullet }}{t_{1\bullet }} \quad {\hat{\lambda}}_2=\frac{d_{2\bullet }}{t_{2\bullet }}\\ \end{align} \begin{align} {\hat{\lambda}}_1-{\hat{\lambda}}_2&=\frac{d_{1\bullet }}{t_{1\bullet }}-\frac{d_{2\bullet }}{t_{2\bullet }}\\ &=\frac{d_{1\bullet }t_{2\bullet }-d_{2\bullet }t_{1\bullet }}{t_{1\bullet }t_{2\bullet }} \end{align} したがって、 \begin{align} Z&=\frac{\sqrt{t_{1\bullet }t_{2\bullet }}}{\sqrt{d_{1\bullet }+d_{2\bullet }}}\frac{d_{1\bullet }t_{2\bullet }-d_{2\bullet }t_{1\bullet }}{t_{1\bullet }t_{2\bullet }}\\ &=\frac{d_{1\bullet }t_{2\bullet }-d_{2\bullet }t_{1\bullet }}{\sqrt{t_{1\bullet }t_{2\bullet }d_{\bullet }}} Z^2=\frac{ \left(d_{1\bullet }t_{2\bullet }-d_{2\bullet }t_{1\bullet }\right)^2}{t_{1\bullet }t_{2\bullet }d_{\bullet }} \end{align} したがって、 \begin{align} \chi^2=Z^2 \end{align} $\blacksquare$
参考文献
- ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.456
- ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.424-425
- ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.611-612
0 件のコメント:
コメントを投稿