本稿は、ジョン・ラチン(2020)『医薬データのための統計解析』の「問題6.5」の自作解答例です。条件付き超幾何尤度にもとづく共通オッズ比のロジスティック回帰モデルの適用についての問題です。特に、回帰係数に関する有効スコア検定と層別解析におけるマンテル・ヘンツェル検定の同等性は非常に重要です。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
- 曝露(発症)状況を表す右下の添え字は、「0」である場合($n_0,\pi_0$ など)や「2」である場合($n_2,\pi_2$ など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。
- 漸近的な性質を用いる際は、①中心極限定理が成り立つ、②漸近分散を推定する際に、母数をその一致推定量で置き換えることができるということが成り立つと仮定しています。
- 著作権の関係上、問題文は、掲載しておりません。上述の参考書をお持ちの方は、お手元にご用意してご覧ください。
- この解答例は、筆者が自作したものであり、公式なものではありません。あくまでも参考としてご覧いただければ幸いです。
問題6.5.1:スコア方程式と期待情報量
周辺度数が固定されているという条件のもとで、第 $k$ 層目の条件付き超幾何尤度は、 \begin{align} L \left(\varphi\right)=\frac{{}_{n_{1k}}C_{a_k} \cdot {}_{n_{2k}}C_{m_{1k}-a_k} \cdot \varphi_k^{a_k}}{\sum_{i=a_{lk}}^{a_{uk}}{{}_{n_{1k}}C_i \cdot {}_{n_{2k}}C_{m_{1k}-i} \cdot \varphi_k^i}} \end{align} $\beta_k=\log{\varphi_k}$ より、対数尤度 $l \left(\theta\right)=\log{L \left(\theta\right)}$ は、 \begin{align} l \left(\varphi\right)&=\log{ \left({}_{n_{1k}}C_{a_k} \cdot {}_{n_{2k}}C_{m_{1k}-a_k} \cdot \varphi_k^{a_k}\right)}-\log{ \left(\sum_{i=a_{lk}}^{a_{uk}}{{}_{n_{1k}}C_i \cdot {}_{n_{2k}}C_{m_{1k}-i} \cdot \varphi_k^i}\right)}\\ &=\log{{}_{n_{1k}}C_{a_k}}+\log{{}_{n_{2k}}C_{m_{1k}-a_k}}+a_k\log{\varphi_k}-\log{ \left(\sum_{i=a_{lk}}^{a_{uk}}{{}_{n_{1k}}C_i \cdot {}_{n_{2k}}C_{m_{1k}-i} \cdot \varphi_k^i}\right)}\\ l \left(\beta_k\right)&=a_k\beta_k-\log{ \left(\sum_{i=a_{lk}}^{a_{uk}}{{}_{n_{1k}}C_i \cdot {}_{n_{2k}}C_{m_{1k}-i} \cdot \varphi_k^i}\right)}+C \end{align} スコア関数 $U \left(\theta\right)=\frac{\partial}{\partial\theta}l \left(\theta\right)$ は、この対数尤度関数を $\beta_k$ で偏微分して、 \begin{align} U \left(\beta_k\right)&=a_k-\frac{\sum_{i=a_{lk}}^{a_{uk}}{{}_{n_{1k}}C_i \cdot {}_{n_{2k}}C_{m_{1k}-i} \cdot i e^{i\beta_k}}}{\sum_{i=a_{lk}}^{a_{uk}}{{}_{n_{1k}}C_i \cdot {}_{n_{2k}}C_{m_{1k}-i} \cdot e^{i\beta_k}}}\\ &=a_k-E \left(a_k\middle|\beta_k\right) \end{align} 観測情報量 $i \left(\beta_k\right)=-\frac{\partial^2}{\partial\beta^2}l \left(\beta_k\right)$ は、 \begin{align} i \left(\beta_k\right)&=\frac{ \left[\sum_{i=a_{lk}}^{a_{uk}}{{}_{n_{1k}}C_i \cdot {}_{n_{2k}}C_{m_{1k}-i} \cdot e^{i\beta_k}}\right] \left[\sum_{i=a_{lk}}^{a_{uk}}{{}_{n_{1k}}C_i \cdot {}_{n_{2k}}C_{m_{1k}-i} \cdot i^2e^{i\beta_k}}\right]- \left[\sum_{i=a_{lk}}^{a_{uk}}{{}_{n_{1k}}C_i \cdot {}_{n_{2k}}C_{m_{1k}-i} \cdot i e^{i\beta_k}}\right]^2}{ \left[\sum_{i=a_{lk}}^{a_{uk}}{{}_{n_{1k}}C_i \cdot {}_{n_{2k}}C_{m_{1k}-i} \cdot e^{i\beta_k}}\right]^2}\\ &=\frac{\sum_{i=a_{lk}}^{a_{uk}}{{}_{n_{1k}}C_i \cdot {}_{n_{2k}}C_{m_{1k}-i} \cdot i^2e^{i\beta_k}}}{\sum_{i=a_{lk}}^{a_{uk}}{{}_{n_{1k}}C_i \cdot {}_{n_{2k}}C_{m_{1k}-i} \cdot e^{i\beta_k}}}- \left[\frac{\sum_{i=a_{lk}}^{a_{uk}}{{}_{n_{1k}}C_i \cdot {}_{n_{2k}}C_{m_{1k}-i} \cdot i e^{i\beta_k}}}{\sum_{i=a_{lk}}^{a_{uk}}{{}_{n_{1k}}C_i \cdot {}_{n_{2k}}C_{m_{1k}-i} \cdot e^{i\beta_k}}}\right]^2 \end{align} ここで、以下が成り立つので、 \begin{gather} E \left(a_k^2\middle|\beta_k\right)=\frac{\sum_{i=a_{lk}}^{a_{uk}}{{}_{n_{1k}}C_i \cdot {}_{n_{2k}}C_{m_{1k}-i}i^2e^{i\beta_k}}}{\sum_{i=a_{lk}}^{a_{uk}}{{}_{n_{1k}}C_i \cdot {}_{n_{2k}}C_{m_{1k}-i}e^{i\beta_k}}}\\ \left\{E \left(a_k\middle|\beta_k\right)\right\}^2= \left[\frac{\sum_{i=a_{lk}}^{a_{uk}}{{}_{n_{1k}}C_i \cdot {}_{n_{2k}}C_{m_{1k}-i}ie^{i\beta_k}}}{\sum_{i=a_{lk}}^{a_{uk}}{{}_{n_{1k}}C_i \cdot {}_{n_{2k}}C_{m_{1k}-i}e^{i\beta_k}}}\right]^2 \end{gather} 観測情報量および期待情報量は \begin{align} i \left(\beta_k\right)=I \left(\beta_k\right)=E \left(a_k^2\middle|\beta_k\right)- \left\{E \left(a_k\middle|\beta_k\right)\right\}^2=V \left(a_k\middle|\beta_k\right) \end{align} $\blacksquare$
問題6.5.2:帰無仮説のもとでのスコア方程式と期待情報量
ここで、全層を通じた共通オッズ比 $H:\beta_1= \cdots =\beta_K=\beta$ が存在するという仮定もと、各層の尤度は、1つのパラメータ $\varphi=e^\beta$ のみを含むので、各層が得られる尤度が統計的に独立であるとき、全体としての尤度関数は、$K$ 個の各層における超幾何尤度の積 \begin{align} L \left(\beta\right)=\prod_{i=1}^{K}L \left(\beta_k\right)=\prod_{i=1}^{K}{P \left(a_k\middle| n_{1k},m_{1k},N_k,\beta_k\right)} \end{align} となる。 したがって、対数の性質 $\log{\prod_{i=1}^{K}f \left(x_k\right)}=\sum_{k=1}^{K}\log{f \left(x_k\right)}$ から、総スコア関数は、 \begin{align} U \left(\beta\right)&=\sum_{i=1}^{K}U \left(\beta_k\right)\\ &=\sum_{k=1}^{K} \left[a_k-\frac{\sum_{i=a_l}^{a_u}{{}_{n_{1k}}C_i \cdot {}_{n_{2k}}C_{m_{1k}-i} \cdot i e^{i\beta}}}{\sum_{i=a_l}^{a_u}{{}_{n_{1k}}C_i \cdot {}_{n_{2k}}C_{m_{1k}-i} \cdot e^{i\beta}}}\right]\\ &=\sum_{k=1}^{K} \left[a_k-E \left(a_k\middle|\beta\right)\right] \end{align} 同様に、総観測情報量および総期待情報量は \begin{align} i \left(\beta\right)&=I \left(\beta\right)\\ &=\sum_{i=1}^{K}i \left(\beta_k\right)\\ &=\sum_{k=1}^{K} \left[\frac{\sum_{i=a_{lk}}^{a_{uk}}{{}_{n_{1k}}C_i \cdot {}_{n_{2k}}C_{m_{1k}-i} \cdot i^2e^{i\beta_k}}}{\sum_{i=a_{lk}}^{a_{uk}}{{}_{n_{1k}}C_i \cdot {}_{n_{2k}}C_{m_{1k}-i} \cdot e^{i\beta_k}}}- \left(\frac{\sum_{i=a_{lk}}^{a_{uk}}{{}_{n_{1k}}C_i \cdot {}_{n_{2k}}C_{m_{1k}-i} \cdot i e^{i\beta_k}}}{\sum_{i=a_{lk}}^{a_{uk}}{{}_{n_{1k}}C_i \cdot {}_{n_{2k}}C_{m_{1k}-i} \cdot e^{i\beta_k}}}\right)^2\right]\\ &=\sum_{k=1}^{K} \left[E \left(a_k^2\middle|\beta\right)- \left\{E \left(a_k\middle|\beta\right)\right\}^2\right]\\ &=\sum_{k=1}^{K}{V \left(a_k\middle|\beta\right)} \end{align} $\blacksquare$
問題6.5.3:有効スコア検定
これは、帰無仮説 $H_0:\beta=\beta_0=0$ のもとでは、 \begin{align} U \left(\beta_0\right)&=\sum_{k=1}^{K} \left[a_k-\frac{\sum_{i=a_l}^{a_u}{{}_{n_{1k}}C_i \cdot {}_{n_{2k}}C_{m_{1k}-i} \cdot i}}{\sum_{i=a_l}^{a_u}{{}_{n_{1k}}C_i \cdot {}_{n_{2k}}C_{m_{1k}-i}}}\right]\\ &=\sum_{k=1}^{K} \left[a_k-E \left(a_k\middle|\beta_0\right)\right] \end{align} \begin{align} i \left(\beta\right)&=I \left(\beta\right)\\ &=\sum_{k=1}^{K} \left[E \left(a_k^2\middle|\beta_0\right)- \left\{E \left(a_k\middle|\beta_0\right)\right\}^2\right]\\ &=\sum_{k=1}^{K}{V \left(a_k\middle|\beta_0\right)} \end{align} 有効スコア検定の検定統計量 $\chi^2=\frac{ \left\{U \left(\beta_0\right)\right\}^2}{I \left(\beta_0\right)}$ は、 \begin{align} \chi_S^2=\frac{ \left[\sum_{k=1}^{K} \left[a_k-E \left(a_k\middle|\beta_0\right)\right]\right]^2}{\sum_{k=1}^{K}{V \left(a_k\middle|\beta_0\right)}} \end{align} これは、層別化 $2\times2$ 表に対するマンテル・ヘンツェル検定と等しい。 $\blacksquare$
問題6.5.4:共通対数オッズ比の層調整済み推定量
また、共通対数オッズ比のスコアにもとづく層調整済み推定値は、スコアにもとづく推定値の公式 ${\hat{\theta}}_0=\frac{U \left(\theta_0\right)}{I \left(\theta_0\right)}$ より、 \begin{align} \hat{\beta}&=\frac{\sum_{k=1}^{K} \left[a_k-E \left(a_k\middle|\beta_0\right)\right]}{\sum_{k=1}^{K}{V \left(a_k\middle|\beta_0\right)}}\\ &=\frac{\sum_{k=1}^{K} \left[a_k-\frac{m_{1k}n_{1k}}{N_k}\right]}{\sum_{k=1}^{K} \left[\frac{m_{1k}m_{2k}n_{1k}n_{2k}}{N_k^2 \left(N_k-1\right)}\right]} \end{align} また、スコアにもとづく推定値の分散の公式 $V \left({\hat{\theta}}_0\right)=\frac{1}{I \left(\theta_0\right)}$ より、 \begin{align} V \left(\hat{\beta}\right)&=\frac{1}{\sum_{k=1}^{K}{V \left(a_k\middle|\beta_0\right)}}\\ &=\frac{1}{\sum_{k=1}^{K} \left[\frac{m_{1k}m_{2k}n_{1k}n_{2k}}{N_k^2 \left(N_k-1\right)}\right]} \end{align} $\blacksquare$
参考文献
- ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.298-299
- ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.279-280
0 件のコメント:
コメントを投稿