ジョン・ラチン(2020)『医薬データのための統計解析』 問題2.5 解答例

公開日:

【2022年10月2週】 【A000】生物統計学 【A051】コホート研究

この記事をシェアする
  • B!
サムネイル画像

本稿は、ジョン・ラチン(2020)『医薬データのための統計解析』の「問題2.5」の自作解答例です。リスク差・対数相対リスク・対数オッズ比の漸近的性質に関する問題です。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
  • 曝露(発症)状況を表す右下の添え字は、「0」である場合(n0,π0 など)や「2」である場合(n2,π2 など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。
  • 漸近的な性質を用いる際は、①中心極限定理が成り立つ、②漸近分散を推定する際に、母数をその一致推定量で置き換えることができるということが成り立つと仮定しています。
  • デルタ法を用いる際、剰余項(2次の項)が漸近的に無視できる(0に確率収束する)と仮定しています。
  • 上述の参考書では、標準正規分布の上側 100α% 点を Z1α と表記していますが、本サイトでは、Zα としています。そのため、参考書に載っている式の形式と異なる部分があります。
  • 著作権の関係上、問題文は、掲載しておりません。上述の参考書をお持ちの方は、お手元にご用意してご覧ください。
  • この解答例は、筆者が自作したものであり、公式なものではありません。あくまでも参考としてご覧いただければ幸いです。

問題2.5.1:曝露効果の指標の漸近分布(対立仮説)

二項分布の正規近似により、標本比率は漸近的に p1N[π1,π1(1π1)n1]p2N[π2,π2(1π2)n2]

リスク差

標本リスク差を RD^=p1p2 とすると、正規分布の再生性より、 RD^N{π1π2,π1(1π1)n1+π2(1π2)n2} 母比率を一致推定量である標本比率で置き換えると、漸近分散の一致推定量は、 σ^12=p1(1p1)n1+p2(1p2)n2

対数リスク比

まず、 g(πi)=logπig(pi)=logpi と変数変換する。 デルタ法を用いて、g(pi) を期待値 E(pi)=πi まわりでテイラー展開すると、g(pi) の1階微分は、 g(pi)=1pi よって、デルタ法における期待値と分散の公式より、 E{g(pi)}E[g(πi)]=logπi V[g(pi)]{g(πi)}2V(pi)=1πi2πi(1πi)ni=1πiniπi スラツキーの定理より、 logpidN[logπi,1πiniπi] このとき、標本対数リスク比は、 logRR^=logp1p2=logp1logp2 したがって、正規分布の再生性より、 logRR^dN[logπ1logπ2,1π1n1π1+1π2n2π2]

対数オッズ比

まず、 g(πi)=logπi1πig(pi)=logpi1pi と変数変換する。 デルタ法を用いて、g(pi) を期待値 E(pi)=πi まわりでテイラー展開すると、g(pi) の1階微分は、 g(pi)=1pipiddpi(pi1pi)=1pipi(1pi)1(1pi)2=1pi(1pi) よって、デルタ法における期待値と分散の公式より、 E{g(pi)}E[g(πi)]=logπi1πi V[g(pi)]{g(πi)}2V(pi)=1πi2(1πi)2πi(1πi)ni=1niπi(1πi) スラツキーの定理より、 logpidN[logπi1πi,1niπi(1πi)] このとき、標本対数オッズ比は、 logOR^=logp11p1logp21p2 したがって、正規分布の再生性より、 logOR^dN[logπ11π1logπ21π2,1n1π1(1π1)+1n2π2(1π2)]

問題2.5.2:対数リスク比の漸近分散の一致推定量

母比率を一致推定量である標本比率で置き換えると、期待値と分散の一致推定量は、 E^[logRR^]=logp1logp2V^(logRR^)=1p1n1p1+1p2n2p2 分散についてさらに式を整理すると、a=n1p1,b=n2p2 より、 σ^12=1p1a+1p2b=1ap1a+1bp2b=1a1n1+1b1n2

問題2.5.3:対数オッズ比の漸近分散の一致推定量

母比率を一致推定量である標本比率で置き換えると、期待値と分散の一致推定量は、 E^[logOR^]=logp11p1logp21p2V^(logOR^)=1n1p1(1p1)+1n2p2(1p2) 分散についての式を部分分数分解すると、 σ^12=1n1p1+1n1(1p1)+1n2p2+1n2(1p2) ここで、各セルの値について、 a=n1p1c=n1(1p1)b=n2p2d=n2(1p2) したがって、 σ^12=1a+1b+1c+1d

問題2.5.4:リスク比・オッズ比の漸近分散

リスク比

二項分布の正規近似により、標本比率は漸近的に p1N[π1,π1(1π1)n1]p2N[π2,π2(1π2)n2] 標本比率ベクトルを p=(p1p2) 期待値ベクトルを π=(π1π2) 分散・共分散行列を Ω=[π1(1π1)n100π2(1π2)n2] として、 G(π)=RR=π1π2G(p)=RR^=p1p2 と変数変換する。 多変量のデルタ法を用いて G(p) を期待値 E(p)=π まわりでテイラー展開すると、偏導関数ベクトルは、 H(π)=(G(π)π1G(π)π2)=[1π2π1π22] 多変量のデルタ法の期待値と分散の公式より、 E[G(p)]G(π)=π1π2 V[G(p)]=[1π2π1π22][π1(1π1)n100π2(1π2)n2][1π2π1π22]=[1π2π1π22][π1(1π1)n1π2π1(1π2)n2π2]=1π2π1(1π1)n1π2+π1π22π1(1π2)n2π2=π1(1π1)n1π22+π12(1π2)n2π23 いっぽう、 RR2V(logRR^)=π12π22(1π1n1π1+1π2n2π2)=π1(1π1)n1π22+π12(1π2)n2π23 したがって、漸近的に V(RR^)RR2V(logRR^)

オッズ比

二項分布の正規近似により、標本比率は漸近的に p1N[π1,π1(1π1)n1]p2N[π2,π2(1π2)n2] 標本比率ベクトルを p=(p1p2) 期待値ベクトルを π=(π1π2) 分散・共分散行列を Ω=[π1(1π1)n100π2(1π2)n2] として、 G(π)=OR=π11π11π2π2G(p)=OR^=p11p11p2p2 と変数変換する。 多変量のデルタ法を用いて G(p) を期待値 E(p)=π まわりでテイラー展開すると、偏導関数ベクトルは、 H(π)=(G(π)π1G(π)π2)=[1π2π2(1π1)2π1π22(1π1)] 多変量のデルタ法の期待値と分散の公式より、 E[G(p)]G(π)=π11π11π2π2 V[G(p)]=[1π2π2(1π1)2π1π22(1π1)][π1(1π1)n100π2(1π2)n2][1π2π2(1π1)2π1π22(1π1)]=[1π2π2(1π1)2π1π22(1π1)][π1(1π2)n1π2(1π1)π1(1π2)n2π2(1π1)]=1π2π2(1π1)2π1(1π2)n1π2(1π1)+π1π22(1π1)π1(1π2)n2π2(1π1)=π1(1π2)2n1π22(1π1)3+π12(1π2)n2π23(1π1)2 いっぽう、 OR2V(logOR^)=π12(1π1)2(1π2)2π22[1n1π1(1π1)+1n2π2(1π2)]=π1(1π2)2n1π22(1π1)3+π12(1π2)n2π23(1π1)2 したがって、漸近的に V(OR^)OR2V(logOR^)

上述の参考書の問題文(p.81)では、 (2.164)V(OR^)OR2V(logRR^) となっていますが、 これは、おそらく誤植だと思われます。

問題2.5.5:曝露効果の指標の漸近分布(帰無仮説)

リスク差

π1=π2=π を代入すると、帰無仮説のもとで、 RD^|H0dN[0,π(1π)(1n1+1n2)] 共通の母比率 π の一致推定量は、 π^=a+bn1+n2=m1N これを用いて、母比率を一致推定量である標本比率で置き換えると、漸近分散の一致推定量は、 σ^02=m1Nm2Nn1+n2n1n2=m1Nm2NNn1n2=m1m2Nn1n2

対数リスク比

帰無仮説 H0:π1=π2(=π) のもとでは、 logRR^dN[0,1ππ(1n1+1n2)] 共通の母比率 π の一致推定量は、 π^=a+bn1+n2=m1N これを用いて、母比率を一致推定量である標本比率で置き換えると、漸近分散の一致推定量は、 σ^02=1π^(1π^)(1n1+1n2)=Nm1Nm2Nn1n2=N3m1m2n1n2

対数オッズ比

帰無仮説 H0:π1=π2(=π) のもとでは、 logOR^dN[0,1π(1π)(1n1+1n2)] 共通の母比率 π の一致推定量は、 π^=a+bn1+n2=m1N これを用いて、母比率を一致推定量である標本比率で置き換えると、漸近分散の一致推定量は、 σ^02=1π^π^Nn1n2=Nm1m2NNn1n2=m2m1Nn1n2

問題2.5.6:リスク比の定義による影響(分散)

対数の性質より、 logRR^2:1=logp2logp1logRR^1:2=logp1logp2 したがって、 logRR^2:1=logRR^1:2 しかし、分散の性質より、 V(logRR^2:1)=V(logp2)+V(logp1)V(logRR^1:2)=V(logp1)+V(logp2) したがって、 V(logRR^2:1)=V(logRR^1:2)

問題2.5.7:リスク比の定義による影響(信頼区間)

ここで、 θ^=logRR^2:1=logRR^1:2σ^2=V(logRR^2:1)=V(logRR^1:2) とすると、 対数リスク比の信頼区間は、θ^LlogRRθ^U なので、
(i)logRR^2:1 の上下信頼限界 θ^L21=logRR^2:1Z0.5ασ^=θ^Z0.5ασ^ θ^U21=logRR^2:1+Z0.5ασ^θ^U21=θ^+Z0.5ασ^ (ii)logRR^1:2 の上下信頼限界 θ^L12=logRR^1:2Z0.5ασ^=θ^Z0.5ασ^=(θ^+Z0.5ασ^)=θ^U21 θ^U12=logRR^1:2+Z10.5ασ^=θ^+Z10.5ασ^=(θ^Z0.5ασ^)=θ^L21 また、exp(θ^L)RRexp(θ^U) より、 exp(θ^L21)=exp(θ^U12)=1exp(θ^U12)exp(θ^U21)=exp(θ^L12)=1exp(θ^L12)

参考文献

  • ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.80-82
  • ジョン・ラチン 著, 宮岡 悦良 監訳, 遠藤 輝, 黒沢 健, 下川 朝有, 寒水 孝司 訳. 医薬データのための統計解析. 共立出版, 2020, p.23-28
  • Woolf, B.. On estimating the relation between blood group and disease. Annals of human genetics. 1955;19(4):251-253, doi: https://doi.org/10.1111/j.1469-1809.1955.tb01348.x

関連記事

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ