本稿では、介入研究やクロスオーバー試験などにおける対応のある連続値データのデータ形式や基本統計量などについての定義をまとめています。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
- 曝露(発症)状況を表す右下の添え字は、「0」である場合($n_0,\pi_0$ など)や「2」である場合($n_2,\pi_2$ など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。
データの形式
対応のある連続値変数(例えば、処置前後の血圧値など)が正規分布 \begin{align} X \sim \mathrm{N} \left(\mu_1,\sigma_1^2\right) \quad Y \sim \mathrm{D_0} \left(\mu_0,\sigma_0^2\right) \end{align} に従い、 被験者数(サンプルサイズ)を \begin{gather} n \end{gather} 母集団分布からの互いに独立な無作為標本を \begin{align} \boldsymbol{X}= \left\{\begin{matrix}X_1,Y_1\\X_2,X_2\\\vdots\\X_n,Y_n\\\end{matrix}\right\} \end{align} とする。 測定値の前後差を \begin{gather} d_i=X_i-Y_i\\ \boldsymbol{d}= \left\{d_1,d_2, \cdots ,d_n\right\} \end{gather} とし、 測定値の前後差が互いに独立に正規分布 \begin{gather} d_i \sim \mathrm{N} \left(\mu_d,\sigma_d^2\right) \end{gather} に従うとする。
基本統計量
標本平均
\begin{gather} \bar{X}=\frac{1}{n}\sum_{i=1}^{n}X_i=\frac{1}{n} \left(X_1+X_2+ \cdots +X_n\right)\\ \bar{Y}=\frac{1}{n}\sum_{i=1}^{n}Y_i=\frac{1}{n} \left(Y_1+Y_2+ \cdots +Y_n\right)\\ \bar{d}=\frac{1}{n}\sum_{i=1}^{n}d_i=\frac{1}{n} \left(d_1+d_2+ \cdots +d_n\right) \end{gather}
標本分散・標本不偏分散
前後差の標本分散 \begin{gather} S^2=\frac{1}{n}\sum_{i=1}^{n} \left(d_i-\bar{d}\right)^2 \end{gather} 前後差の標本不偏分散 \begin{gather} {\hat{\sigma}}_d^2=s^2=\frac{1}{n-1}\sum_{i=1}^{n} \left(d_i-\bar{d}\right)^2 \end{gather}
前後差の平均
\begin{gather} \mu_d=\mu_1-\mu_0\\ {\hat{\mu}}_d=\bar{d} \end{gather}
参考文献
- 東京大学教養学部統計学教室 編. 基礎統計学 1 統計学入門. 東京大学出版会, 1991, p.175-186
0 件のコメント:
コメントを投稿