本稿では、介入研究などにおける対応のない連続値データのデータ形式や基本統計量などについての定義をまとめています。
なお、閲覧にあたっては、以下の点にご注意ください。
- スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
- 曝露(発症)状況を表す右下の添え字は、「0」である場合($n_0,\pi_0$ など)や「2」である場合($n_2,\pi_2$ など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。
データの形式
曝露群と非曝露群に関する連続値変数が互いに独立に任意の分布 \begin{align} X \sim \mathrm{D_X} \left(\mu_X,\sigma_X^2\right) \quad Y \sim \mathrm{D_Y} \left(\mu_Y,\sigma_Y^2\right) \end{align} に従い、 各群のサンプルサイズを \begin{gather} n \left(=n_X\right) \quad m \left(=n_Y\right)\\ N=n+m \left(=n_X+n_Y\right) \end{gather} 母集団分布からの互いに独立な無作為標本を \begin{align} \boldsymbol{X}= \left\{X_1,X_2, \cdots ,X_n\right\} \quad \boldsymbol{Y}= \left\{Y_1,X_2, \cdots ,Y_m\right\} \end{align} とする。基本統計量
標本平均
\begin{gather} \bar{X}=\frac{1}{n}\sum_{i=1}^{n}X_i=\frac{1}{n} \left(X_1+X_2+ \cdots +X_n\right)\\ \bar{Y}=\frac{1}{m}\sum_{j=1}^{m}Y_j=\frac{1}{m} \left(Y_1+Y_2+ \cdots +Y_m\right) \end{gather}
標本分散・標本不偏分散
標本分散 \begin{gather} S_X^2=\frac{1}{n}\sum_{i=1}^{n} \left(X_i-\bar{X}\right)^2\ \quad S_Y^2=\frac{1}{m}\sum_{j=1}^{m} \left(Y_j-\bar{Y}\right)^2 \end{gather} 標本不偏分散 \begin{gather} s_X^2=\frac{1}{n-1}\sum_{i=1}^{n} \left(X_i-\bar{X}\right)^2\ \quad s_Y^2=\frac{1}{m-1}\sum_{j=1}^{m} \left(Y_j-\bar{Y}\right)^2 \end{gather}
平均の差
\begin{gather} \delta=\mathrm{MD}=\mu_X-\mu_Y\\ \hat{\delta}=\mathrm{\widehat{MD}}=\bar{X}-\bar{Y} \end{gather}
検定仮説
帰無仮説
\begin{gather} H_0:\mu_X=\mu_Y \end{gather}
対立仮説
①両側仮説 \begin{gather} H_1:\mu_X \neq \mu_Y \end{gather} ②右側仮説 \begin{align} H_1:\mu_X \gt \mu_Y \end{align} ③左側仮説 \begin{align} H_1:\mu_X \lt \mu_Y \end{align}
参考文献
- 東京大学教養学部統計学教室 編. 基礎統計学 1 統計学入門. 東京大学出版会, 1991, p.175-186
0 件のコメント:
コメントを投稿