対応のない連続値データ

公開日: 更新日:

【2022年10月1週】 【A000】生物統計学 【A050】研究デザイン 【A080】診断医学研究

この記事をシェアする
  • B!
サムネイル画像

本稿では、介入研究などにおける対応のない連続値データのデータ形式や基本統計量などについての定義をまとめています。

なお、閲覧にあたっては、以下の点にご注意ください。

  • スマートフォンやタブレット端末でご覧の際、数式が見切れている場合は、横にスクロールすることができます。
  • 曝露(発症)状況を表す右下の添え字は、「0」である場合($n_0,\pi_0$ など)や「2」である場合($n_2,\pi_2$ など)がありますが、どちらも「非曝露群(コントロール群)」を表しています。

データの形式

曝露群と非曝露群に関する連続値変数が互いに独立に任意の分布 \begin{align} X \sim \mathrm{D_X} \left(\mu_X,\sigma_X^2\right) \quad Y \sim \mathrm{D_Y} \left(\mu_Y,\sigma_Y^2\right) \end{align} に従い、 各群のサンプルサイズを \begin{gather} n \left(=n_X\right) \quad m \left(=n_Y\right)\\ N=n+m \left(=n_X+n_Y\right) \end{gather} 母集団分布からの互いに独立な無作為標本を \begin{align} \boldsymbol{X}= \left\{X_1,X_2, \cdots ,X_n\right\} \quad \boldsymbol{Y}= \left\{Y_1,X_2, \cdots ,Y_m\right\} \end{align} とする。

基本統計量

標本平均

\begin{gather} \bar{X}=\frac{1}{n}\sum_{i=1}^{n}X_i=\frac{1}{n} \left(X_1+X_2+ \cdots +X_n\right)\\ \bar{Y}=\frac{1}{m}\sum_{j=1}^{m}Y_j=\frac{1}{m} \left(Y_1+Y_2+ \cdots +Y_m\right) \end{gather}

標本分散・標本不偏分散

標本分散 \begin{gather} S_X^2=\frac{1}{n}\sum_{i=1}^{n} \left(X_i-\bar{X}\right)^2\ \quad S_Y^2=\frac{1}{m}\sum_{j=1}^{m} \left(Y_j-\bar{Y}\right)^2 \end{gather} 標本不偏分散 \begin{gather} s_X^2=\frac{1}{n-1}\sum_{i=1}^{n} \left(X_i-\bar{X}\right)^2\ \quad s_Y^2=\frac{1}{m-1}\sum_{j=1}^{m} \left(Y_j-\bar{Y}\right)^2 \end{gather}

平均の差

\begin{gather} \delta=\mathrm{MD}=\mu_X-\mu_Y\\ \hat{\delta}=\mathrm{\widehat{MD}}=\bar{X}-\bar{Y} \end{gather}

検定仮説

帰無仮説

\begin{gather} H_0:\mu_X=\mu_Y \end{gather}

対立仮説

①両側仮説 \begin{gather} H_1:\mu_X \neq \mu_Y \end{gather} ②右側仮説 \begin{align} H_1:\mu_X \gt \mu_Y \end{align} ③左側仮説 \begin{align} H_1:\mu_X \lt \mu_Y \end{align}

参考文献

  • 東京大学教養学部統計学教室 編. 基礎統計学 1 統計学入門. 東京大学出版会, 1991, p.175-186

自己紹介

自分の写真

yama

大学時代に読書の面白さに気づいて以来、読書や勉強を通じて、興味をもったことや新しいことを学ぶことが生きる原動力。そんな人間が、その時々に学んだことを備忘録兼人生の軌跡として記録しているブログです。

このブログを検索

ブログ アーカイブ

QooQ