医療統計

正規分布の評価方法

先に申し上げておきますが、その判断は結構主観的です。統計といったら数字で全て説明できそうですが、意外に個々の主観が入ってきます。大事なのは、正規分布か否かを判断したその手順をしっかり説明できることだと思います。

1) ヒストグラム

Rのggplot2というパッケージは、data visualizationにおける最高のツールの一つです。もしRを使うなら、是非とも使えるようになりたいパッケージです。ggplot()+geom_histogram()を使うことでヒストグラムを描くことができます。datというdata frameのBMIというcolumn(連続変数)のヒストグラムを描いてみましょう。

これがbell-shapeかどうかです。どうですか?Bell-shapeにみえますか?

2) Skewnessとkurtosis

2)は、連続変数の評価:skewnessやkurtosistとは?で説明しました。

ちなみに、このサンプル群においてskewnessは0.98、kurtosisは2.6です。

3) QQ plot と 4) Shapiro-Wilk test

次に、QQ plotというグラフを描きます。実際のn個のデータを小さい順から並べ、同じ平均値とstandard deviationを持つ正規分布からランダムに得られたn個の値を計算します。元のデータが正規分布であれば、それぞれのペアをplotすると直線となります。こちらも同じパッケージのggplot()+stat_qq()で描くことができます。

 

そして最後にnormalityの検定であるShapiro-Wilk testを行います。nが多い時などは他の検定方法も使いますが、今回はShapiro-Wilk testを使ってみようと思います。

p<.001であるため、「正規分布である」という帰無仮説を棄却することになります。

しかし、その結果を鵜呑みにしてはいけません。サンプルサイズが大きければ、この検定はoverpowerになってしまい、完璧なnormality以外は棄却してしまいます。逆に、サンプルサイズが小さければunderpowerとなり、明らかにnormalでなくても棄却できません

いかがでしょうか。ある人はこう言います。

1) ヒストグラムはbell-shapeにみえなくもないが、2) kurtosisは2.6と大きく、3) QQ plotも直線ではないし、4) Shapiro-Wilk testはnormalityでないことを示している。だからBMIは正規分布ではないね!

しかし、ある人はこう言います。

1) ヒストグラムはbell-shapeにみえるし、2) kurtosisは2.6と少し大きいがskewnessは0に近い、3) QQ plotは直線にみえるし、4) Shapiro-Wilk testがnormalityを棄却しているのはサンプルサイズが大きすぎるから(n=4415)だね。だからBMIは正規分布とかみなしていいね!

これ、どちらも正解なんです。正規分布かどうか、どのように考えたか説明できて筋が通っていればokなんです。

HSPHのJohn Oravの凄いところは、統計学者でありながら、医療従事者がどのようなデータを扱い、どのように解釈するかを理解しているところです。統計学者は数字を元に答えを求めたがりますが、医師は臨床現場における解釈が重要です。彼の口癖は「It depends」でした。

Reference

John Orav. BST 206: Introductory Statistics for Medical Research. Harvard T.H. Chan School of Public Health
ABOUT ME
木村聡
福岡県の研修病院で初期研修修了後、大学に入局。米国オハイオ州に臨床研究で留学するも、知識の欠如を痛感。ハーバード公衆衛生大学院に進学し、MPHを取得。マサチューセッツ工科大学メンバーとの共同研究などに関与。 日本では麻酔・集中治療医として働き、オーストラリアでは小児集中治療を一から学び直しています。 乗り越える壁を見つけ続けることは、なかなか簡単ではありませんよね。アラフォー目前、様々な壁にぶち当たり、それなりに多くの経験をしてきました。私の挑戦や経験・知識、失敗談などが、他の誰かの刺激になり、役に立つことを切に願っています。 プロフィールをもっと詳しく見る

POSTED COMMENT

  1. […] 1の正規分布の評価に関しては、こちらを参考にしてください。 […]

  2. […] Breslow-Day testの注意すべき点は、Shapiro-Wilk testと同じです。サンプルサイズが小さければORが大きく違っても帰無仮説を棄却できず「同じ」と言ってしまう可能性があり、サンプルサイズが大きすぎるとoverpowerとなり、ORがほぼ同じであっても「違う」と言ってしまうことがあります。 […]

  3. KT より:

    初めまして、医師でMPH在籍中のものです。
    とても分かりやすいブログで大変参考にさせていただいております。

    ところで、4) Shapiro-Wilk testの項で、
    >> p<.001であるため、「正規分布ではない」という帰無仮説を棄却することになります。
    とありますが、Shapiro-Wilk testの帰無仮説は「正規分布である」ではないでしょうか。

    お手数ですがご確認いただければと思います!

    • 木村聡 より:

      はじめまして。
      ご指摘ありがとうございます。おっしゃる通りです。
      早速修正させていただきました。
      また何か発見されましたら、ご連絡いただけると幸いです。

交絡(confounding)と交互作用(effect modification) へ返信する コメントをキャンセル

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です