医療統計と疫学

正規分布とprobability

正規分布

今回は、正規分布を用いたprobabilityの計算についてです。p-valueも(帰無仮説における条件付き)probabilityであるので、後々のためにも理解が必要です。

正規分布とは

このnormal ( , )という表現、今後もよく出てきますので覚えておいてください。

正規分布といっても、そのcenter (mean)や広がり(standard deviation)によって様々です。しかし、それぞれのデータから平均値(μ)を引くことでそのセンターはゼロとなり、SD(σ)で割ることでその分布のSDは1となります。すなわち、normal (μ, SD)であったXの分布は、上記の計算によってnormal (1, 0)のstandard normalになる訳です。これをZ scoreと呼びます。

現実には我々は本当のSD(σ)を知ることができないため、自分の目の前にあるデータのSD(s)を使うしかありません。これをt-scoreと呼びます。

Z-scoreの使い方

このスライドでは、normal (0, 1)の分布をしたデータにおいて、X>=3となるprobabilityを考えています。このように、データが正規分布であった場合、その値またはそれより小さな値をとるprobability(下側確率)を、上のようなtableを用いたり、softwareを用いれば簡単にわかります。ちなみに、Rを使えば

となり、上のtableの赤枠と同じprobabilityとなります。

同様に、平均値とSDがわかっていれば、standard normalizationすることによって、その値の下側確率がわかります。

t-分布

Z-scoreを用いてprobabilityを計算する場合は上記のようにできますが、t-scoreを用いたprobabilityは若干異なります。下記の図はy軸にprobabilityをとっていますが、それぞれの曲線はdegree of freedomによって少しずつ異なります。dfが大きければ大きいほど、それぞれのprobabilityはZ-scoreの場合に近づきます。97.5%のデータが左側にくる値Z0.975は1.96でしたが、dfが小さければこの値は大きくなります。sample sizeが小さいと、同じprobabilityを出すためにより極端な値が必要ということですね。

医療従事者に必要な統計学と疫学(目次)へ

Reference

John Orav. BST 206: Introductory Statistics for Medical Research. Harvard T.H. Chan School of Public Health

 

ABOUT ME
木村聡
福岡県の研修病院で初期研修修了後、大学に入局。米国オハイオ州に臨床研究で留学するも、知識の欠如を痛感。ハーバード公衆衛生大学院に進学し、MPHを取得。マサチューセッツ工科大学メンバーとの共同研究などに関与。 日本で麻酔・集中治療医として働いた後、オーストラリアで臨床留学も経験。 書籍『絶対あきらめない医学留学』著者。 乗り越える壁を見つけ続けることは、なかなか簡単ではありませんよね。アラフォー目前、様々な壁にぶち当たり、それなりに多くの経験をしてきました。私の挑戦や経験・知識、失敗談などが、他の誰かの刺激になり、役に立つことを切に願っています。 プロフィールをもっと詳しく見る

POSTED COMMENT

  1. […] statisticを計算します。正規分布とprobabilityで解説したように、統計学ではそれぞれの分布におけるtest statistic(ex. […]

  2. […] 比較する両群のvarianceがわかっているなら、Z-testを用いることができます。上記のようにZ-scoreを計算し、Z-distributionにおけるそのscoreまたはそれ以上の値を取りうるprobabilityを計算することで、p-valueを得ることができます。今の一文の意味がわからない人は、正規分布とprobabilityを読んでみてください。 […]

  3. […] やβ^1のstandard errorから、t-scoreを計算します。t-scoreからprobability(p-value)の算出方法がわからない人はこちらを参照してください。 […]

  4. 相関係数 より:

    […] 「関係性なし(相関係数0)」を帰無仮説とすることで、その相関係数となるprobability(→p-value)を求めることができます。T-scoreを計算し、T-distributionからそのprobabilityを計算します。t検定と一緒ですね。 […]

  5. […] 正規分布とは:統計学の基本、「正規分布」の定義を知っていますか?検定方法の選択やp値の計算などで使う、超大切事項です。 […]

  6. […] z-testではz-distributionにおけるz-scoreのprobabilityを、ANOVAではF-distributionにおけるprobabilityを計算したのと同様、Chi-square testでもχ2のdistributionにおけるχ2のprobability (=p-value)を計算します。 […]

COMMENT

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です