正規分布とprobability

2019年8月27日2024年12月18日

正規分布

今回は、正規分布を用いたprobabilityの計算についてです。p-valueも（帰無仮説における条件付き）probabilityであるので、後々のためにも理解が必要です。

正規分布とは

このnormal ( , )という表現、今後もよく出てきますので覚えておいてください。

正規分布といっても、そのcenter (mean)や広がり（standard deviation）によって様々です。しかし、それぞれのデータから平均値（μ）を引くことでそのセンターはゼロとなり、SD（σ）で割ることでその分布のSDは1となります。すなわち、normal (μ, SD)であったXの分布は、上記の計算によってnormal (1, 0)のstandard normalになる訳です。これをZ scoreと呼びます。

現実には我々は本当のSD（σ）を知ることができないため、自分の目の前にあるデータのSD（s）を使うしかありません。これをt-scoreと呼びます。

Z-scoreの使い方

このスライドでは、normal (0, 1)の分布をしたデータにおいて、X>=3となるprobabilityを考えています。このように、データが正規分布であった場合、その値またはそれより小さな値をとるprobability（下側確率）を、上のようなtableを用いたり、softwareを用いれば簡単にわかります。ちなみに、Rを使えば

> pnorm(3,mean=0,sd=1)
 0.9986501

となり、上のtableの赤枠と同じprobabilityとなります。

同様に、平均値とSDがわかっていれば、standard normalizationすることによって、その値の下側確率がわかります。

t-分布

Z-scoreを用いてprobabilityを計算する場合は上記のようにできますが、t-scoreを用いたprobabilityは若干異なります。下記の図はy軸にprobabilityをとっていますが、それぞれの曲線はdegree of freedomによって少しずつ異なります。dfが大きければ大きいほど、それぞれのprobabilityはZ-scoreの場合に近づきます。97.5%のデータが左側にくる値Z_0.975は1.96でしたが、dfが小さければこの値は大きくなります。sample sizeが小さいと、同じprobabilityを出すためにより極端な値が必要ということですね。

⇒医療従事者に必要な統計学と疫学（目次）へ

Reference

John Orav. BST 206: Introductory Statistics for Medical Research. Harvard T.H. Chan School of Public Health

よかったらシェアしてね！

URLをコピーしました！

URLをコピーしました！

コメント一覧（6件）

仮説検定と信頼区間 | シェアする挑戦者〜 MD × MPH 〜 より:

2019年9月1日 1:46 PM

[…] statisticを計算します。正規分布とprobabilityで解説したように、統計学ではそれぞれの分布におけるtest statistic（ex. […]

返信
t-testとWilcoxon rank sum test | シェアする挑戦者〜 MD × MPH 〜 より:

2019年9月4日 9:45 PM

[…] 比較する両群のvarianceがわかっているなら、Z-testを用いることができます。上記のようにZ-scoreを計算し、Z-distributionにおけるそのscoreまたはそれ以上の値を取りうるprobabilityを計算することで、p-valueを得ることができます。今の一文の意味がわからない人は、正規分布とprobabilityを読んでみてください。 […]

返信
線形回帰分析〜その2：Least Squares | シェアする挑戦者〜 MD × MPH 〜 より:

2019年11月12日 11:17 PM

[…] やβ^1のstandard errorから、t-scoreを計算します。t-scoreからprobability（p-value）の算出方法がわからない人はこちらを参照してください。 […]

返信
相関係数 より:

2019年11月24日 5:59 PM

[…] 「関係性なし（相関係数0）」を帰無仮説とすることで、その相関係数となるprobability（→p-value）を求めることができます。T-scoreを計算し、T-distributionからそのprobabilityを計算します。t検定と一緒ですね。 […]

返信
医療従事者に必要な統計学と疫学〜目次サイト〜｜シェアする挑戦者〜 MD × MPH 〜 より:

2021年2月27日 6:54 AM

[…] 正規分布とは：統計学の基本、「正規分布」の定義を知っていますか？検定方法の選択やp値の計算などで使う、超大切事項です。 […]

返信
カイ二乗検定とFisher's exact testの違い｜シェアする挑戦者〜 MD × MPH 〜 より:

2021年2月27日 10:58 AM

[…] z-testではz-distributionにおけるz-scoreのprobabilityを、ANOVAではF-distributionにおけるprobabilityを計算したのと同様、Chi-square testでもχ2のdistributionにおけるχ2のprobability (=p-value)を計算します。 […]

返信

正規分布とprobability

正規分布

正規分布とは

Z-scoreの使い方

t-分布

Reference

関連記事

コメント

コメント一覧 （6件）

コメントする コメントをキャンセル

コメント一覧（6件）

コメントするコメントをキャンセル