医療統計と疫学– category –
-
医療統計と疫学
交絡因子(confounder)
今回は、交絡因子(confounder)の話です。研究に携わる医師、疫学者、統計学者、データサイエンティストなど、様々な職種の方々が使う用語ですが、実はその定義、使う人によって異なります。 【はじめに】 交絡因子(confounder)の定義としては 疫学者 v... -
医療統計と疫学
因果推論とDirected Acyclic Graphs (DAG)
今回は、趣向を変えて疫学の話です。因果推論(causal inference)で重要なDirected Acyclic Graphs (DAG)について解説したいと思います。多変量解析でmodelに入れる因子を決定するのに、とても重要なステップです。最後まで読んでいただけると、 どのよう... -
医療統計と疫学
カテゴリー vs. カテゴリー: Z-test, Chi-square, and Fisher
今回は、カテゴリー変数とカテゴリー変数の関連を調べる方法について解説したいと思います。 例えば、男女で急性腎不全(AKI)の発生率に違いがあるのか、といった命題です。男女は「男性=1, 女性=0」の変数となり、AKIは「AKI発生あり=1, AKIなし=0」の変... -
医療統計と疫学
Pairwise comparisons
ANOVAやKruskal-Wallisで有意差がでたら、次はどのペアに有意差があるのかを調べるためのpairwise comparisonsを行います。 ちなみに、もしANOVAやKruskal-Wallis testで有意差がでなければ、それ以上の解析はしない、というのが定石です。なぜでしょうか... -
医療統計と疫学
連続変数の多群比較:ANOVAとKruskal-Wallis test
今回は、3群以上で連続変数を比較する検定法について勉強します。まずはANOVAからやりましょう。 【ANOVA】 ANOVAを使うためには、幾つか満たすべきassumptionがあります。 Assumption ここでは、わかりやすく3群で比較する場合を考えていきます。... -
医療統計と疫学
t-testとWilcoxon rank sum test
ここでは、2群間で連続変数を比較する検定方法について解説します。一般的に有名なのはt-testとWilcoxon rank sum testですが、どのように両者を使い分けるのでしょうか。 【はじめに】 大まかには、上記のスライドのように考えていきます。2群とも正規分... -
医療統計と疫学
仮説検定と信頼区間
統計においてはp値や信頼区間が必ず出てきます。そこで、基本となる仮説検定(hypothesis testing)や信頼区間(confidence interval)について解説します。 【仮説検定】 まず、「何のパターンもない」という帰無仮説(H0: Null hypothesis)をたて、その... -
医療統計と疫学
正規分布の評価方法
先に申し上げておきますが、その判断は結構主観的です。統計といったら数字で全て説明できそうですが、意外に個々の主観が入ってきます。大事なのは、正規分布か否かを判断したその手順をしっかり説明できることだと思います。 【1) ヒストグラム】 Rのggp... -
医療統計と疫学
正規分布とprobability
【正規分布】 今回は、正規分布を用いたprobabilityの計算についてです。p-valueも(帰無仮説における条件付き)probabilityであるので、後々のためにも理解が必要です。 正規分布とは このnormal ( , )という表現、今後もよく出てきますので覚えておいて... -
医療統計と疫学
連続変数の表すための基本用語
今日は、連続変数の分布を表すために必要な「言語」について説明したいと思います。 ちなみに、今回の多くはハーバード公衆衛生大学院のJohn Oravの講義を元に自分なりにまとめたものです。目からウロコの毎日だったので、興味があれば受講してみてはいか...