医療統計と疫学– category –
-
医療統計と疫学
論文と撤回
失敗はシェアする。そうです。このブログのモットーです。 私は研究において大きな失敗を犯してしまいました。皆さんの参考になればと思い、恥を承知でシェアさせていただきます。 【疑惑(?)の論文】 問題となった研究は、体温と酸素消費量との関連を調... -
医療統計と疫学
臨床研究のすゝめ
今回は、「臨床研究のすゝめ」と題しまして、臨床研究に必要なプロセス、特にその成否に関わる研究計画を立てる前段階について述べたいと思います。私よりも立派な研究をされている方々が数多くいる中で、このような内容を偉そうに記すことはあまり気が進... -
医療統計と疫学
医療従事者に必要な統計学と疫学〜目次〜
【はじめに】 アカデミアで活躍する人も、片手間で研究している人も、研究に従事する人は最低限の統計学や疫学に関する知識を兼ね添えている必要があります。医療従事者もその例外ではありませんが、一方で統計学や疫学は一朝一夕で理解し使いこなせるもの... -
医療統計と疫学
メタ解析の基本と必須用語
久々の疫学系の話題ですね。今回はメタ解析(meta-analysis)で用いる基本的な言語や概念について解説しようと思います。ちなみに、最後にはmeta-analysisで必要な"r"のコードも付記しています。 【Effect measures(効果量の推定)】 メタ解析の目的 メタ... -
医療統計と疫学
決定木(Decision tree):様々なアルゴリズム
前回は、決定木(decision tree)の基本的な概念について説明しました。前回の最後のところで触れたように、decision treeは複数組み合わせることによってより良いモデルになる可能性があります。そこで今回は、Boosting (AdaBoost), Bagging, Random Fore... -
医療統計と疫学
決定木(Decision tree)の基本
あるアウトカムを予測するためには回帰モデル(regression model)を使う方法が(特に医療界では)有名ですが、方法はそれだけではありません。サンプルをあるルールに沿って木の枝のように次々と分けていく、決定木(decision tree)という予測モデルの作... -
医療統計と疫学
欠損値(missing value)の種類
実際のデータを扱う際、ほぼ確実に欠損値(missing value)というものが存在します。全てのデータが完全に揃っているということは、扱うデータが大きければ大きいほど非現実的となります。 では、欠損値がある場合、単にそのデータを除いて解析しても良い... -
医療統計と疫学
Kaplan-Meierの生存曲線をRで理解する
生存解析をする上で欠かせない"Kaplan-Meier(カプランマイヤー)"。もはやその方法(Kaplan-Meier estimator)を用いるのに、元文献を提示しなくても良いほどメジャーなものになりました。今回は、そのKaplan-Meierの理屈をRとともに解説したいと思います... -
医療統計と疫学
多変量解析の変数は何個まで入れて良いのか
他の記事では、因果推論における多変量解析に入れるべき変数、外すべき変数について解説しました。では、入れるべき変数は全てモデルに入れても構わないのでしょうか。入れすぎると、どのような問題が起きるのでしょうか。 【Overfitting】 因果推論の目的... -
医療統計と疫学
線形回帰分析〜その6:モデルの作り方
前回の記事で、regression modelに入れるべき変数の選び方の基本が理解できたと思います。今回は、因果推論におけるモデル(「予測モデル」を作りたい訳ではないので注意してください)の作り方を解説します。 因果推論についてはこちらを参照していただき...