Copyright© KANEHARA & Co., LTD. All Rights Reserved.
できる!傾向スコア分析 SPSS・Stata・Rを用いた必勝マニュアル
傾向スコア分析を“正しく”使うための手法を完全マスター!
著 者 | 康永 秀生 / 笹渕 裕介 / 道端 伸明 / 山名 隼人 |
---|---|
定 価 | 3,520円 (3,200円+税) |
発行日 | 2018/06/25 |
ISBN | 978-4-307-00484-8 |
B5判・128頁・図数:51枚
在庫状況 | あり |
---|
傾向スコア分析は、観察データを用いて擬似ランダム化を行うなど、適応による交絡の影響を調整する画期的な統計手法である。しかし近年、この手法が誤用・乱用されているケースも少なくない。本書では、傾向スコア分析の基礎理論や3種類の統計ソフトを使った実践的な解析手順を、豊富な画像やスクリプトを使ってわかりやすく解説。傾向スコア分析を“正しく”使うためのスキルを、この一冊でマスターできる。解説で使用したサンプルデータはダウンロード配信中。
【関連書籍】必ず書けるようになる 論文執筆のための学び直し英文法・英語表現
【関連書籍】目の前の患者から始まる臨床研究
【関連書籍】必ず読めるようになる医学英語論文
【関連書籍】必ずアクセプトされる医学英語論文 完全攻略50の鉄則 改訂版
【関連書籍】できる!臨床研究 最短攻略50の鉄則
【関連書籍】医学論文の難解な統計手法が手に取るようにわかる本
【関連書籍】必ず書けるようになる 論文執筆のための学び直し英文法・英語表現
【関連書籍】目の前の患者から始まる臨床研究
【関連書籍】必ず読めるようになる医学英語論文
【関連書籍】必ずアクセプトされる医学英語論文 完全攻略50の鉄則 改訂版
【関連書籍】できる!臨床研究 最短攻略50の鉄則
【関連書籍】医学論文の難解な統計手法が手に取るようにわかる本
I 理論編
第1章 傾向スコア分析とは
1 介入研究と観察研究
1. 介入と観察
2. ランダム化比較試験と「タイムマシン試験」
3. 観察研究
4. 擬似ランダム化
2 傾向スコア分析の概念と実例
1. 傾向スコア分析の概念
2. 傾向スコア分析の実例
第2章 傾向スコア分析の方法と注意点
1 傾向スコア分析の方法
1. 傾向スコアの計算
2. c統計量の計算
3. 傾向スコア・マッチング
4. 逆確率による重み付け
5. 傾向スコアによる調整
2 傾向スコア分析の限界
1. c統計量が低すぎる場合
2. c統計量が高すぎる場合
3. 未測定交絡因子の問題
4. 傾向スコア分析の正しい適用
<発展学習> 多重傾向スコア
II 実践編
第3章 SPSSを用いた傾向スコア分析
1 SPSSの概要
1. SPSSとは
2. SPSSの操作画面
2 データの読み込みと確認
1. サンプル・データセット
2. データの読み込み
3. データの確認
3 傾向スコアの計算
1. ロジスティック回帰による傾向スコアの計算
2. ROC曲線
3. 傾向スコアの分布の視覚化
4 傾向スコアによる調整
1. ロジスティック回帰
2. 重回帰分析
5 逆確率による重み付け
1. 重み付け係数の計算
2. 重み付け前後のバランスの確認
3. 治療効果の推定
6 傾向スコア・マッチング
1. マッチングの実行
2. マッチング後のバランスの確認
3. 治療効果の推定
第4章 Stataを用いた傾向スコア分析
1 Stataの概要
1. Stataとは
2. Stataの操作画面
2 データの読み込みと確認
1. サンプル・データセット
2. データの読み込み
3. データの確認
3 傾向スコアの計算
1. ロジスティック回帰による傾向スコアの計算
2. ROC曲線
3. 傾向スコアの分布の視覚化
4 傾向スコアによる調整
1. ロジスティック回帰
2. 重回帰分析
5 逆確率による重み付け
1. 重み付け係数の計算
2. 重み付け前後のバランスの確認
3. 治療効果の推定
4. teffectsを用いた逆確率による重み付け
6 傾向スコア・マッチング
1. マッチングの実行
2. マッチング後のバランスの確認
3. 治療効果の推定
4. teffectsを用いた傾向スコア・マッチング
第5章 Rを用いた傾向スコア分析
1 Rの概要
1. Rとは
2. RとRStudio のダウンロード
3. RStudioの操作画面
2 データの読み込みと確認
1. サンプル・データセット
2. データの読み込み
3. データの確認
3 傾向スコアの計算
1. ロジスティック回帰による傾向スコアの計算
2. ROC曲線
3. 傾向スコアの分布の視覚化
4 傾向スコアによる調整
1. ロジスティック回帰
2. 重回帰分析
5 逆確率による重み付け
1. 重み付け係数の計算
2. 重み付け前後のバランスの確認
3. 治療効果の推定
6 傾向スコア・マッチング
1. マッチングの実行
2. マッチング後のバランスの確認
3. 治療効果の推定
第1章 傾向スコア分析とは
1 介入研究と観察研究
1. 介入と観察
2. ランダム化比較試験と「タイムマシン試験」
3. 観察研究
4. 擬似ランダム化
2 傾向スコア分析の概念と実例
1. 傾向スコア分析の概念
2. 傾向スコア分析の実例
第2章 傾向スコア分析の方法と注意点
1 傾向スコア分析の方法
1. 傾向スコアの計算
2. c統計量の計算
3. 傾向スコア・マッチング
4. 逆確率による重み付け
5. 傾向スコアによる調整
2 傾向スコア分析の限界
1. c統計量が低すぎる場合
2. c統計量が高すぎる場合
3. 未測定交絡因子の問題
4. 傾向スコア分析の正しい適用
<発展学習> 多重傾向スコア
II 実践編
第3章 SPSSを用いた傾向スコア分析
1 SPSSの概要
1. SPSSとは
2. SPSSの操作画面
2 データの読み込みと確認
1. サンプル・データセット
2. データの読み込み
3. データの確認
3 傾向スコアの計算
1. ロジスティック回帰による傾向スコアの計算
2. ROC曲線
3. 傾向スコアの分布の視覚化
4 傾向スコアによる調整
1. ロジスティック回帰
2. 重回帰分析
5 逆確率による重み付け
1. 重み付け係数の計算
2. 重み付け前後のバランスの確認
3. 治療効果の推定
6 傾向スコア・マッチング
1. マッチングの実行
2. マッチング後のバランスの確認
3. 治療効果の推定
第4章 Stataを用いた傾向スコア分析
1 Stataの概要
1. Stataとは
2. Stataの操作画面
2 データの読み込みと確認
1. サンプル・データセット
2. データの読み込み
3. データの確認
3 傾向スコアの計算
1. ロジスティック回帰による傾向スコアの計算
2. ROC曲線
3. 傾向スコアの分布の視覚化
4 傾向スコアによる調整
1. ロジスティック回帰
2. 重回帰分析
5 逆確率による重み付け
1. 重み付け係数の計算
2. 重み付け前後のバランスの確認
3. 治療効果の推定
4. teffectsを用いた逆確率による重み付け
6 傾向スコア・マッチング
1. マッチングの実行
2. マッチング後のバランスの確認
3. 治療効果の推定
4. teffectsを用いた傾向スコア・マッチング
第5章 Rを用いた傾向スコア分析
1 Rの概要
1. Rとは
2. RとRStudio のダウンロード
3. RStudioの操作画面
2 データの読み込みと確認
1. サンプル・データセット
2. データの読み込み
3. データの確認
3 傾向スコアの計算
1. ロジスティック回帰による傾向スコアの計算
2. ROC曲線
3. 傾向スコアの分布の視覚化
4 傾向スコアによる調整
1. ロジスティック回帰
2. 重回帰分析
5 逆確率による重み付け
1. 重み付け係数の計算
2. 重み付け前後のバランスの確認
3. 治療効果の推定
6 傾向スコア・マッチング
1. マッチングの実行
2. マッチング後のバランスの確認
3. 治療効果の推定
傾向スコア分析(propensity score analysis)は、臨床研究や疫学研究に用いられる応用的な統計手法の一つである。本手法を用いた論文は激増しており、ここ17年間に100倍以上に膨れ上がっている。それほど傾向スコア分析は脚光を浴びている統計手法である。
傾向スコア分析は「観察データを用いて擬似ランダム化を行い、ランダム化比較試験に準じる結果を得られる」という点で画期的な手法である。トップクラスのジャーナルでは、観察研究で治療の効果比較を行う場合、この手法をやって当たり前、というほどに一般化しつつある。
本書を手に取っていただいた読者のなかには、傾向スコア分析という言葉を聞いたことはあるが、どんな方法かよくわからないという方も多いだろう。あるいは、傾向スコア分析を活用している論文を読んで、自分もやってみたくなったが、具体的にどうすればいいのかわからない、という方も少なくないだろう。
多くの研究者が傾向スコア分析を使いたいと考えているにもかかわらず、傾向スコア分析の基本的な理論や実践的な分析方法についてわかりやすく書かれた日本語の教科書はこれまで見当たらない。
筆者らは2018年6月現在、傾向スコア分析を用いた論文をすでに約70本出版してきた。また、多くの研究者から傾向スコア分析についての相談を受け、個別にサポートしてきた。その経験に基づいて、統計学の初心者でも理解できるように、傾向スコア分析の基礎理論と実践的なノウハウを本書にまとめ上げた。
前書の「できる! 臨床研究 最短攻略50の鉄則」(金原出版、2017)では、1節を割いて傾向スコア分析の概略を記した。本書は傾向スコア分析に的を絞り、前書の内容を大幅に拡大して、傾向スコア分析に関する基礎理論のエッセンスと統計ソフトを用いた分析手順を、噛んで含めるようにわかりやすく解説している。本書があれば、統計の初学者であっても、傾向スコア分析を自由自在に操ることができるようになるだろう。
傾向スコア分析は、観察データを用いた治療効果の比較分析において大きな問題となる「適応による交絡(confounding by indication)」を調整する統計手法の一つである。適応による交絡とは、患者の背景因子や医療施設の要因が、治療効果だけでなく、治療の割り当てにも影響を与えるバイアスである。
適応による交絡を排除する最も良い方法が、ランダム化比較試験であることは言うまでもない。しかしランダム化比較試験は倫理的問題や巨額な費用がかかる点がネックとなり、多くの場合に実施困難である。次善の手段として、観察データを用いた傾向スコア分析を行うことにより、適応による交絡の影響をある程度まで克服できる。
しかし、傾向スコア分析にも限界がある。特に問題となるのが「未測定交絡因子(unmeasured confounders)」の影響である。ところが最近、その限界が十分に理解されないまま、傾向スコア分析が誤用されるケースも増えているようである。
傾向スコア分析の利用が広がるにつれて、臨床家の間では、傾向スコア分析に対する2種類の異なる「誤解」が広がっているように、筆者らは感じている。第1の誤解は、傾向スコア分析に対する過大な期待によるものである。ランダム化比較試験を行わなくても、傾向スコア分析によって代用できる、と考えられがちである。この種の誤解が、傾向スコア分析の誤用・乱用を生んでいる。
近年は、傾向スコア分析の誤用の増加に対する批判論文も現れている。そのため一部の臨床研究者たちによって、傾向スコア分析そのものに懐疑的な目を向けられてしまうことがある。これが傾向スコア分析に対する第2の誤解である。
傾向スコア分析は、正しく適用すれば、観察データにおける適応による交絡の影響を調整し、データから妥当な結論を導き出すことができる、強力な分析ツールである。しかし、しばしば傾向スコア分析を適用できない、あるいは適用する必要がないケースが存在する。
近年は、ジャーナルの編集者も査読者も目が肥えており、傾向スコア分析の質そのものを問われる時代になっている。本書は、上記の2つの誤解を解き、臨床家が傾向スコア分析を正しく適用することができるように、統計家ではなく臨床家にわかる言葉で書かれたものである。
本書の構成は「I 理論編」と「II 実践編」に分かれる。「I 理論編」では、傾向スコアの概念と傾向スコア分析の方法と注意点について概説している。「II 実践編」では、SPSS、Stata、Rという3種類の統計ソフトを用いた傾向スコア分析の実践的な手順について解説している。
SPSS、Stata、Rそれぞれの特徴や利点について、以下の表にまとめる。SPSSはGraphical User Interface(GUI)というインターフェースを採用しており、ほとんどの操作をクリックのみで実現可能である。その利便性ゆえに臨床家の間でも支持されており、最も汎用されるソフトである。しかし、他のソフトと比較したSPSSの長所は、それだけである。
傾向スコア分析についてはStataが最も優れている。Stataは、スクリプトを入力するCharacter User Interface(CUI)中心であるが、最新のバージョンではGUIも充実している。何よりHelp機能が充実しており、ユーザー・フレンドリーである点もSPSSに勝るとも劣らない。しかもSPSSよりもかなり低価格である。
Rはプログラム言語であり、初心者にはかなりとっつきにくいが、RStudioという補助ツールを用いればかなり楽に操作できる。Stataと同様、最新の応用統計にも対応できる。Rの最大の利点は、無料で利用できることである。
実践編はどの章から読み始めてもよいだろう。SPSSユーザーは第3章、Stataユーザーは第4章、Rユーザーは第5章から読み始めてもよい。
最後に、本書執筆中に常に細やかなご支援を頂いた金原出版編集者の山下眞人氏と須之内和也氏に厚く御礼を申し上げる。
2018年6月
康永 秀生・笹渕 裕介・道端 伸明・山名 隼人
傾向スコア分析は「観察データを用いて擬似ランダム化を行い、ランダム化比較試験に準じる結果を得られる」という点で画期的な手法である。トップクラスのジャーナルでは、観察研究で治療の効果比較を行う場合、この手法をやって当たり前、というほどに一般化しつつある。
本書を手に取っていただいた読者のなかには、傾向スコア分析という言葉を聞いたことはあるが、どんな方法かよくわからないという方も多いだろう。あるいは、傾向スコア分析を活用している論文を読んで、自分もやってみたくなったが、具体的にどうすればいいのかわからない、という方も少なくないだろう。
多くの研究者が傾向スコア分析を使いたいと考えているにもかかわらず、傾向スコア分析の基本的な理論や実践的な分析方法についてわかりやすく書かれた日本語の教科書はこれまで見当たらない。
筆者らは2018年6月現在、傾向スコア分析を用いた論文をすでに約70本出版してきた。また、多くの研究者から傾向スコア分析についての相談を受け、個別にサポートしてきた。その経験に基づいて、統計学の初心者でも理解できるように、傾向スコア分析の基礎理論と実践的なノウハウを本書にまとめ上げた。
前書の「できる! 臨床研究 最短攻略50の鉄則」(金原出版、2017)では、1節を割いて傾向スコア分析の概略を記した。本書は傾向スコア分析に的を絞り、前書の内容を大幅に拡大して、傾向スコア分析に関する基礎理論のエッセンスと統計ソフトを用いた分析手順を、噛んで含めるようにわかりやすく解説している。本書があれば、統計の初学者であっても、傾向スコア分析を自由自在に操ることができるようになるだろう。
傾向スコア分析は、観察データを用いた治療効果の比較分析において大きな問題となる「適応による交絡(confounding by indication)」を調整する統計手法の一つである。適応による交絡とは、患者の背景因子や医療施設の要因が、治療効果だけでなく、治療の割り当てにも影響を与えるバイアスである。
適応による交絡を排除する最も良い方法が、ランダム化比較試験であることは言うまでもない。しかしランダム化比較試験は倫理的問題や巨額な費用がかかる点がネックとなり、多くの場合に実施困難である。次善の手段として、観察データを用いた傾向スコア分析を行うことにより、適応による交絡の影響をある程度まで克服できる。
しかし、傾向スコア分析にも限界がある。特に問題となるのが「未測定交絡因子(unmeasured confounders)」の影響である。ところが最近、その限界が十分に理解されないまま、傾向スコア分析が誤用されるケースも増えているようである。
傾向スコア分析の利用が広がるにつれて、臨床家の間では、傾向スコア分析に対する2種類の異なる「誤解」が広がっているように、筆者らは感じている。第1の誤解は、傾向スコア分析に対する過大な期待によるものである。ランダム化比較試験を行わなくても、傾向スコア分析によって代用できる、と考えられがちである。この種の誤解が、傾向スコア分析の誤用・乱用を生んでいる。
近年は、傾向スコア分析の誤用の増加に対する批判論文も現れている。そのため一部の臨床研究者たちによって、傾向スコア分析そのものに懐疑的な目を向けられてしまうことがある。これが傾向スコア分析に対する第2の誤解である。
傾向スコア分析は、正しく適用すれば、観察データにおける適応による交絡の影響を調整し、データから妥当な結論を導き出すことができる、強力な分析ツールである。しかし、しばしば傾向スコア分析を適用できない、あるいは適用する必要がないケースが存在する。
近年は、ジャーナルの編集者も査読者も目が肥えており、傾向スコア分析の質そのものを問われる時代になっている。本書は、上記の2つの誤解を解き、臨床家が傾向スコア分析を正しく適用することができるように、統計家ではなく臨床家にわかる言葉で書かれたものである。
本書の構成は「I 理論編」と「II 実践編」に分かれる。「I 理論編」では、傾向スコアの概念と傾向スコア分析の方法と注意点について概説している。「II 実践編」では、SPSS、Stata、Rという3種類の統計ソフトを用いた傾向スコア分析の実践的な手順について解説している。
SPSS、Stata、Rそれぞれの特徴や利点について、以下の表にまとめる。SPSSはGraphical User Interface(GUI)というインターフェースを採用しており、ほとんどの操作をクリックのみで実現可能である。その利便性ゆえに臨床家の間でも支持されており、最も汎用されるソフトである。しかし、他のソフトと比較したSPSSの長所は、それだけである。
傾向スコア分析についてはStataが最も優れている。Stataは、スクリプトを入力するCharacter User Interface(CUI)中心であるが、最新のバージョンではGUIも充実している。何よりHelp機能が充実しており、ユーザー・フレンドリーである点もSPSSに勝るとも劣らない。しかもSPSSよりもかなり低価格である。
Rはプログラム言語であり、初心者にはかなりとっつきにくいが、RStudioという補助ツールを用いればかなり楽に操作できる。Stataと同様、最新の応用統計にも対応できる。Rの最大の利点は、無料で利用できることである。
実践編はどの章から読み始めてもよいだろう。SPSSユーザーは第3章、Stataユーザーは第4章、Rユーザーは第5章から読み始めてもよい。
最後に、本書執筆中に常に細やかなご支援を頂いた金原出版編集者の山下眞人氏と須之内和也氏に厚く御礼を申し上げる。
2018年6月
康永 秀生・笹渕 裕介・道端 伸明・山名 隼人
- 医書.jpで購入される方は
こちらから (外部サイトに移動します) - M2PLUSで購入される方は
こちらから (外部サイトに移動します)