30
傾向スコア分析は,①傾向スコアの計算,②c統計量の計算,③傾向スコアによる群
間のアウトカム比較(マッチング,逆確率による重み付け,または調整)の3ステップ
からなる
1,2)
。
(1) 傾向スコアの計算
第1章でも示した通り,傾向スコアの計算にはロジスティック回帰を用いればよい。
他にもさまざまな計算方法(プロビット分析,決定木,ランダム・フォレストなど)があ
るが,知らなくてもよい。ロジスティック回帰だけできれば十分である。
ロジスティック回帰の従属変数に治療の割り当て変数,独立変数に患者背景因子など
を投入する。治療Aと治療Bの二者択一の場合,従属変数Yは,実際に治療Aを受け
た患者ではY=1,治療Bを受けた患者ではY=0とする。
独立変数に投入できる変数は,治療の割り当てよりも前(あるいは同時点)に決定し
ている要因でなければならない。治療の割り当ての後に起こった事象を,傾向スコアを
計算するためのロジスティック回帰の独立変数に投入してはならない。
例えば,腹腔鏡下胃切除術と開腹胃切除術を比較する研究において,年齢,性別,が
んStage,併存症,喫煙歴,BMIなどは,治療の割り当ての前にすでに決定している。
しかし,術中出血量や手術時間,術後在院日数などは,治療の割り当ての後に決定する
から,傾向スコアを計算するロジスティック回帰の独立変数に投入できない。
投入できる独立変数のタイプや個数には制限がない。連続変数でもカテゴリー変数で
もよい。連続変数の2乗項を投入してもよい。例えば年齢が連続変数の場合,年齢その
ものの他に,年齢の2乗を同時に投入してもよい。2つのカテゴリー変数の交互作用項
を投入してもよい。例えば変数X
1
,X
2
ともに0,1の二値変数の場合,両者を乗じた交
互作用項X
1
*X
2
を投入してもよい。X
1
=1かつX
2
=1の場合のみX
1
*X
2
=1となり,
それ以外はX
1
*X
2
=0となる。
治療の割り当てに影響すると考えられる入手可能なすべての変数をロジスティック
回帰に投入してもよいし,そうすべきである。数十個,ときには数百個の変数を投入し
てもよい。回帰分析の過剰適合(overfitting)や多重共線性(multicollinearity)につ
いて考慮する必要はない。なぜなら,傾向スコアの計算は群間の背景因子のバランシン
グだけが目的であって,傾向スコアを求めるロジスティック回帰の各独立変数の回帰係
数そのものには関心がないからである
3,4)
。
1 傾向スコア分析の方法
1