Causal Inference: WhatIf, Chapter 16①

190 Views

January 20, 23

スライド概要

profile-image

現在は横浜市立大学(B4)に所属しています。来年度からは東京医科大学の修士課程に進学予定です。 生物統計学 (Biostatistics) 、統計的因果推論 (Causal Inference)を専攻しています。 学習・研究にあたり作成した資料を公開しています。スライドについては不定期で修正を行っておりますのでご注意ください。また一部資料(What If)についてはブログで詳しい説明を行っています。

シェア

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

Causal Inference: What If Chapter16: Instrumental variable estimation ① Miguel A. Hernán and James M. Robins 鈴木 徳太 (Norihiro Suzuki)

2.

Preface • ここまでのchapterで紹介した手法 – 交絡、選択バイアスの調整に必要な変数が全て特定され(no unmeasured confounding)、 それらが正しく測定されている(no measurement error)という検証不可能な仮定を要する – 満たされない場合には推定値にはresidual bias(残差バイアス)が含まれる • 上記の仮定を必要としない因果効果の推定手法が存在 – その1つが操作変数による推定(instrumental variable estimation) – 操作変数法(Instrumental variable methods) 1

3.

目次 16.1 The three instrumental conditions – Technical Point 16.1: The instrumental conditions, formally – Fine Point 16.1: Candidate instruments in observational studies – Technical Point 16.2: Bounds: Partial identification of causal effects 16.2 The usual IV estimand 2

4.

記号・状況の定義 • 二重盲検プラセボ対照ランダム化試験 – – – – 𝑍 : ランダム割付変数(1: 治療群, 0: プラセボ群) 𝐴 : 実際に受けた治療変数(1: 治療あり, 0: 治療なし) 𝑌 : アウトカム 𝑈 : 𝐴と𝑌に影響を及ぼす全ての因子(未測定因子含む) • 𝐴の𝑌に対する平均因果効果 – IP weighting, standardizationなど • 交絡調整に必要な変数の特定、完璧な測定、調整が必要 • 非現実的であり、ある程度推定値にバイアスが含まれる – 操作変数法(Instrumental variable (IV) methods) • 交絡調整によらない異なる仮定を用いたアプローチ 3

5.

操作変数法 • 操作変数法による平均因果効果の推定 – 以下の条件を全て満たす操作変数𝑍(instrumental variable, instrumental)が必要 • 𝑍が操作変数であるための3条件(three instrumental conditions) i. ii. iii. • 𝑍は𝐴と関連する 𝑍は𝑌に対し𝐴を介した潜在的な効果以外の効果を持たない 𝑍と𝑌のcommon causeは存在しない Figure 16.1においてはランダム割付変数𝑍が操作変数 i. ii. iii. 治療群に割り付けられた被験者は実際に治療を受ける 二重盲検により副次的な影響が存在しない 𝑍はランダム割付変数であるためcommon causeは存在しない 4

6.

操作変数の分類 • 操作変数𝑍の分類 – Causal instrument • 治療𝐴に対し、因果効果を持つ • e.g.) Figure16.1 – Surrogate (proxy) instrument • 𝑈𝑍 は未測定のcausal instrument • e.g.) Figure16.2, Figure16.2 • 操作変数法においてはいずれも使用可能 – 16.4節で紹介される事項に注意が必要 5

7.

例:禁煙が体重変化に与える因果効果の推定 • 記号の定義 – – – – 𝑍 : タバコの価格(1: over $1.50, 0: otherwise) 𝐴 : 禁煙の有無(1: Yes, 0: no) 𝑌 : 体重の変化 𝑈 : 𝐴と𝑌のcommon cause(未測定因子含む) • 𝑍が真に操作変数であるかは実証不可 – 条件ⅰのみ経験的に確認可能 • 𝑃𝑟 𝐴 = 1 𝑍 = 1 − 𝑃𝑟 𝐴 = 1 𝑍 = 0 > 0(価格が高いほど禁煙する傾向)となるか – 今回の例では、𝑍と𝐴はweakly associated • 𝑃𝑟 𝐴 = 1 𝑍 = 1 − 𝑃𝑟 𝐴 = 1 𝑍 = 0 = 25.8% − 19.5% ≒ 6% • 弱操作変数(weak instrument)の問題(16.5節参照) 6

8.

操作変数の条件の成立について • 条件 ii – e.g.) 真には成立している場合のFigure 19.2 – 𝑍 ← 𝑈𝑍 → 𝐴 ← 𝑈 → 𝑌がcolliderである𝐴の条件付けにより開く – 𝑍と𝑌の関連が生じるため検証不可 • 条件 iii – 未測定の交絡因子が存在する可能性があり検証不可 • 操作変数法も検証不可能な仮定に基づく – 𝑍が真に操作変数法であっても平均因果効果のboundのみ識別可能(Technical Point 16.2) • 典型的には指標のnull値を含むかなり広いboundとなる – 追加の仮定が必要(16.3, 16.4節) 7

9.

目次 16.1 The three instrumental conditions – Technical Point 16.1: The instrumental conditions, formally – Fine Point 16.1: Candidate instruments in observational studies – Technical Point 16.2: Bounds: Partial identification of causal effects 16.2 The usual IV estimand 8

10.

Technical Point 16.1 The instrumental conditions, formally • 条件 i(relevance condition) – 𝑍と𝐴のnon-nullな関連、もしくは 𝑍 ⊥ 𝐴 の非成立を意味 • 条件 ii(exclusion restriction) – 個人レベル:𝑌𝑖 𝑧,𝑎 = 𝑌𝑖 𝑧 ′ ,𝑎 𝑎 = 𝑌𝑖 for all 𝑧, 𝑧 ′ , all 𝑎, all individual 𝑖 本書の例は集団レベルでの 成立が必要 ′ – 集団レベル:𝐸[𝑌𝑖 𝑧,𝑎 ] = 𝐸[𝑌𝑖 𝑧 ,𝑎 ] • 条件 iii – Marginal exchangeability 𝑌 𝑧,𝑎 ⊥ 𝑍 for all 𝑎, 𝑧 • 個人レベルの条件 iiと併せると 𝑌 𝑎 ⊥ 𝑍 を意味 – より強い仮定として、joint exchangeabilityを用いる場合も • 𝑌 𝑧,𝑎 ; 𝑎 ∈ 0, 1 , 𝑧 ∈ 0, 1 ⊥ 𝑍 for dichotomous treatment and instrument 9

11.

Fine Point 16.1 Candidate instruments in observational studies • 観察研究において一般的に使用される操作変数の3つのカテゴリー 1. Genetic factor(遺伝要因) • アルコール接種が冠状動脈性心疾患(CHD)リスクに対して与える効果推定の際の、アルコール摂取 に関する多型(polymorphism) • 遺伝的変異を用いた操作変数法による因果推論はメンデルランダム化(Mendelian randomization) の枠組みの一部として知られる 2. Preference(嗜好) • 医師(医療提供者)がある治療法を他の治療よりも優先する度合いの指標 3. Access(アクセス) • 設までの物理的な距離や移動時間、治療の価格など 10

12.

Technical Point 16.2 Bounds: Partial identification of causal effects • 二値アウトカムに対する平均因果効果𝑃𝑟 𝑌 𝑎=1 = 1 − 𝑃𝑟 𝑌 𝑎=0 = 1 のbounds – 無条件:[-1, 1] • 下限: 𝑃𝑟 𝑌 𝑎=1 = 1 = 0, 𝑃𝑟 𝑌 𝑎=0 = 1 = 1 • 上限: 𝑃𝑟 𝑌 𝑎=1 = 1 = 1, 𝑃𝑟 𝑌 𝑎=0 = 1 = 1 – データが得られると一部の𝑌 𝑎=1 , 𝑌 𝑎=0 は既知となるため、より狭いboundsを計算可能 – 集団レベルの条件(ii)、条件(iii)のmarginal exchangeabilityが成立する場合 • 幅が𝑃𝑟 𝐴 = 1 𝑍 = 0 + 𝑃𝑟[𝐴 = 0|𝐴 = 1]となるbounds(natural bounds)を計算可能 – marginal exchangeabilityではなく、 marginal exchangeabilityが成立する場合 • より狭いbounds(sharp bounds)を計算可能 – 詳細についてはブログ参照 • 追加の条件が成立する場合には平均因果効果の点推定が可能(下限と上限がある値に収束) 11

13.

目次 16.1 The three instrumental conditions – Technical Point 16.1: The instrumental conditions, formally – Fine Point 16.1: Candidate instruments in observational studies – Technical Point 16.2: Bounds: Partial identification of causal effects 16.2 The usual IV estimand 12

14.

The usual IV estimand • ある変数𝑍が二値であり、操作変数の3つの条件と追加の仮定を満たすとき 平均因果効果𝐸 𝑌 𝑎=1 − 𝐸 𝑌 𝑎=0 は識別され、以下のusual IV estimandと一致 usual IV estimand 𝐸 𝑌 𝑍 = 1 − 𝐸[𝑌|𝑍 = 0] 𝐸 𝐴 𝑍 = 1 − 𝐸[𝐴|𝑍 = 0] • 操作変数が連続であるとき usual IV estimand 𝐶𝑜𝑣(𝑌, 𝑍) 𝐶𝑜𝑣(𝐴, 𝑍) 13

15.

The usual IV estimand • 分子 – 𝑍の𝑌に対する平均因果効果(ITT effect) • 分母 – 𝑍の𝐴に対する平均因果効果 – アドヒアランス(コンプライアンス)を示す尺度 usual IV estimand 𝐸 𝑌 𝑍 = 1 − 𝐸[𝑌|𝑍 = 0] 𝐸 𝐴 𝑍 = 1 − 𝐸[𝐴|𝑍 = 0] • アドヒアランスが完全であるとき – 𝐸 𝐴 𝑍 =1 −𝐸 𝐴 𝑍 =0 =1 – 𝐸 𝑌 𝑎=1 − 𝐸 𝑌 𝑎=0 = 𝐸 𝑌 𝑍 = 1 − 𝐸[𝑌|𝑍 = 0] • アドヒアランスが不完全であるとき – 分母の値が0に近づく – 𝐸 𝑌 𝑎=1 − 𝐸 𝑌 𝑎=0 > 𝐸 𝑌 𝑍 = 1 − 𝐸 𝑌 𝑍 = 0 (不良の程度が大きくなるほど乖離) 14

16.

2SLS • Standard IV estimator – usual IV estimandの分母と分子の推定値の比 – それぞれの推定値は4つの標本平均𝐸෠ 𝑌 𝑍 = 1 , 𝐸෠ 𝑌 𝑍 = 0 , 𝐸෠ 𝐴 𝑍 = 1 , 𝐸෠ 𝐴 𝑍 = 0 を計算する ことで得られる • 分母・分子における差にそれぞれsaturatedな線形モデルをあてはめることでも同等に standard IV estimatorを計算可能 – 分母:𝐸 𝐴 𝑍 = 𝛼0 + 𝛼1 𝑍 – 分子:𝐸 𝑌 𝑍 = 𝛽0 + 𝛽1 𝑍 15

17.

2SLS • Two-stage-least-squares estimator(2SLS estimator, 2段階最小二乗推定量) – 1st stage • 治療に対するモデル𝐸 𝐴 𝑍 = 𝛼0 + 𝛼1 𝑍のあてはめ • 各被験者の推定値𝐸෠ 𝐴 𝑍 を得る – 2nd stage • アウトカムに対するモデル𝐸 𝐴 𝑍 = 𝛽0 + 𝛽1 𝐸෠ 𝐴 𝑍 のあてはめ • 推定されるパラメータ 𝛽መ1 (2LSL estimate)はstandard IV estimateと常に一致 – standard IV estimatorはIV estimand( 𝐸 𝑌 𝑎=1 − 𝐸 𝑌 𝑎=0 )と一致するため 因果効果を算出可能 • 証明に関しては次回以降紹介 16