Causal Inference: What If, Chapter 16 ②

544 Views

February 09, 23

スライド概要

『Causal Inference: What If』のChapter16 (Instrumental variable estimation) の16.3, 16.4節の内容です。操作変数法によって点推定を行う際に成立が必要となるhomogeneity(同質性) / monotonicity(単調性)について主に解説を行っています。

profile-image

現在は東京医科大学大学院医学研究科修士課程(https://tmu-hds.com/)に在籍しています。 生物統計学 、統計的因果推論を専攻しており、学習・研究にあたって作成した一部の資料を公開しています。 スライドについては不定期で修正を行っておりますのでご注意ください。 またWhat Ifに関連した内容についてはブログで詳しい説明を行っています。

シェア

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

Causal Inference: What If Chapter 16: Instrumental variable estimation ② Miguel A. Hernán and James M. Robins 鈴木 徳太 ※2023年1月14日更新版をもとに作成しています

2.

Agenda 16.3 A fourth identifying condition: homogeneity T.P. 16.3 Additive structural mean model and IV estimation T.P. 16.4 Multiplicative structural mean model and IV estimation T.P. 16.5 Proof of the homogeneity condition 16.4 An alternative identifying condition: monotonicity T.P. 16.6 More general structural mean model 2

3.

A fourth identifying condition: homogeneity IV estimandが平均因果効果に一致するためには操作変数の3条件では不十分 ! "|$%& '! "|$%( ! )|$%& '! )|$%( 𝐸 𝑌 *%& − 𝐸 𝑌 *%( : usual IV estimand for a dichotomous instrument : ATE on the additive scale Effect homogeneity(効果の同質性)が第4の条件として必要 歴史に登場した順にhomogeneityの4つのバージョンを紹介 3

4.

Some versions of homogeneity ① 個人間で因果効果が一定 二値アウトカムについてはsharp causal null もしくは universal harm(benefit) Additive rank preservation(14.4節)と同義であり、ほとんどの治療とアウトカムに 関して成立しない e.g.) 禁煙が体重変化に及ぼす因果効果 全員の体重変化が2.4kgであることを要求するが非現実的 4

5.

Some versions of homogeneity ② 治療群と対照群における平均因果効果が𝑍の水準間で等しい 𝐸 𝑌 *%& − 𝑌 *%( 𝑍 = 1, 𝐴 = 𝑎 = 𝐸 𝑌 *%& − 𝑌 *%( 𝑍 = 0, 𝐴 = 𝑎 for 𝑎 = 0, 1 Additive scale 𝐸 𝑌 *%& − 𝑌 *%( 𝑍 = 1, 𝐴 = 𝑎 − 𝐸 𝑌 *%& − 𝑌 *%( 𝑍 = 0, 𝐴 = 𝑎 = 0 for 𝑎 = 0, 1 Technical Point 16.3にて利用 Additive scale ! " !"# '" !"$ |$%&, )%* ! " !"# '" !"$ |$%(, )%* =1 Technical Point 16.4にて利用(usual IV estimandとは異なるIV estimandを導く) 5

6.

Some versions of homogeneity ③ 交絡因子𝑈がadditive effect modifierではない 未測定の交絡因子𝑈の各水準における、𝐴の𝑌への平均因果効果が等しい 𝐸 𝑌 *%& |𝑈] − 𝐸[𝑌 *%( 𝑈 = 𝐸 𝑌 *%& − 𝐸[𝑌 *%( ] 効果修飾因子である未測定の交絡因子が存在している可能性 e.g.) 禁煙が体重変化に及ぼす因果効果 以前の喫煙強度が効果修飾因子 / 未測定の交絡因子である可能性 Hernán and Robins (2006b) additive effect modifierである𝑈が存在する場合には、②のadditive homogeneityの成立を想定 することが非合理的であることを示している 6

7.

Some versions of homogeneity ④ additive scaleでの𝑍と𝐴の関連が未測定の交絡因子𝑈の水準間で等しい 𝐸 𝐴|𝑍 = 1, 𝑈 − 𝐸 𝐴 𝑍 = 0, 𝑈 = 𝐸 𝐴|𝑍 = 1 − 𝐸 𝐴 𝑍 = 0 ③、④のhomogeneityは以下のより一般的な条件の特殊なケース 𝑒(𝑈) ≡ 𝐸 𝑌 *%& − 𝑌 *%( 𝑈 : 𝐴の𝑌への平均因果効果に対する𝑈による効果修飾 𝑡(𝑈) ≡ 𝐸 𝐴|𝑍 = 1, 𝑈 − 𝐸 𝐴 𝑍 = 0, 𝑈 : 𝑍と𝐴の関連に対する𝑈による加法的な効果修飾 𝑒(𝑈)と𝑡(𝑈)が相関しない (i.e., 𝐶𝑜𝑣 𝑒 𝑈 , 𝑡 𝑈 ¡ ¡ = 0) ③は𝑒(𝑈)を定数、④は𝑡(𝑈)を定数とした場合であり、定数との共分散は常に0であるため一般化可能 後者にはWang and Tchetgen Tchetgen(2018)で導入、証明が行われた(Technical Point 16.5参照) 7

8.

Alternative approaches of homogeneity 多くの場面でhomogeneityの成立は非現実的であり、次の2つのアプローチが提案 されている ① IV推定のモデルにベースライン共変量を組みこむ 2SLS推定量よりもパラメトリックな仮定が少ないstructure mean model(構造平均モデル)を 用いる方が無難 共変量をモデルに入れる(共変量の水準間での治療効果に制約を置く)ことで、治療群における 治療効果が𝑍によって変化することを表現可能 ② 異なる仮定をhomogeneityの代わりに用いる 16.3節:monotonicity(単調性) 8

9.

Technical Point 16.3 Additive structural mean model and IV estimation 二値の治療𝐴、操作変数𝑍に対する以下のsaturatedな加法構造平均モデルを考える 𝐸 𝑌 &'( − 𝑌 &') 𝐴 = 1, 𝑍 = 𝛽) + 𝛽(𝑍 ↔ 𝐸 𝑌 − 𝑌 &') 𝐴, 𝑍 = 𝐴 𝛽) + 𝛽(𝑍 𝛽) : 𝑍 = 0である治療群における治療の平均因果効果 𝛽) + 𝛽(: 𝑍 = 1である治療群における治療の平均因果効果 𝛽& : 𝑍による加法的な効果修飾を意味 事前に加法的な効果修飾がないとすると𝛽& = 0であり、 𝛽( はusual IV estimandとなる(Robins 1994) usual IV estimandは、 𝑍による効果修飾がない場合の治療群における治療効果に対する 加法構造平均モデルのパラメータ(証明は次スライド) 9

10.

Technical Point 16.3 𝑍が操作変数であるとき、 𝐸 𝑌 &') 𝑍 = 1 = 𝐸 𝑌 &') 𝑍 = 0 (∵ condition (ii), 𝑌 & ∐𝑍) ここで前述の構造モデルの下でこれは𝐸 𝑌 − 𝐴 𝛽( + 𝛽& 𝑍 = 1 = 𝐸 𝑌 − 𝐴𝛽( 𝑍 = 0 これを𝛽& = 0とし、𝛽( について解くことで以下を得る 𝐸 𝑌|𝑍 = 1 − 𝐸 𝑌|𝑍 = 0 𝛽) = 𝐸 𝐴|𝑍 = 1 − 𝐸 𝐴|𝑍 = 0 𝛽( = 0とした理由 𝛽& ≠ 0とすると方程式1つに対し未知パラメータが2つ 𝛽( , 𝛽& となり識別不可 ¡ ATEの推定に操作変数の3条件だけでは不十分な理由 検証不可能な仮定 10

11.

Technical Point 16.3 ここまでの結果から 𝛽) = 𝐸 𝑌 &'( − 𝑌 &') 𝐴 = 1, 𝑍 = 𝑧 = 𝐸 𝑌 &'( − 𝑌 &') 𝐴 = 1 1つ目の等式は加法構造平均モデル(𝛽& = 0は任意の指定)、2つ目の等式は𝑌 * ∐𝑍による これが𝐸[𝑌 &'( − 𝑌 &')]となるには治療𝐴と潜在アウトカム𝑌 & の独立性が必要 𝐸 𝑌 *%& − 𝑌 *%( 𝐴 = 1 = 𝐸 𝑌 *%& − 𝑌 *%( 𝐴 = 0 = 𝐸[𝑌 *%& − 𝑌 *%( ]が追加で必要 検証不可能な仮定 結論 𝛽( はusual IV estimandである、研究集団における平均因果効果𝐸[𝑌 *%& − 𝑌 *%( ] 治療群と非治療群で治療効果が等しいことを追加で仮定する必要 𝐴 = 0の構造モデルにおける𝑍のパラメータも0であることを意味(検証不可能な仮定) 11

12.

Technical Point 16.4 Proof of the homogeneity condition 二値の治療𝐴に対する以下のsaturatedな乗法(log-liner)構造平均モデルを考える 𝐸 𝑌 &'(|𝐴 = 1, 𝑍 = exp(𝛽) + 𝛽(𝑍) &') 𝐸𝑌 |𝐴 = 1, 𝑍 ↔ 𝐸 𝑌 &'(|𝐴, 𝑍 = 𝐸 𝑌 &')|𝐴, 𝑍 exp[𝐴 𝛽) + 𝛽(𝑍 ] 二値アウトカム𝑌に対しては、exp(𝛽))は𝑍 = 0である治療群における因果リスク比、 exp(𝛽) + 𝛽()は𝑍 = 1である治療群における因果リスク比 𝛽& は𝑍による乗法的な効果修飾を定量化 12

13.

Technical Point 16.4 𝛽( = 0、 非治療群における𝑍による乗法的な効果修飾がないと仮定した場合 Multiplicative scaleでの因果効果(リスク比) ¡ ! " !"# ! " !"$ = exp(𝛽( ) additive scaleでの因果効果(リスク比): ¡ 𝐸 𝑌 !"# − 𝐸 𝑌 !"$ = 𝐸 𝑌 𝐴 = 0 1 − 𝐸 𝐴 exp 𝛽$ − 1 + 𝐸[𝑌|𝐴 = 1]𝐸[𝐴][1 − exp −𝛽$ ] 証明についてはRobins (1989)、Hernán and Robins (2006b)を参照 治療群、非治療群に乗法的な効果修飾がない乗法構造平均モデルを仮定すると平均 因果効果𝐸 𝑌 &'( − 𝐸 𝑌 &') は識別されるが、usual IV estimatorと等しくならない 13

14.

Technical Point 16.4 結果として、𝐸 𝑌 &'( − 𝐸 𝑌 &') の推定値は、存在しないと仮定する𝑍による効果修飾 が乗法的であるか加法的であるかに依存する サンプルサイズが無限であってもどちらが正しいかを判断することはできない(Robins 1994) Saturatedな加法 / 乗法構造平均モデルを考えた場合、未知パラメータの個数が方程式よりも 多くなり識別不可であるため Homogeneityといったモデリングの仮定が置かれる理由 14

15.
[beta]
Technical Point 16.5
Proof of the homogeneity condition
Figure16.1のDAGとgeneral homogeneity condition 𝐶𝑜𝑣 𝑒 𝑈 , 𝑡 𝑈

= 0)の下での

9 :|;'( <9 :|;')

𝐸 𝑌 &'( − 𝑌 &') = 9 =|;'( <9 =|;') の証明
𝐸 𝑒 𝑈 = 𝐸 𝑌 *%& − 𝑌 *%(
𝐸 𝑡 𝑈 = 𝐸 𝐴 𝑍 = 1 − 𝐸[𝐴|𝑍 = 0] (∵ 𝑈∐𝑍)

General homogeneity 𝐶𝑜𝑣 𝑒 𝑈 , 𝑡 𝑈

= 0)

𝐸 𝑒 𝑈 𝑡 𝑈 /{𝐸 𝐴 𝑍 = 1 − 𝐸[𝐴|𝑍 = 0]} = 𝐸 𝑌 *%& − 𝑌 *%( を意味
この等号成立には𝐸 𝑌 𝑍 = 1 − 𝐸 𝑌 𝑍 = 0 = 𝐸 𝑒 𝑈 𝑡 𝑈 を示す必要
このために、 𝑌 = 𝐴 𝑌 *%& − 𝑌 *%( + 𝑌 *%( と表記する
15

16.

Technical Point 16.5 Figure 16.1においては𝑌 & ∐(𝐴, 𝑍)かつ𝑈∐𝑍であるから以下が成立する 𝐸 𝑌𝑍 => > > 𝐸 𝑌 𝐴 = 𝑎, 𝑍, 𝑈 = 𝑢 𝑃𝑟 𝐴 = 𝑎 𝑍, 𝑈 = 𝑢 𝑓(𝑢|𝑍) &'{),(} = > 𝐸 𝑌 &'( − 𝑌 &') 𝑈 = 𝑢 𝑃𝑟 𝐴 = 1 𝑍, 𝑈 = 𝑢 + 𝐸 𝑌 &') 𝑈 = 𝑢 𝑓(𝑢) > したがって 𝐸 𝑌 𝑍 =1 −𝐸 𝑌 𝑍 =0 = 𝐸[{𝐸 𝑌 &'( − 𝑌 &') 𝑈 }{𝑃𝑟 𝐴 = 1 𝑍 = 1, 𝑈 − 𝑃𝑟 𝐴 = 1 𝑍 = 0, 𝑈 }] 16

17.

Agenda 16.3 A fourth identifying condition: homogeneity T.P. 16.3 Additive structural mean model and IV estimation T.P. 16.4 Multiplicative structural mean model and IV estimation T.P. 16.5 Proof of the homogeneity condition 16.4 An alternative identifying condition: monotonicity T.P. 16.6 More general structural mean model 17

18.

An alternative identifying condition: monotonicity 二重盲検プラセボ対照ランダム化試験 𝑍 : ランダム割付変数(1: 治療群, 0: プラセボ群) 𝐴 : 実際に受けた治療変数(1: 治療あり, 0: 治療なし) 𝑌 : アウトカム 𝑈 : 𝐴と𝑌に影響を及ぼす全ての因子(未測定因子含む) Counter factual variable 𝐴B 𝐴,%& :治療群に割り当てられた場合(𝑧 = 1)の反事実治療 𝐴,%( :対照群に割り当てられた場合(𝑧 = 0)の反事実治療 𝐴B のパターンから各被験者を4つのグループに分類可能 18

19.

Classification of Individuals Always takers • 割付に関わらず常に治療 を受ける人 • 𝐴%"# = 1 • 𝐴%"$ = 1 Compliers / Cooperative • 割付を遵守する人 • 𝐴%"# = 1 • 𝐴%"$ = 0 Defiers / Contrarians Never takers • 割付と逆のことをする人 • 𝐴%"# = 0 • 𝐴%"$ = 1 • 割付に関わらず常に治療 を受けない人 • 𝐴%"# = 0 • 𝐴%"$ = 0 19

20.

Classification of Individuals 一般には前述の部分集団の識別は不可 𝑍 = 1かつ𝐴 = 1のとき:Always takers / Compliers 𝑍 = 0かつ𝐴 = 0のとき:Defiers / Never takers 𝑍=0 𝑍=1 𝐴=1 𝐴=0 𝐴=1 Always takers Compliers 𝐴=0 Defiers Never takers 20

21.

Monotonicity Defiersが存在しない場合の𝑍と𝐴の(関数)関係 Always takers Compliers 変化なし:Always taker, Never taker 増加 :Complier monotonicity(単調性)が成立 一般的なmonotonicityの定義 全ての個人について𝐴,%& ≧ 𝐴,%( が成立すること 連続なcausal instrument 𝑈, に対しては𝐴-% が 非減少関数となること Never takers 21

22.

Usual IV estimand under the new assumptions 以降で成立を仮定する条件 i. ii. iii. iv. 𝑍 is associated with 𝐴 𝑍 does not affect 𝑌 except through its potential effect on 𝑌 𝑍 and 𝑌 do not share causes monotonicity Three instrumental conditions 第4の条件をmonotonicityとした場合のusual IV estimand 集団全体に対する平均因果効果に一致しない ¡ & '|)"# *& '|)"$ & +|)"# *& +|)"$ ≠ 𝐸 𝑌 !"# − 𝐸 𝑌 !"$ Compliersにおける平均因果効果に一致 ¡ & '|)"# *& '|)"$ & +|)"# *& +|)"$ = 𝐸 𝑌 !"# − 𝑌 !"$ |𝐴%"# = 1, 𝐴%"$ = 0 22

23.

Usual IV estimand under the new assumptions 9 :|;'( <9 :|;') 9 =|;'( <9 =|;') = 𝐸 𝑌 &'( − 𝑌 &')|𝐴B'( = 1, 𝐴B') = 0 の証明の概要 分子:𝐸 𝑌|𝑍 = 1 − 𝐸 𝑌|𝑍 = 0 ¡ ¡ always taker, never taker におけるZのYへの効果はexactに0 Compliersにおける効果 分母: 𝐸 𝐴|𝑍 = 1 − 𝐸 𝐴|𝑍 = 0 ¡ 𝐸 𝐴|𝑍 = 1 = 𝑃𝑟 𝐴 = 1 𝑍 = 1 ¡ = 𝑃𝑟 𝐴𝑙𝑤𝑎𝑦𝑠 𝑡𝑎𝑘𝑒𝑟 + 𝑃𝑟[𝐶𝑜𝑚𝑝𝑙𝑖𝑒𝑟] 𝐸 𝐴|𝑍 = 0 = 𝑃𝑟 𝐴 = 1 𝑍 = 0 = 𝑃𝑟[𝐴𝑙𝑤𝑎𝑦𝑠 𝑡𝑎𝑘𝑒𝑟] ¡ 𝐸 𝐴|𝑍 = 0 − 𝐸 𝐴|𝑍 = 1 = 𝑃𝑟 𝐶𝑜𝑚𝑝𝑙𝑖𝑒𝑟 = 𝑃𝑟[𝐴,%& = 1, 𝐴,%( = 0] 詳細についてはTechnical Point 16.6を参照 23

24.

Usual IV estimand in observational studies 観察研究においてもdefiersが存在しない場合のcompliersにおける効果を推定可能 厳密には観察研究において治療割付は起きえないので、compliersもdefiersも存在しない Compliers:individuals with (𝐴,%& = 1, 𝐴,%( = 0) Defiers :individuals with (𝐴,%& = 0, 𝐴,%( = 1) e.g.) 禁煙が体重変化に及ぼす因果効果 Comliers: タバコの値段が高い州では禁煙し、安い州では禁煙しない人 Defiers : タバコの値段が安い州では禁煙し、高い州では禁煙しない人 24

25.

Homogeneity / Monotonicity homogeneityではなくmonotonicityを用いることは1990年代中盤に歓迎された Monotonicityの成立を認める方が現実的 推定対象は異なるが仮定の妥当性の観点から十分な対価 いくつかの理由で批判もされている ① ② ③ Compliersにおける効果の関連性 観察研究におけるmonotonicityの妥当性 集団の分割の正当性 25

26.

①The relevance of the effect in the compliers 母集団におけるcompliersの割合は計算可能だが、compliersは特定できず、 用いる操作変数や研究によってその割合は異なる 研究結果を利用することは困難 治療𝐴がcompliers(母集団の6%)において有益であると示唆される研究結果が得られたとき、治療 を集団全体に行うべきか? 現実にはcompliersの割合はもっと大きいかもしれないし、小さいかもしれない 集団の大部分がalways takersとnever takersであり、その部分集団対しては治療はそれほど有益 ではない場合には? 26

27.

②Monotonicity in observational studies 実験研究においてはmonotonicityを仮定することは比較的妥当だが、観察研究では しばしば妥当ではない e.g.) 異なる嗜好をもつ2名の医師が勤務するクリニックに通う患者の治療効果の推定 提案される操作変数:「医師の治療法に関する嗜好」 医師X (𝑍 = 1) • 治療の処方を好む • 糖尿病患者は例外(禁忌による) 医師Y(𝑍 = 0) • 治療の処方を好まない • 身体活動レベルが高い患者は例外 (利益による) 身体活動レベルが高く、糖尿病である患者はdefierとなる ¡ 複数の基準、多カテゴリの奨励によって治療が決定される場合にはmonotonicityが成立しにくい 27

28.

②Monotonicity in observational studies Figure 16.2, 16.3におけるsurrogate instrumentsでは 状況はより複雑になる Causal instrument 𝑈, が連続である場合、二値のsurrogate instruments を用いた標準的なIV estimandはcompliersにおける効果とはならない Causal instrument 𝑈% に単調性が成立していたとしても、提案した二値の操作変数 が治療𝐴に因果効果を持たない場合には、IV estimandをcompliersにおける効果 と解釈することは懐疑的 詳細についてはTechnical Point 16.7を参照 28

29.

③The validity of classification 母集団を前述の4つの部分集団に分割することが正当化されない場合がある 多くの場合compliersは定義が十分でない(ill-defined) e.g.) 複数の医師がいる状況で医師の嗜好を操作変数とした場合 ¡ ¡ 同じ嗜好レベルをもつ全ての医師が全く同じ方法で患者を扱う必要 非現実的であることに加え、医師と患者の対応関係が不明である多くの観察研究では本質的に定義不可 4つの部分集団への分割には以下の仮定も必要 1. 2. 3. Deterministic counterfactuals No interference Absence of multiple versions of treatment and other forms of heterogeneity 29

30.

Summary 2群かつ割付のコンプライアンスが完全(または全く守られない)な二重盲検ランダム化 試験において、興味の対象がcompliersにおける効果である場合にはmonotonicityを 仮定した議論は有望なアプローチ 特にいずれかの群が研究デザインによって完全なアドヒアランスとなる場合 Sommer and Zeger (1991), Imbens and Rubin (1997), Greenland (2000) 複雑な設定、観察研究で用いる場合には、真の操作変数を用いることができたとしても 注意が必要 30

31.

Technical Point 16.6 More general structural mean models 連続かつ(または)多変量である治療𝐴、操作変数𝑍、操作変数以前の共変量𝑉を許容 する 以下のような加法構造平均モデルを考える 𝐸 𝑌 − 𝑌 & 𝑍, 𝐴, 𝑉 = γ(𝑍, 𝐴, 𝑉; 𝛽) γ 𝑍, 𝐴, 𝑉; 𝛽 : 既知の関数 𝛽: 未知パラメータ γ 𝑍, 𝐴 = 0, 𝑉; 𝛽 = 0 31

32.

Technical Point 16.6 加法構造平均モデル 𝑍, 𝑉をもつ部分集団における、治療レベル0と比較した治療レベル𝐴の平均因果効果を表すモデル パラメータ𝛽 𝐸 𝑌 *%( 𝑍 = 1, 𝑉 = 𝐸[𝑌 *%( |𝑍 = 0, 𝑉]の仮定の下でg-estimationによって識別可能 一般乗法構造平均モデル(general multiplicative structural mean model) 𝐸 𝑌 𝑍, 𝐴, 𝑉 = 𝐸 𝑌 &') 𝑍, 𝐴, 𝑉 exp[γ 𝑍, 𝐴, 𝑉; 𝛽 ] γ 𝑍, 𝐴, 𝑉; 𝛽 : 既知の関数 𝛽: 未知パラメータ γ 𝑍, 𝐴 = 0, 𝑉; 𝛽 = 0 先程と同様に識別可能 32