バリデーション研究の⼊⾨

2.9K Views

May 24, 22

スライド概要

profile-image

一般社団法人臨床疫学研究推進機構

シェア

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

バリデーション研究の⼊⾨ 奥村泰之 公益財団法⼈ 東京都医学総合研究所 精神⾏動医学研究分野 ⼼の健康プロジェクト 臨床疫学研究における報告の質向上のための統計学の研究会 第35回研究集会 2019/9/7 (⼟) 13:15~14:25 東京医科⻭科⼤学

2.

発表の構成 はじめに 研究デザイン 主要4指標の計算と例数設計 予測モデルに基づく⽅法 誤分類の種類 適格基準に関する誤分類の影響 ⾮差異的誤分類によるバイアス 差異的誤分類によるバイアス 2

3.

データベース研究,腸切除術施⾏患者に 対するアルビモパン処⽅の有⽤性 Steele SR et al: Dis Colon Rectum. 2018 Dec;61(12):1418-1425. 3

4.

データベースによりPECO+Cを特定 注. ⼀般に⾚字の精度は⻘字よりも悪い Patient: 腸切除術を受けた18歳以上 Exposure: アルビモパン処⽅あり Control: アルビモパン処⽅なし Outcome: 術後の病態 Covariate: 年齢,性別,⼈種,保険者 Steele SR et al: Dis Colon Rectum. 2018 Dec;61(12):1418-1425. 4

5.

術後の病態の定義 注. ⼀般に⾚字の精度は⻘字よりも悪い 病名 種類 ICD-9-CM ⿇痺性腸閉塞 診断 560.1 腸閉塞 診断 537.3, 552.3, 560.81, 560.89, 560.9, 777.1 ⾮経⼝栄養 診療⾏為 99.15,96.6 術後の経⿐胃管 診療⾏為 96.07 胃痛 診断 787.3 Steele SR et al: Dis Colon Rectum. 2018 Dec;61(12):1418-1425. 5

6.

誤分類(misclassification) カルテ等における 定義 インデックス 検査 (index test) 参照基準 (reference standard) 陽性 陰性 陽性 A (真陽性) C (偽陽性) 陰性 B (偽陰性) D (真陰性) データベースに おける定義 6

7.

誤分類は, 研究疑問の各要素で⽣じうる Patient: 腸切除術を受けた18歳以上 Exposure: アルビモパン処⽅ Outcome: 術後の病態 Covariate: 年齢,性別,⼈種,保険者 7

8.

⼀般的な誤分類の原因 ① 未受診 (例. 8割が未受診のADHD発症を特定) ② 診断・診療⾏為の不正確な記録 (例. 保険病名における統合失調症) ③ 診断・診療⾏為を表現するのに不⼗ 分なコード (例. 包括算定における検査) ④ 保険外の診療 (例. ⾃由診療) Chubak J et al: J Clin Epidemiol. 2012 Mar;65(3):343-349. 8

9.

医薬品における誤分類の原因 保険対象外の医薬品(例. ⾃由診療・治験) 包括算定の医薬品 服薬アドヒアランスの不良 残薬の服⽤ 市販薬の服⽤ 9

10.

誤分類の定量化 =バリデーション研究 Patient: カナダのプライマリケア64施設の受診者 Index test: レセプト情報等のうつ病診断(ICD-10) Reference standard: カルテレビューのうつ病診断 参照基準 (reference standard) インデックス 検査 (index test) 陽性 陰性 陽性 A (真陽性) C (偽陽性) 陰性 B (偽陰性) D (真陰性) Doktorchik C et al: BMC Psychiatry. 2019 Jan 7;19(1):9. doi: 10.1186/s12888-018-1990-6 10

11.

3362例のコホート研究 35歳以上の プライマリケア受診者 無作為抽出 レセプト情報等による うつ病診断 カルテレビューによる うつ病診断 陽性 すべての参加者に 参照基準 陰性 Doktorchik C et al: BMC Psychiatry. 2019 Jan 7;19(1):9. doi: 10.1186/s12888-018-1990-6 11

12.

アルゴリズムの精度を⽐較 限定的な基準 陽性 陰性 適中率 適中率 インデックス検査 感度 特異度 1つの診療所で診断 79% 87% 55% 95% 2つの診療所で診断 64% 94% 68% 92% ⼊院で診断 5% 100% 76% 83% Doktorchik C et al: BMC Psychiatry. 2019 Jan 7;19(1):9. doi: 10.1186/s12888-018-1990-6 12

13.

研究デザイン 13

14.

診断精度研究,7つのデザイン ① 横断的コホート研究(cross-sectional cohort study) ② 包括的診断研究法(comprehensive diagnostic study design) ③ 層別抽出法(stratification design) ④ ⼆段抽出法(two-phase design) ⑤ 検査陰性症例の未確証法(comparing two tests without screened negative verification) ⑥ コホート内症例対照研究(nested case-control study) ⑦ 症例対照研究(two-gate case-control study) 医療データベースの バリデーション研究では あまり使われない Holtman GA et al: J Clin Epidemiol. 2019 May 28;114:38-48. 14

15.

①横断的コホート研究 連続登録の集団 インデックス検査 参照基準 陽性 すべての参加者に インデックス検査 すべての参加者に 参照基準 陰性 Wu JW et al: Pharmacoepidemiol Drug Saf. 2018 Oct 4. doi: 10.1002/pds.4641. Brooks GA et al: JCO Clin Cancer Inform. 2019 May;3:1-19. doi: 10.1200/CCI.18.00156. 15

16.

①’⾼リスク群に基づく⽅法* *横断的コホート研究の変法 ⾼リスク群の 連続登録の集団 すべての参加者に インデックス検査 インデックス検査 参照基準 陽性 すべての参加者に 参照基準 陰性 Brandenburg NA et al: Pharmacoepidemiol Drug Saf. 2019 Feb;28(2):256-263. Culpepper WJ et al: Neurology. 2019 Mar 5;92(10):e1016-e1028. 16

17.

②包括的診断研究法 連続登録の集団 すべての参加者に インデックス検査 複数疾患のインデックス検査 複数疾患の参照基準 陽性 すべての参加者に 参照基準 陰性 Durand M et al: Pharmacoepidemiol Drug Saf. 2015 Sep;24(9):943-50. doi: 10.1002/pds.3808. Mu Y et al: PeerJ. 2018 Jul 27;6:e5284. doi: 10.7717/peerj.5284. 17

18.

③層別抽出法 連続登録の集団 ⾼リス ク群 低リスク群 低リスク群から少なめに 無作為抽出 ⾼リス ク群 低リスク群 インデックス検査 参照基準 陽性 陽性となるリスクの ⾼い群と低い群に層化 ⾼リスク群から 多めに無作為抽出 すべての抽出された参加者に インデックス検査 すべての抽出された参加者に 参照基準 陰性 Delate T et al: Cancer Epidemiol Biomarkers Prev. 2012 Apr;21(4):673-80. Kadhim-Saleh A et al: J Am Board Fam Med. 2013 Mar-Apr;26(2):159-67. 18

19.

層別抽出法における層の事例 研究 層 参照基準 [1] 年齢 (60歳以上 vs 60歳未満) 診療録における糖尿病,⾼⾎圧, 変形性関節症,COPD,うつ病の 診断 [2] 在院⽇数 (6⽇以上 vs 6⽇未満) ICUの利⽤ (利⽤ vs. 未利⽤) 診療録における敗⾎症の診断 [3] 虚⾎性⼼疾患の既往 (あり vs な し) 無症候性⼼筋梗塞の診断 [4] 来院時診断で肺動脈⾼⾎圧症の 疑い (あり vs なし) 肺動脈⾼⾎圧の診断 [1] Kadhim-Saleh A et al: J Am Board Fam Med. 2013 Mar-Apr;26(2):159-67. [2] Fleischmann-Struzek C et al: PLoS One. 2018 Jul 30;13(7):e0198847. [3] Obuchowski NA, Zhou XH: Biostatistics. 2002 Dec;3(4):477-92. [4] Papani R et al: Pulm Circ. 2018 Apr-Jun;8(2):2045894018759246. 19

20.

③ʼAll possible casesに基づく⽅法* *層別抽出法の変法 連続登録の集団 低リスク群 ⾼リスク群 低リスク群には 陽性がいないと仮定 陰性 参照基準 陰性 インデックス検査 Krysko KM et al: Mult Scler. 2015 Feb;21(2):217-24. Widdifield J et al: Mult Scler. 2015 Jul;21(8):1045-54. 陽性となるリスクの ⾼い群と低い群に層化 ⾼リスク群の 全例に参照基準 陽性 すべての参加者に インデックス検査 20

21.

④⼆段抽出法 連続登録の集団 インデックス 検査陽性 すべての参加者に インデックス検査 インデックス検査陰性 すべての検査陽性の 参加者に参照基準 参照基準 陽性 陰性 検査陰性の参加者から 無作為抽出して参照基準 すべての抽出された 参加者に参照基準 Burke JP et al: Autism. 2014 Apr;18(3):321-30. Gruschow SM et al: J Atten Disord. 2016 Oct 1:1087054716672337. doi: 10.1177/1087054716672337. 21

22.

⑤検査陰性症例の未確証法 連続登録の集団 インデックス 検査陽性 すべての検査陽性の 参加者に参照基準 参照基準 陽性 すべての参加者に インデックス検査 インデックス検査陰性 すべての検査陰性の 参加者に参照基準の確証をしない 陰性 Green CA et al: Pharmacoepidemiol Drug Saf. 2017 May;26(5):509-517. doi: 10.1002/pds.4157. Gil M et al: Pharmacoepidemiol Drug Saf. 2019 Feb;28(2):209-216. doi: 10.1002/pds.4686. 22

23.

参照基準に関する情報源の事例 ⾼コスト 研究 情報源 参照基準 [1] 被保険者台帳 死亡による保険離脱 [2] がんの症例レジストリ 乳がんによる死亡 [3] 電⼦カルテ情報 糖尿病の診断 [4] コホート調査 ⾻折の診断 [5] 質問紙調査 うつ病による抗うつ薬の使⽤ [6] カルテレビュー 多発性硬化症の診断 [1] Reps JM et al: Drug Saf. 2019 May 3. doi: 10.1007/s40264-019-00827-0. [2] Langner I et al: BMJ Open. 2019 Jul 26;9(7):e026834. [3] Lipscombe LL et al: BMC Health Serv Res. 2018 May 2;18(1):316. [4] Wright NC et al: J Bone Miner Res. 2019 Jun 6. doi: 10.1002/jbmr.3807. [5] Havard A et al: Pharmacoepidemiol Drug Saf. 2019 Mar;28(3):354-361. [6] Culpepper WJ et al: Neurology. 2019 Mar 5;92(10):e1016-e1028. 23

24.

参照基準の測定が⾼コストかつ有病率が 低い場合の研究デザインの優先順位 順位 研究デザイン 1 ⼆段抽出法 2 検査陰性症例の未確証法 3 層別抽出法 Holtman GA et al: J Clin Epidemiol. 2019 May 28;114:38-48. コメント 必要症例数が⼤きく減るこ とは少ない 感度・特異度を求められな い 層ごとにインデックス検査 の精度が等しいという困難 な仮定が必要 24

25.

主要4指標の計算と例数設計 25

26.

指標 感度 特異度 陽性適中率 陰性適中率 26

27.

感度=病気ありを当てる割合 特異度=病気なしを当てる割合 参照基準 (reference standard) インデックス 検査 (index test) 陽性 陰性 陽性 A (真陽性) C (偽陽性) 陰性 B (偽陰性) D (真陰性) 感度 A/(A+B) 特異度 D/(C+D) 27

28.

陽性適中率=検査陽性の内,正しい割合 陰性的中率=検査陰性の内,正しい割合 参照基準 (reference standard) 陽性 インデックス 検査 (index test) 陽性 陰性 A (真陽性) B (偽陰性) 陰性 C (偽陽性) 陽性適中率 A/(A+C) D (真陰性) 陰性適中率 D/(B+D) 28

29.

指標の重要性, インデックス検査の使い⽅に依存 指標 インデックス検査の使い⽅ 感度  割合の⾼い曝露の定義 特異度  アウトカムの定義  割合の低い曝露の定義 陽性適中率  患者の選択基準 陰性適中率  患者の除外基準 Chubak J et al: J Clin Epidemiol. 2012 Mar;65(3):343-349 29

30.

Rによる4指標の計算* *横断的コホート研究の場合 epiR::epi.tests(dat) dat…分割表 4指標 Joseph RM et al: Pharmacoepidemiol Drug Saf. 2019 Feb;28(2):179-186. 30

31.

Rによる例数設計* *横断的コホート研究の場合 sample.se(se,p,L) se…感度 p…有病率 L…感度の信頼区間の幅 感度80%,有病率10%・5%・1%, 信頼区間の幅±10%における必要症例数 Hajian-Tilaki K: J Biomed Inform. 2014 Apr;48:193-204. 31

32.

標本抽出法により計算式は違う Obuchowski NA, Zhou XH: Biostatistics. 2002 Dec;3(4):477-92. 岩上ら: http://www.jspe.jp/committee/pdf/validationtrr120180523.pdf 32

33.

予測モデルに基づく⽅法 33

34.

予測モデルの構築事例 Patient: ⽶国の⺠間医療保険から離脱した⼈ Index test: 保険離脱1年以内のレセプト情報(2097変数) Reference standard: 離脱理由が死亡(vs 保険変更) Optum DOD (⺠間保険) n=1,000,000 n=390076 外的妥当性の検討 Medicare (公的保険) n=457,359 Medicaid (公的保険) n=290,859 MarketScan (⺠間保険) n=410,238 Reps JM et al: Drug Saf. 2019 May 3. doi: 10.1007/s40264-019-00827-0. 34

35.

モデル構築の流れ 変数選択(88514変数→2097変数) 年齢,⼊院歴,循環器 病・がんの診断など モデル推定 (ロジスティック回帰分析) モデルの評価(AUC) 予測値の値ごとの診断精度 (感度/特異度) 外的妥当性の評価(AUC) Reps JM et al: Drug Saf. 2019 May 3. doi: 10.1007/s40264-019-00827-0. 予測値 感度 特異度 >0.9 26% 100% >0.5 62% 99% >0.1 90% 98% 35

36.

予測モデルの利点 多数の説明変数を重みづけながら, インデックス検査の定義を機械的に 決められる 診断精度の向上につながる Beachler DC et al: Pharmacoepidemiol Drug Saf. 2019 Feb;28(2):171-178. 36

37.

予測モデルにおけるインデックス検査と 参照基準の事例 研究 インデックス検査 (抜粋) 参照基準 [1] 保険離脱⽇から1年以内の⼊院歴,循 保険の離脱理由 (死亡 vs そ 環器病・がんの診断 の他) [2] 調査⽇から30⽇以内の三環系抗うつ 薬の処⽅,6か⽉以内の精神科利⽤ 抗うつ薬の処⽅理由 (うつ 病 vs その他) [3] 死亡⽇から28⽇以内の退院時の循環 器病診断,外来の循環器病診断 死亡の理由 (循環器病 vs そ の他) [4] 化学療法の開始⽇から前後3か⽉以内 肺がんの重症度 (ステージ の,肺切除術,放射線治療の状況, IV vs I~III) 外来受診回数 [1] Reps JM et al: Drug Saf. 2019 May 3. doi: 10.1007/s40264-019-00827-0. [2] Havard A et al: Pharmacoepidemiol Drug Saf. 2019 Mar;28(3):354-361. [3] Xie F et al: Pharmacoepidemiol Drug Saf. 2018 Jul;27(7):740-750. [4] Brooks GA et al: JCO Clin Cancer Inform. 2019 May;3:1-19. doi: 10.1200/CCI.18.00156. 37

38.

誤分類の種類 38

39.

双⽅向的誤分類(bi-directional misclassification) 陽性の⼈と陰性の⼈ 双⽅に誤分類が⽣じる 参照基準 (reference standard) インデックス 検査 (index test) 陽性 陰性 陽性 A (真陽性) C (偽陽性) 陰性 B (偽陰性) D (真陰性) Graham DJ, Smith CR: Am J Prev Med. 1988;4(2 Suppl):15-24. 39

40.

単⽅向的誤分類(uni-directional misclassification) 陽性の⼈だけに 誤分類が⽣じる (偽陰性) インデックス 検査 (index test) 参照基準 (reference standard) 陽性 陰性 陽性 A (真陽性) C (偽陽性) 陰性 B (偽陰性) D (真陰性) 参照基準 (reference standard) インデックス 検査 (index test) 陽性 陰性 陽性 A (真陽性) C (偽陽性) 陰性 B (偽陰性) D (真陰性) Graham DJ, Smith CR: Am J Prev Med. 1988;4(2 Suppl):15-24. 陰性の⼈だけに 誤分類が⽣じる (偽陽性) 40

41.

⾮差異的誤分類(non-differential misclassification) アウトカムの⾮差異的誤分類 アウトカムの感度と特異度は,曝露群と⾮ 曝露群との間で等しい 曝露の⾮差異的誤分類 曝露の感度と特異度は,アウトカムイベン トの発現群と未発現群との間で等しい Graham DJ, Smith CR: Am J Prev Med. 1988;4(2 Suppl):15-24. 41

42.

アウトカムの⾮差異的誤分類 曝露群 真の分布 ⾮曝露群 イベント数 全体 イベント数 全体 20 100 100 1000 感度=0.8; 特異度=1.0 感度=0.8; 特異度=1.0 参照基準 参照基準 (reference standard) インデック ス検査 (index test) 陽性 陰性 陽性 16 0 陰性 4 80 (reference standard) インデック ス検査 (index test) 陽性 陰性 陽性 80 0 陰性 20 900 42

43.

差異的誤分類(differential misclassification) アウトカムの差異的誤分類 アウトカムの感度と特異度は,曝露群と⾮ 曝露群との間で等しくない 曝露の差異的誤分類 曝露の感度と特異度は,アウトカムイベン トの発現群と未発現群との間で等しくない Graham DJ, Smith CR: Am J Prev Med. 1988;4(2 Suppl):15-24. 43

44.

アウトカムの差異的誤分類 曝露群 真の分布 ⾮曝露群 イベント数 全体 イベント数 全体 20 100 100 1000 感度=0.8; 特異度=1.0 感度=0.5; 特異度=1.0 参照基準 参照基準 (reference standard) インデック ス検査 (index test) 陽性 陰性 陽性 16 0 陰性 4 80 (reference standard) インデック ス検査 (index test) 陽性 陰性 陽性 50 0 陰性 50 900 44

45.

差異的誤分類の発⽣要因  医薬品の処⽅を受けている⼈は,医薬品の処⽅を受けて いない⼈と⽐べ,診察を受け続けているため,診断に関 するアウトカムが正確に記録されやすい[1]  有害事象のリスク増⼤が疑われる医薬品の処⽅を受けて いる⼈は,その他の医薬品の処⽅を受けている⼈と⽐ べ,検査頻度が上昇するため,有害事象の発現が正確に 記録されやすい[2]  慢性⾝体疾患を有する⺟親から⽣まれた⼦は,その他の ⼦と⽐べ,専⾨医による診察を受けやすいため,先天性 奇形の診断が正確に記録されやすい[3] [1] Cox E et al: Value Health. 2009 Nov-Dec;12(8):1053-61. [2] Funk MJ, Landi SN: Curr Epidemiol Rep. 2014 Dec;1(4):175-185. [3] Copeland KT et al: Am J Epidemiol. 1977 May;105(5):488-95. 45

46.

適格基準に関する誤分類の影響 46

47.

有病率×精度による選択基準の精度 有病率が低いと 特異度の影響が甚⼤ 感度の影響は⼩さい (特異度100%の場合は影響なし) 0.2 0.4 0.6 0.8 1.0 感度 (図左: 特異度99%,図右: 感度100%) Chubak J et al: J Clin Epidemiol. 2012 Mar;65(3):343-349 40 60 80 100 0.0 有病率 20 50% 10% 5% 1% 0.1% 0 20 50% 10% 5% 1% 0.1% 陽性適中率 (%) 80 60 40 有病率 0 陽性適中率 (%) 100 (例: ⼀般外来の統合失調症) 0.90 0.92 0.94 0.96 0.98 1.00 特異度 47

48.

有病率×精度による除外基準の精度 感度の影響は⼩さい 特異度の影響は⼩さい 0.0 0.2 0.4 0.6 0.8 1.0 感度 80 60 40 有病率 20 50% 10% 5% 1% 0.1% 0 20 50% 10% 5% 1% 0.1% 陰性適中率 (%) 80 60 40 有病率 0 陰性適中率 (%) 100 (感度100%の場合は影響なし) 100 (特異度100%の場合は影響なし) 0.0 0.2 0.4 0.6 0.8 1.0 特異度 (図左: 特異度99%,図右: 感度99%) Chubak J et al: J Clin Epidemiol. 2012 Mar;65(3):343-349 48

49.

有病率0.1%,感度50%の場合 有病率0.1%では代表性が微妙になる ➡有病率の低い病気を同定する研究への懸念 特異度 陽性適中率 100% 100% 99.9% 67% 99.5% 29% 99.0% 17% 98.0% 9% 95.0% 4% 49

50.

選択基準の誤分類は代表性の問題 全病床に占める有病率は 0.2%なので, 陽性適中率が悪いかも Patient: 過量服薬診断を有する⼊院 Exposure: 精神科コンサルあり Control: 精神科コンサルなし Outcome: 過量服薬による再⼊院 Okumura Y, Nishi D: Neuropsychiatr Dis Treat. 2017 Mar 2;13:653-665. 50

51.

適格基準の誤分類評価関数 ppp.npv(se, sp, p) se…感度 sp…特異度 p…有病率 感度90%,特異度90%, 有病率1・5・10%の場合に おける陽性・陰性適中率 Chubak J et al: J Clin Epidemiol. 2012 Mar;65(3):343-349 51

52.

⾮差異的誤分類によるバイアス 52

53.

曝露の精度によるバイアス 割合の⾼い曝露では 感度の影響が⼤きい 割合の低い曝露では 特異度の影響が⼤きい (例: ICUのせん妄, 外来⾼齢者のNSAIDs服⽤) 0.6 0.7 0.8 0.9 1.0 感度 -30 -20 -10 0 0.5 曝露の割合 -40 1% 10% 50% 80% -50 -40 1% 10% 50% 80% リスク比の減少率 (%) -10 -20 -30 曝露の割合 -50 リスク比の減少率 (%) 0 (例: ⼀般外来の統合失調症) 0.5 0.6 0.7 0.8 0.9 1.0 特異度 注) 真のリスク⽐が2.0で,曝露に⾮差異的誤分類が⽣じる場合 (図左: 特異度100%,図右: 感度100%) Chubak J et al: J Clin Epidemiol. 2012 Mar;65(3):343-349 53

54.

曝露の誤分類バイアス評価関数 exp.bias(p, se, sp, I.ctr, I.exp) p…曝露の割合 se…曝露の感度 sp…曝露の特異度 l.ctr…⾮曝露群におけるイベント発⽣率 I.exp…曝露群におけるイベント発⽣率 Chubak J et al: J Clin Epidemiol. 2012 Mar;65(3):343-349 54

55.

感度・特異度の合計が1以上の場合 曝露の割合10・30・50%, 感度50%,特異度100%, 真のリスク⽐2.0の場合における リスク⽐のバイアス 効果の⼤きさは1に近づく (bias toward the null) Chubak J et al: J Clin Epidemiol. 2012 Mar;65(3):343-349 55

56.

感度・特異度の合計が1未満の場合 曝露の割合10・30・50%, 感度20%,特異度60%, 真のリスク⽐2.0の場合における リスク⽐のバイアス 「感度+特異度<100%」の場合 効果の⽅向性が反対になりうる (switcheover bias) Chubak J et al: J Clin Epidemiol. 2012 Mar;65(3):343-349 56

57.

真のリスク⽐が1の場合 曝露の割合10・30・50%, 感度20%,特異度60%, 真のリスク⽐1.0の場合における リスク⽐のバイアス 効果の⼤きさ・⽅向性は変わらない (unbiased) 57

58.

アウトカムの精度によるバイアス 発⽣率の低いアウトカムでは 特異度の影響が甚⼤ 感度の影響は⼩さい (例: ⼀般外来の統合失調症) 0.2 0.4 0.6 0.8 50% 20% 10% 1% -40 -30 -20 -10 0 0.0 アウトカムの発生率 -50 -40 50% 20% 10% 1% リスク比の減少率 (%) -10 -20 -30 アウトカムの発生率 -50 リスク比の減少率 (%) 0 (特異度100%の場合は影響なし) 1.0 感度 0.90 0.92 0.94 0.96 0.98 1.00 特異度 注) 真のリスク⽐が2.0で,アウトカムに⾮差異的誤分類が⽣じる場合 (図左: 特異度99%,図右: 感度100%) Chubak J et al: J Clin Epidemiol. 2012 Mar;65(3):343-349 58

59.

曝露群のアウトカムの発⽣率0.1%, 真のリスク⽐2,感度50%の場合 発⽣率0.1%のアウトカムでは関連の検出が困難 ➡安全性を評価する研究への懸念 特異度 観察される リスク⽐ 100% 99.9% 99.5% 2.0 1.2 1.0 59

60.

低い有病率≠特異度100% 研究 患者 参照基準 N 有病率 感度 特異度 [1] 成⼈ 膵臓がん発症 1200万 0.1% 97.5% 99.8% [2] ⼩児 脳性⿇痺 16万 0.1% 65.5% 99.9% [3] ⼩児 糖尿病 26万 0.2% 94.2% 99.9% [1] Wu JW et al: Pharmacoepidemiol Drug Saf. 2018 Oct 4. [2] Oskoui et al: CMAJ Open. 2017 Jul 18;5(3):E570-E575. [3] Dart AB et al: Diabetes Care. 2011 Apr;34(4):898-903 60

61.

アウトカムの誤分類バイアス評価関数 out.bias(p, se, sp, I.ctr, I.exp) p…曝露の割合 se…アウトカムの感度 sp…アウトカムの特異度 l.ctr…⾮曝露群におけるイベント発⽣率 I.exp…曝露群におけるイベント発⽣率 Chubak J et al: J Clin Epidemiol. 2012 Mar;65(3):343-349 61

62.

感度・特異度の合計が1以上の場合 感度30%,特異度98%, 曝露の割合10%, 真のリスク⽐2.0の場合における リスク⽐のバイアス イベント発⽣率が低いと バイアスが⼤きい 62

63.

⾮差異的誤分類バイアスの特徴  多く場合に誤分類バイアスは,効果の⼤きさが1 に近づく(bias toward the null)[1]  精度が⾮常に悪い場合(感度+特異度<100%)の誤分 類バイアスは,効果の⽅向性が反対になる (switcheover bias)[1]  アウトカムの誤分類バイアスは,感度によるリ スク⽐への影響は⼩さいが,リスク差への影響 は⼤きい[2]  曝露が3⽔準以上の場合における曝露の誤分類バ イアスは,効果の⽅向性は,どちらにでもなる (bias in any direction)[2] Chen et al: Am J Public Health. 2013 May;103(5):e67-73. Funk MJ, Landi SN et al: Curr Epidemiol Rep. 2014 Dec;1(4):175-185. 63

64.

差異的誤分類によるバイアス 64

65.

真のオッズ⽐が>1の場合 種類 感度 特異度 バイアスの⽅向性 1 ⾮曝露群 < 曝露群 ⾮曝露群 = 曝露群 Bias in any direction 2 ⾮曝露群 = 曝露群 ⾮曝露群 > 曝露群 Bias in any direction 3 ⾮曝露群 > 曝露群 ⾮曝露群 = 曝露群 Swithover bias Bias toward the null 4 ⾮曝露群 = 曝露群 ⾮曝露群 < 曝露群 Swithover bias Bias toward the null 5 ⾮曝露群 > 曝露群 ⾮曝露群 < 曝露群 Swithover bias Bias toward the null 6 ⾮曝露群 < 曝露群 ⾮曝露群 > 曝露群 Bias in any direction 7 ⾮曝露群 < 曝露群 ⾮曝露群 < 曝露群 Bias in any direction 8 ⾮曝露群 > 曝露群 ⾮曝露群 > 曝露群 Bias in any direction Chen et al: Am J Public Health. 2013 May;103(5):e67-73. 65

66.

真のオッズ⽐が<1の場合 種類 感度 特異度 バイアスの⽅向性 1 ⾮曝露群 < 曝露群 ⾮曝露群 = 曝露群 Swithover bias Bias toward the null 2 ⾮曝露群 = 曝露群 ⾮曝露群 > 曝露群 Swithover bias Bias toward the null 3 ⾮曝露群 > 曝露群 ⾮曝露群 = 曝露群 Bias in any direction 4 ⾮曝露群 = 曝露群 ⾮曝露群 < 曝露群 Bias in any direction 5 ⾮曝露群 > 曝露群 ⾮曝露群 < 曝露群 Bias in any direction 6 ⾮曝露群 < 曝露群 ⾮曝露群 > 曝露群 Swithover bias Bias toward the null 7 ⾮曝露群 < 曝露群 ⾮曝露群 < 曝露群 Bias in any direction 8 ⾮曝露群 > 曝露群 ⾮曝露群 > 曝露群 Bias in any direction Chen et al: Am J Public Health. 2013 May;103(5):e67-73. 66

67.

真のオッズ⽐が1の場合 種類 感度 特異度 バイアスの⽅向性 1 ⾮曝露群 < 曝露群 ⾮曝露群 = 曝露群 Away from the null with OR >1 2 ⾮曝露群 = 曝露群 ⾮曝露群 > 曝露群 Away from the null with OR >1 3 ⾮曝露群 > 曝露群 ⾮曝露群 = 曝露群 Away from the null with OR <1 4 ⾮曝露群 = 曝露群 ⾮曝露群 < 曝露群 Away from the null with OR <1 5 ⾮曝露群 > 曝露群 ⾮曝露群 < 曝露群 Away from the null with OR <1 6 ⾮曝露群 < 曝露群 ⾮曝露群 > 曝露群 Away from the null with OR >1 7 ⾮曝露群 < 曝露群 ⾮曝露群 < 曝露群 Unbiased Away from the null 8 ⾮曝露群 > 曝露群 ⾮曝露群 > 曝露群 Unbiased Away from the null Chen et al: Am J Public Health. 2013 May;103(5):e67-73. 67

68.

バイアスの影響評価関数 bias.impact(mat, se.exp, se.ctr, sp.exp, sp.ctr)  mat…観察された (誤分類がある) 曝露とアウトカムの 分割表  se.exp…曝露群におけるアウトカムの感度の範囲  se.ctr…⾮曝露群におけるアウトカムの感度の範囲  sp.exp…曝露群におけるアウトカムの特異度の範囲  sp.ctr…⾮曝露群におけるアウトカムの特異度の範囲 Chen et al: Am J Public Health. 2013 May;103(5):e67-73. 68

69.

バイアスの影響評価関数 返り値  minimum…真の (誤分類がない) オッズ⽐の最⼩値  maximum…真のオッズ⽐の最⼤値  pattern…すべての感度と特異度の組み合わせでの,真 のオッズ⽐ Chen et al: Am J Public Health. 2013 May;103(5):e67-73. 69

70.

分割表の準備 バリデーション研究による情報 アウトカムの精度 (95%信頼区間) 曝露群の感度: 68~75% ⾮曝露群の感度: 61~65% 両群の特異度: 97~98% 交通事故の原因 (アウトカム) 年齢 (曝露) 薬物 薬物以外 若年層 575 3150 ⾼齢層 1315 11107 観察されたオッズ⽐ =1.53 Chen et al: Am J Public Health. 2013 May;103(5):e67-73. 70

71.

1つのパターンの場合 曝露群の感度75%・特異度98%, ⾮曝露群の感度61%・特異度97%, 観察されたオッズ⽐1.53の場合における, 真のオッズ⽐ Chen et al: Am J Public Health. 2013 May;103(5):e67-73. 71

72.

複数のパターンの場合 曝露群の感度68~75%・特異度97~98%, ⾮曝露群の感度61~65%・特異度97~98%, 観察されたオッズ⽐1.53の場合における, 真のオッズ⽐ Chen et al: Am J Public Health. 2013 May;103(5):e67-73. 72

73.

差異的誤分類バイアスの特徴 効果の⽅向性は,どちらにでもなる(bias in any direction) ⾮差異的誤分類の仮定から少し逸脱する だけで,⼤きなバイアスが⽣じることが ある Chubak J et al: J Clin Epidemiol. 2012 Mar;65(3):343-349. 73

74.

本資料のRプログラム Yasuyuki Okumura: http://rpubs.com/yachu93/523989 74

75.

Take Home Messages 主要研究デザインは5種類 指標の重要性は研究疑問に依存 稀な疾患の同定は代表性に難あり 稀なイベントの関連は検出困難 ⾮差異的誤分類の仮定は⾮現実的 差異的誤分類バイアスは厄介 75