医学研究の報告ガイドライン〜RCT (CONSORT 2025)と予測モデル (TRIPOD+AI)〜

1.6K Views

September 29, 25

スライド概要

医学研究の報告ガイドラインの意義,CONSORT 2025とTRIPOD+AIを網羅的に解説した資料です.

profile-image

生物統計学/疫学の方法論/長崎大学/ 医学系研究のデザインや統計のコンサルが得意です。 共同研究等やお仕事依頼はDMまたはメールをください。 現代疫学(監訳、学術図書出版社)。

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

各ページのテキスト
1.

久留 学バイオ統計フォーラム 医学研究の報告ガイドライン RCT (CONSORT 5 2 学病院臨床研究センター) 0 崎 2 大 長 大 米 佐藤俊太朗( )から予測モデル (TRIPOD+AI)

2.

2 研究の報告ガイドラインをご存じですか? CONSORT RCT STROBE 観察研究

3.

CONSORT CONSORT アップデート STROBE TRIPOD + AI TRIPOD 予測診断モデル SPIRIT SPIRIT RCT計画書 PRISMA システマティック レビュー アップデート 5 2 0 5 2 2 0 アップデート 2 3 研究の報告ガイドラインをご存じですか?

4.

CONSORT CONSORT STROBE TRIPOD + AI TRIPOD SPIRIT SPIRIT PRISMA STARD 診断検査 CHEERS 医療経済 5 2 0 5 2 2 0 ARRIVE 動物実験 2 非 4 研究の報告ガイドラインをご存じですか? • crossover trials クロスオーバー • cluster randomized trials クラスターRCT • randomized pilot and feasibility trials パイロット試験,フィージビリティ試験 • PRO 患者報告アウトカム • noninferiority and equivalence 劣性,同等性 • pragmatic trials プラグマティック試験 • RECORD DB研究 • TARGET target trial emulation • PRISMA-P システマティックレビュー計画 • MOOSE 観察研究のメタアナ

5.

• 研究は,今後数 年にわたり,さまざまな分野や背景を持つ 々によって活 される • 研究内容とその成果を 「誰もが」理解し,再現し,応 し,統合できるように記述するための推奨事項 • 研究結果の記述が容易になり,透明性の い研究は患者の治療成果向上につながる 執筆に有 • ガイドラインにしたがって書けば, もれなくダブりなく書ける のチェックに有 • 漏れやダブりを把握しやすい • 研究の調査をするときも, 用 内容を把握しやすい 高 用 用 用 十 文 • 0からも書きやすい • 他者も理解しやすい 論 人 論 文 5 研究報告ガイドラインとは何か?

6.

目 • 2つの 書で構成されることが多い • ガイドライン作成の流れと記載すべき項 のチェックリスト • 詳細な説明(explanation and elaboration) 文 6 ガイドラインの構成

7.

• 論 の要素ごとに記載すべきポイントをまとめている • 論 投稿時に提出が求められることがある 論 本 , 構成する要素 文 目 目 文 文 項 項 文 小 大 7 チェックリスト の中に がある 簡単な説明

8.

• 各要素について例 を し,詳細な説明を加えている 項 例 詳細な説明 文 文 比 示 用 比 示 文 文 大 比 示 文 献データベースにおいてランダム化 較試験の報告を特定できるかどうかは,その論 がどのようにindex付け られているかに きく依存する.indexの作成者は,著者がこの情報を明 的に記載していない場合,その論 を ランダム化 較試験として分類しない可能性がある.研究に適切なindexが付けられ、容易に識別できるようにす るため,著者は論 タイトルに「ranodmized」という語を使 し,被験者が 較する群に無作為に割り付けられ たことを すべきである. 目 文 8 詳しい説明(explanation and elaboration)

9.

記述 関連の探索 予測 因果推論 診断の性能評価 Descriptive Exploring associations Prediction Causal inference Evaluation of diagnostic performance アウトカムに影響する か? スタンダードの 法と 較して,新しい 法の 性能はどうか? 変数の分布は? アウトカムに関係して いる変数はどれ? アウトカムを予測する • CONSORT • SPIRIT • STROBE TRIPOD + AI 1 1 0 2 9 – 2 4 1 2 3 2 9 1 0 2 fi 方 方 Jan ; ( ): . • Hernán MA, Hsu J, Healy B. A Second Chance to Get Causal Inference Right: A Classi cation of Data Science Tasks. Chance. • Vittingho E, Glidden DV, Shiboski SC, McCulloch CE. Regression methods in biostatistics: linear, logistic, survival, and repeated measures models. Springer Science & Business Media; ff 比 9 どのガイドラインを使えば良い? .

10.

CONSORT CONSORT STROBE TRIPOD + AI TRIPOD SPIRIT SPIRIT PRISMA STARD 診断検査 CHEERS 医療経済 5 2 0 5 2 2 0 2 ARRIVE 動物実験 0 非 1 研究の報告ガイドラインをご存じですか? • crossover trials クロスオーバー • cluster randomized trials クラスターRCT • randomized pilot and feasibility trials パイロット試験,フィージビリティ試験 • PRO 患者報告アウトカム • noninferiority and equivalence 劣性,同等性 • pragmatic trials プラグマティック試験 • RECORD DB研究 • TARGET target trial emulation • PRISMA-P システマティックレビュー計画 • MOOSE 観察研究のメタアナ

11.

• Hopewell S, Chan A, Collins G S, Hróbjartsson A, Moher D, Schulz K F et al. CONSORT statement: updated guideline for reporting randomised trials BMJ doi: . /bmj- ; :e • Hopewell S, Chan A, Collins G S, Hróbjartsson A, Moher D, Schulz K F et al. CONSORT 5 5 5 2 2 2 0 0 0 2 2 3 2 2 1 1 8 0 9 8 3 5 2 0 2 4 2 1 1 8 0 4 2 0 2 3 2 1 1 6 8 3 0 1 4 1 2 0 0 1 2 4 2 6 1 3 1 1 8 1 0 0 1 9 8 explanation and elaboration: updated guideline for reporting randomised trials BMJ :e doi: . /bmj- 1 3 1 CONSORT ;

12.

Section/Topic No タイトルと構造化要旨 a 入 方 b 2 1 1 1 Title and Abstract Checklist item • Randomized trialとわかるように情報を れる • 試験デザイン, 法,結果,結論を体系的に要約する • CONSORT for abstractsというガイドラインもある

13.

Section/Topic Checklist item No • 試験を登録したレジストリ名,識別番号(URL付き), 試験情報の登録 および登録 付け • 研究計画書および(完全な)統計解析計画書に 研究計画書と統計解析計画書 アクセスできる場所 では統計解析計画書への • CONSOR 及はなかった • 個別の匿名化済み参加者データ(データ辞書を含む), 統計解析コード,およびその他の関連資料を どこでどのように取得できるかについての情報 で追加 • CONSOR データ共有 資 源と利益相反 • 資 源やその他の 援内容(例:薬剤の提供など), a および資 提供者が試験の設計 果たした役割 ・ 言 ・ ・ 支 5 0 2 1 日 0 0 2 2 金 金 金 金 実施 • 著者の 銭的およびその他の利益相反 b 3 5 5 4 3 2 1 Open science 解析 報告において

14.

Section/Topic Checklist item No • 科学的背景と研究の根拠 • 研究課題の重要性(既存のエビデンス状況において, 背景と研究の根拠 新たな試験がなぜ必要か?介 がどのように作 対照群の根拠,介 の利益と害の根拠, 関連する試験の系統的レビュー) 用 目 言 入 入 1 非 仮説検証をしたいのかも明らかにする • ICH E (R )流のEstimandへの 及もあるけど, 軽く触れている程度 9 するか? • 利益と害に関連する具体的な研究 的 • PICOTを含むようにする • 優越性, 劣性,同等性試験かどうかも明らかにする • 探索的(予備的)研究なのか, 的 4 7 目 6 1 Introduction

15.

Intervention To evaluate whether a structured exercise programme improved Comparator functional and health related quality of life outcomes compared with usual care for Outcome women at high risk of upper limb disability after breast cancer surgery. Participants 乳房癌 術後,上肢障害の 通常のケアと リスク 性を対象に,構造化された運動プログラムが 較して,機能的および健康関連の 活の質(QOL)アウトカムを改善したかどうか を評価する. 2 0 生 0 9 5 7 4 3 2 4 5 女 6 6 0 1 2 0 2 高 6 3 1 1 0 1 方 2 4 5 比 6 6 0 5 7 3 手 1 2 0 2 Bruce J, Mazuquin B, Canaway A, et al., Prevention of Shoulder Problems Trial (PROSPER) Study Group. Exercise versus usual care after non-reconstructive breast cancer surgery (UK PROSPER): multicentre randomised controlled trial and economic evaluation. BMJ ; :e . doi: . /bmjpmid: 5 1 目 的の書き (例)

16.

Section/Topic No Checklist item • 試験の設計,実施,報告における 患者 市 患者または 般市 の関与に関する詳細 • Patient and public involvement (PPI) • PPIが考慮されていない場合,考慮していないことを記載する 参画 • 試験デザインの詳細(例:並 群間 較試験,クロスオー 試験デザイン バー),割付 ,および試験の枠組み(例:優越性,同等性試, 劣性,探索的) • 試験開始後におこなわれた重要な変更事項(事前に規定されてい 研究計画書の変更 なかったアウトカムや解析を含む)とその理由 • 事前に規定しなかったアウトカムや解析についても書く • 試験を実施した場所(例:地域,病院)および 比 地域(例:国、試験実施施設)に関する情報 行 民 1 比 一 民 ・ 1 0 試験実施状況 6 1 1 非 9 8 1 Methods ( )

17.

Section/Topic No 参加者の適格基準 a b 介 Checklist item • 参加者の適格基準 • 該当する場合,実施施設および介 を実施する医療従事者 (例:外科医,理学療法 で追加 • CONSOR )の適格基準 • 再現可能な 分な詳細を記載した介 群と対照群 • 関連する場合,介 および対照群に関する追加資料 と対照 (例:介 の 順)の 法を記載 • 因果の識別条件の つである因果 致性にも関わる重要な項 • 事前に規定された主要評価項 および副次評価項 , 目 血 入 一 入 目 方 手 士 方 入 一 入 2 手 0 5 1 2 十 0 0 2 2 入 目 入 4 3 2 2 目 ならびに具体的な測定変数(例:収縮期 圧), 分析指標(例:ベースラインからの変化量,最終値,イベント発 までの時間),集計 法(例:中央値、割合),および各評価 項 の測定時点を明記 よりも明確になった • CONSOR アウトカム 7 生 1 1 1 1 1 Methods ( )

18.

レベル 単位 例 測定変数 個 LDLコレステロール 分析指標 個 LDLコレステロールのDay から変化量 集計 要約 LDLコレステロールのDay から変化量の平均 要約 1年 における LDLコレステロールのDay から変化量の平均 法 時点 Nicholls SJ, BROADWAY Investigators. Safety and ef cacy of obicetrapib in patients at high cardiovascular risk. N Engl J Med. Massachusetts Medical Society; 2025 Jul 3;393(1):51–61. PMID: 40337982 これは,統計解析のセクションで説明しても良い レベル 単位 例 測定変数 個 死亡 分析指標 個 - 集計 要約 死亡割合 要約 1年以内の死亡割合 法 方 fi 0 0 0 方 方 目 人 人 人 人 時点 8 1 アウトカムの考え

19.

検証的研究 • アウトカムに優先順位をつける • 主要評価項 (Primary outcome)は1つ • 副次評価項 (Secondary outcomes) • 主要評価項 をサポートする項 • 仮説検定(多重性の調整)の対象を Key secondaryということもある • 優先順位により,研究 順として をかける ところと, を抜くところをわける • 主要評価項 をベースにサンプルサイズ設計 手 目 目 目 手 目 目 目 目 目 手 目 をする 9 1 アウトカムには優先順位が必要か? 探索的研究 優先順位が決まらないなら探索的 • 評価項 に優先順位を設けなくて良い • 何が何でも主要評価項 を決めろという 査読者がいるので,緩くても優先順位が あるなら主要評価項 を定めても良い • 探索的研究により,注 すべき変数, 差が検出されやすい変数がわかる

20.

仮説検証型 仮説探索( 計画した仮説 仮説 解析 解析 結果 仮説 • 検証的研究 (Con rmatory / pivotal / de nitive study) • 明確に検証したい仮説がある • 検証するための情報が整っている 言 fi 用 • 結果の主張は強くできる 生 仮説 結果 解析 結果 仮説 報告 報告 fi 成)型 データ データ 0 2 検証的か?探索的か? • 探索的研究(explanatory study) • パイロット試験(pilot trial), フィージビリティ試験(feasibility trial) • 結果の主張は意識的に弱める • 「有効性(有 性)を検証する」とは • 仮説にあたりをつける • 研究がそもそも実施できるか検討する わない

21.

事な仮説が つに決まる 決まる 事なアウトカムが つに決まる 決まる 群を無作為に割付けられる(RCT) 割り付けられる 決まらない • これらを決める, 決まらない 集めるために探索的研究をする • 曖昧なまま無理して検証的研究をしない • 試験の実施に無理が じる できない • リクルートできない 統計的にサンプルサイズを • 主解析で統計的有意差が得られない 計算するための情報がある • アウトカムの尺度 • 群間差 • 群間差のばらつき ない • 統計的なサンプルサイズ設計は 情報がある 生 一 一 検証的研究 1 生 大 大 2 検証的研究の条件 探索的研究 物統計家にご相談を

22.

• 検証的研究をするための条件はシビア • 積極的に探索的研究をしよう • 検証的研究につなげるために,探索的研究をする 2 2 • 検証的研究と探索的研究がある

23.

statement: extension to randomised pilot and feasibility trials (2025)は検証的RCTのガイドライン • CONSORT • このガイドラインは探索的RCTのガイドライン • Title,introduction,サンプルサイズの考え ,書き に注意する • パイロット(pilot)と実施可能性(feasibility)の 2つの 語があるが,明確に区別していない • 検証的RCTが実現できるか知る,あるいは実現させる ための 規模RCTのことを指す 9 3 2 5 5 5 3 方 0 1 0 0 0 1 0 1 2 2 0 2 小 6 用 1 0 2 Eldridge, S. M., Chan, C. L., Campbell, M. J., Bond, C. M., Hopewell, S., Thabane, L., Lancaster, G. A., & PAFS consensus group. ( ). CONSORT statement: extension to randomised pilot and feasibility trials. BMJ , ,i . 3 方 2 CONSORT

24.

Section/Topic Checklist item No • 害を す情報(有害事象)の定義 法と評価 法 (例:体系的な 法 体系的な 法) で追加 • CONSOR • かなり細かく書くことが求められている 害 サンプルサイズ 無作為化,順序の a 成 なったすべての前提条件を記載 • 計算に いる群間差やばらつきには根拠をつける b a • 無作為割付の順序を 成した担当者と,その 法について 方 方 方 方 止 非 方 生 / 生 3 方 方 5 2 方 0 2 用 示 7 7 6 6 5 • サンプルサイズの決定 法,およびサンプルサイズ算出の根拠と • 中間解析の実施 法および中 基準について • 中間解析をする場合は細かく書く b 4 1 1 1 1 1 2 Methods ( ) • 無作為化の 法と,任意の制限事項(例:層別化,ブロック化, ブロックサイズなど)の詳細

25.

Section/Topic Checklist item No • 無作為化割付け順序を適 するために いた 法(例:中央コン 無作為化, 割付け隠蔽化の ピュータ/電話システム,連続番号が記載された不透明な密封容器 など),および介 が割り当てられるまで,その順序を隠蔽する ために実施した具体的な 順 • 要は割付けがばれない「仕組み」に焦点を当てている • 盲検化とは異なる 法 無作為化,実施 • 参加者を登録した担当者,および割り付けをおこなった担当者 法 が,ランダム割付け順序を閲覧 • 「 」に焦点を当てている 可能であったか否か • 介 の割り当て後にどの関係者が盲検化されたか(例:被験者, 盲検化 a 方 入 用 手 入 ・ 方 示 手 用 用 入 4 方 方 二 入 人 0 0 9 8 b 5 2 2 1 1 2 Methods ( ) 医療提供者,アウトカム評価者,データ解析者) • 「 重盲検」といった 語は誰が盲検化されたかわからないた め,誰が盲検化されたか明 する • 盲検化を実施した場合,その 法と介 内容の類似性についての 説明

26.

Standard CONSORT サンプルサイズの決定 法 Extension for pilot trials パイロット試験における 数の根拠 • パイロット試験に必要なサンプルサイズに関する推奨に焦点を当てた 法論の論 の多くは, パイロット試験の主な 的は,効果の きさとばらつきを推定し, 将来の検証的RCTのサンプルサイズ計算に役 てることであると想定している. • Since this was a pilot study, a sample size calculation was not performed. The researchers aimed for participants because it was felt this would be a large enough sample to inform them about the practicalities of delivering several self- management courses led by patients with COPD, recruitment, uptake, and attrition. • 本研究はパイロット研究であるため,サンプルサイズの算出は実施していない.研究者らは,COPD患者主導による複数の 管 理コースの実施可能性,参加者募集,参加状況,および脱落に関する知 を得るには120名の参加者数が適切であると判断し, この 数を 標とした。 己 自 7 0 2 1 文 方 2 1 0 2 5 見 9 6 方 – 7 8 6 3 0 6 2 ffi 6 大 立 Taylor, S. J. C., Sohanpal, R., Bremner, S. A., Devine, A., McDaid, D., Fernández, J.-L., Gri ths, C. J., & Eldridge, S. ( ). Selfmanagement support for moderate-to-severe chronic obstructive pulmonary disease: a pilot randomised controlled trial. The British Journal of General Practice: The Journal of the Royal College of General Practitioners, ( ), e e . 及 人 目 方 言 目 人 多いと思う CONSORTでも 6 2 探索的研究のサンプルサイズの考え |Methods (item a)

27.

1群のサンプルサイズ 標準化効果量δ (群間差/群間差の標準偏差) 常に 検証的RCTの検出 を80%にしたい場合 検証的RCTの検出 を90%にしたい場合 さい(δ < . ) さい( . ≦ δ < . ) 中ぐらい( . ≦ δ < . ) きい(δ ≧ . ) • 標準化効果量(群間差/群間差の標準偏差)の範囲は0〜1 • 標準化効果量は観察研究データから 積もりたい • 安に過ぎない • イベントの発 割合が1%なら少なくとも1群100例は必要(それでもイベント発 しないかも) 生 3 7 – 7 5 0 1 3 5 2 6 1 0 2 目 見 7 0 1 3 0 0 7 力 力 0 生 3 0 1 0 小 0 0 5 0 5 0 5 0 Whitehead AL, Julious SA, Cooper CL, Campbell MJ. Estimating the sample size for a pilot randomised trial to minimise the overall trial sample size for the external pilot and main trial for a continuous outcome variable. Stat Methods Med Res. Jun; ( ): . 7 1 1 大 1 1 2 2 小 7 5 非 目 2 パイロットRCTのサンプルサイズの 安

28.

Section/Topic Checklist item No • 主要評価項 および副次評価項 (有害事象を含む)について, 統計 法 群間 較に いた統計 法 • 事前に規定した解析と事後に規定した解析をわかるように書く • 必要あれば,多重性の調整 法も書く a • 各解析にどの参加者を含めるか(例:ランダム化された全参加 者),そしてその参加者をどちらの群で解析するかの定義 で追加 • CONSOR • 割り付けられた群の通りに解析するか,実際に受けた介 群で解 析するか考える b • 分析において 測データをどのように処理したか では項 体なかった • CONSOR • MethodsにもResultsにもDiscussionにも書く • 追加解析(例:サブグループ解析や感度解析)の実施 法,およ c 入 方 文 目 方 自 手 目 5 手 欠 0 5 1 2 用 目 0 0 2 2 比 手 1 1 1 1 方 び事前に規定されたものと事後解析を区別する 法について記載 • 感度解析は統計 法の仮定を変えた解析(例 を読むともう少し 広い意味で使っている) d 8 2 2 2 2 2 Methods ( )

29.

Section/Topic Checklist item No • 各群について,無作為割り付けを受けた参加者数,実際に介 を 参加者の流れ (フローチャートを含む) a 受けた参加者数,および主要評価項 数を記載 • フロー図を使う の解析対象となった参加者 • 各群について,無作為化後に発 した脱落症例数と除外理由を記 研究期間 a 十 示 目 止 生 示 日 示 1 3 3 2 2 b 載 • フロー図を使う • 理由として「研究計画書からの逸脱」では不 分 • 有益および有害性を すアウトカムに関する参加者の登録期間と 追跡期間を定義する 付 • 追跡期間は要約して す • 該当する場合,試験の終了,中 理由を す • 試験の早期終了の理由を透明性をもって報告することが重要 入 b 9 2 2 2 2 2 Results ( )

30.

Section/Topic Checklist item No • 実際に実施された介 および対照の具体的な内容.例えば,該当 実施された介 と対照 a b する場合には,誰が介 対照を実施したか,参加者のアドヒア ランス,介 が計画通りに実施されたか(フィデリティ:忠実 度)といった点を含む で追加 • CONSOR • 検証的試験の場合, いアドヒアランスが求められる • プラグマティック試験の場合,アドヒアランスは緩くて良いが, 状況の報告は必要 • 各群において試験期間中に受けた併 治療の内容 • 併 療法が試験結果に与えた影響を検討するために報告が必要 • 各群のベースライン時の 用 用 口 / 人 目 入 高 入 2 自 入 5 2 入 0 2 比 用 5 4 4 統計学的データと臨床的特徴を表に す • エビデンスを 施設や の前の患者さんに適 る • 群間 較で検定をしない ベースライン 0 示 2 2 2 3 Results ( ) できるか検討でき

31.

Section/Topic • 主要評価項 および副次評価項 ごとに、各群別に: • 分析対象となった参加者数 • アウトカム評価時点でデータが取得できた参加者数 • 各群の結果,および推定された効果の きさとその精度(95% 方 大 信頼区間など)を す • 値アウトカムの場合,絶対効果指標と相対効果指標の両 提 する 目 示 3 目 人 示 6 Checklist item No 解析された 数, アウトカム,推定 1 二 2 3 Results ( ) を

32.

要約統計量も報告 • 効果指標も報告 • 未調整,調整済み の推定値も報告 時点ごとに報告 Bruce J, Mazuquin B, Canaway A, et al., Prevention of Shoulder Problems Trial (PROSPER) Study Group. Exercise versus usual care after nonreconstructive breast cancer surgery (UK PROSPER): multicentre randomised controlled trial and economic evaluation. BMJ ; :e . doi: . / bmjpmid: • 相対指標と絶対指 標を報告 7 8 0 6 0 3 6 1 3 1 1 0 1 2 2 4 7 0 5 5 0 5 6 9 2 6 5 0 9 7 方 2 4 3 5 9 7 6 9 3 3 3 1 7 6 2 6 3 0 0 1 2 2 ffi 4 4 0 5 1 4 6 0 3 6 6 2 0 1 9 1 0 9 2 1 1 0 0 2 1 Sola A, Kurlat I, Pollak A, et al. Early versus delayed neonatal administration of a synthetic surfactant-the judgment of OSIRIS. The OSIRIS Collaborative Group (open study of infants at high risk of or with respiratory insu ciency--the role of surfactant. Lancet ; : - . doi: . / ( ) -V pmid: 2 3 表の作り

33.

Section/Topic No Checklist item • 各群で発 したすべての有害事象または予期せぬ事象 • すべての有害事象を表形式で報告する • 少なくとも,リスクにさらされている 数,死亡者数,有害事象 有害性 により試験を中 した参加者数,少なくとも1回以上の有害事象を 経験した参加者数を報告する • 事前に規定された分析と事後解析を区別し,サブグループ分析や 感度分析を含むその他の実施した分析 • サブグループ解析は,「サブグループ内で効果が有意であった か」,ではなく,「サブグループ間で効果に違いがあったか」検 討する 人 止 4 生 8 7 補助的解析 3 2 2 3 Results ( )

34.

Section/Topic Checklist item No • 結果の解釈はデータと整合性があり,利益と有害性のバランスを 0 9 限界 考慮し,さらに関連する他のエビデンスも考慮したものであるこ と • 都合の良い解釈をしない • 試験の限界点,潜在的なバイアスの原因,精度の問題, 般化可 能性,および関連する場合には多重解析の実施について記載 • 統計的有意性と臨床的重要性をわけて考える 一 解釈 4 3 2 3 Discussion

35.

Santesso N, Glenton C, Dahm P, Garner P, Akl EA, Alper B, et al. GRADE guidelines : informative statements to communicate the ndings of systematic reviews of interventions. J Clin Epidemiol. .のTable (本来,システマティックレビューの表現 Mar ; 効果が 介 曝露]に置き換 える い精度 きい : だけで参考になる) • Xを[処置 • reduce/increaseを推定値の 効果が中程度 向性に置き換える さいけど重要 • outcomeを具体的な 些細, 語に置き 換える さい,重要でない効果,または効果なし • 適宜,when compared with Yを 追加する(何と 中程度の精度 較したか) – 6 2 1 9 1 1 1 0 2 0 2 6 2 目 用 大 方 fi 用 比 ・ 1 入 ・ 小 大 5 likelyやprobably がつく 5 小 高 3 3 効果(関連)の きさと精度に着 して結果を書く(1)

36.

低い精度 mayがつく suggestを使う 目 大 とても低い精度 6 3 効果(関連)の きさと精度に着 して結果を書く(2)

37.

• Collins G S, Moons K G M, Dhiman P, Riley R D, Beam A L, Van Calster B et al. TRIPOD+AI statement: updated guidance for reporting clinical prediction models that use regression or machine learning methods BMJ ; :e doi: . /bmj- 8 7 3 8 7 0 3 2 1 0 1 2 6 3 1 1 0 1 日 8 7 3 8 7 0 5 8 3 4 2 0 2 • TRIPOD+AI Expandedチェックリスト 有志翻訳による 本語版 version. . 7 3 TRIPOD + AI

38.

• AIに特化したガイドラインではなく,従来から使われる回帰を いた予測モデル開発 検証も 含む ・ 用 言 5 1 用 0 用 2 目 言 • TRIPODのアップデート版 • 全部網羅するとかなりの分量になる.サプリを有効に使うと良いと思う • E&Eはまだ出ていない 版を使ってと っている • 公式もとりあえずTRIPOD • 規模 語モデル(LLM) のTRIPODもある • TRIPOD + AIでは,項 の適 対象がモデル開発(D)とモデル検証(E)にわかれる 8 大 3 ポイント

39.

No 適 D;E 要旨 D;E 用 タイトル 示 用 Section/Topic 9 2 1 3 Title, Abstract Checklist item • 研究が多変数(多変量)を いた予測モデルの開発もしくは性能評 価の研究であることを明確にし,対象となる集団と予測対象と なるアウトカムを明 すること • TRIPOD+AIのための要旨チェックリスト参照すること

40.

Section/Topic No Checklist item 適 • 既存のモデルを参照しながら,医療に関する背景(診断か予後 背景 a D;E 予測かどうかを含む)と予測モデルを開発または評価する根 拠 必要性を説明すること • 既存の予測モデルが利 可能な場合は、新しいモデルを開発す る明確な根拠を す • 予測モデルが診療プロセスのどの場 で使われるのかを説明 c D;E 方 用 面 用 目 • 社会 統計学的グループ間の既知の健康格差を明 すること • 研究の 的を具体的に述べること.これには,研究が予測モデ ルの開発なのか検証なのか(あるいはその両 門 D;E し,対象集団, 的,想定されるモデルの使 者(医療専 家,患者, 般市 など)を明確にすること • モデルが意図している 的を説明する.モデルがどのような臨 床的な判断や指針を補助することを意図しているか、診療プロ セスのどの時点でモデルを使 するか 示 b D;E 用 民 目 示 一 目 口 人 ・ 用 的 0 4 目 3 3 3 4 Introduction なのか)を含む

41.

Section/Topic No Checklist item 適 • 開発 と評価 のデータセットについて,それぞれのデータ データ a 参加者 ソース(例:無作為化試験,コホート, 常診療データ,レジ ストリデータ),およびそれらのデータを使う理由と代表性に ついて説明すること • データソースの説明は,すべてのデータセットについて,さら に開発 と評価 それぞれに対しておこなう D;E b • 参加者データの対象期間となる 時を明らかにすること.これ D;E a には,参加者の募集開始 の終了 も含む • 研究参加者の適格基準を説明すること • 参加者の適格基準は,予測モデルの適 可能性や 般化可能性 D;E 一 日 用 日 日 日 1 用 用 一 日 用 用 ,該当する場合は追跡期間 ダリケア, 般集団)を明らかにすること.これには,施設の 数や場所も含む を理解するために重要 用 と終了 • 研究の設定における重要な要素(例:プライマリケア,セカン D;E b 1 6 6 5 5 4 Methods ( )

42.

Section/Topic No Checklist item 適 • データの前処理と品質チェックについて説明すること.これに は,関連する社会 統計学的グループ間で同様の処理がおこ なわれているかどうかも含む • 特徴量エンジニアリング, データの変換,特徴量の削減,お よびデータの品質チェックなどを含むデータクリーニングの 順について説明する • データクリーニングに いたすべてのコードは公開する 手 D;E 生 用 口 人 2 用 データの準備 2 7 4 Methods ( )

43.

Section/Topic No Checklist item 適 • 予測対象となるアウトカムと予測の時間的範囲を明確に定義す D;E D;E 統計学的特徴について説明すること • 予測するアウトカムの評価における,盲検化について報告する D;E 方 一 3 口 人 用 c 格と こと 口 b • アウトカムの評価に主観的な解釈が必要な場合は,評価者の資 人 a ること.これには,アウトカムの評価 法と時期,このアウト カムを選択した根拠,およびアウトカムの評価 法が社会 統計学的グループ間で 貫しているかどうかを含む. • アウトカム予測の時間的範囲を報告する 方 アウトカム 3 8 8 8 4 Methods ( )

44.

Section/Topic No Checklist item 適 • はじめに候補として考えた予測因 の選択 法(例: 献,過 予測因 a D 去のモデル,利 可能なすべての予測因 )と,モデル構築前 の予測因 の事前選択について説明すること • モデル構築前に予測因 の事前選択をおこなった場合は、その 法を詳述 • 献?臨床?利 可能なデータ? • すべての予測因 を明確に定義し,測定 法や時期(およびア 子 方 方 子 D;E 子 子 子 子 子 3 口 用 用 子 人 子 子 子 用 c • 予測因 の測定に主観的な解釈が必要な場合は,予測因 の評 価者の資格と 子 D;E ウトカムや他の予測因 に対してある予測因 の評価をどのよ うに盲検化したか)を含めて説明すること • モデリングに含まれるすべての予測因 は,測定単位およびカ テゴリカルな予測因 のすべてのカテゴリとともに明確に定義 する 文 b 4 9 9 文 方 9 4 Methods ( ) 統計学的特徴について説明すること

45.

Section/Topic No Checklist item 適 • 研究の規模(サンプルサイズや施設数など)がどのように決定 サンプルサイズ D されたかを(開発と評価とでわけて)説明し,その規模が研究 疑問に答えるのに 分であることを す.サンプルサイズ計算 の詳細を含めること • 統計学的なサンプルサイズ計算をおこなわなかった場合(例: 利 可能なすべてのデータを使 した場合),データの規模が 研究疑問に答えるのに 分であったかどうかの妥当性を説明す る • 測データをどのように対処したのか説明すること.データを 除外した場合は,その理由を説明すること • 訓練データとテストデータを分けた場合は,別々に 測補完を する 欠 示 D;E 用 十 十 4 用 用 1 0 測データ 5 欠 1 欠 1 4 Methods ( )

46.

次の情報からサンプルサイズを計算 生 子 • 予測因 の数 • イベントの発 割合 • 予測誤差 6 4 サンプルサイズ

47.

Section/Topic No Checklist item 適 • データが分析でどのように使 されたか(例:モデルの開発と 分析 法 a D モデルの性能評価のため)を説明すること.必要なサンプルサ イズを考慮しながら,データの分割について説明すること • データ分割での内部検証はあまりすすめていない. • モデルの種類に応じて,予測因 が分析でどのように扱われた b c D D かを説明すること(関数形、再スケーリング、変換、または標 準化) • 連続データをカテゴリカルデータにしたり,カテゴリの統合を した場合は,説明する • モデルの種類,根拠[すべてのモデル構築アプローチで分けて], ハイパーパラメータ調整を含むすべてのモデル構築 び内部検証の 法を明記すること 順,およ • クラスター(例:病院、国)間でのモデルパラメータ値とモデ D;E ル性能の推定値の不均 性が考慮され,定量化された場合,そ の 法を説明すること • 追加の検討事項はTRIPOD-Clusterを参照せよ 手 子 用 一 5 方 方 方 用 2 2 2 2 d 7 1 1 1 1 4 Methods ( )

48.

Section/Topic 分析 No 法 f g クラス不均衡 Checklist item 適 E E D;E • モデル評価から じたモデルの更新(例:再較正)について, 全体的なものか,特定の社会 統計学的グループまたは特定 の環境に関するものかを記述すること • モデル評価において,モデルの予測がどのように計算されたか (例:数式、コード、オブジェクト、API)を説明すること • 予測モデルをどう使うか? • クラス不均衡に対処する 法を使 した場合は,その理由と 法,続けて,モデルやモデル予測を再較正するために使 法を説明すること した • モデルの公平性に対処するために使 したアプローチとその根 方 用 拠を説明すること • 公平性とは,予測モデルが 種,性別,年齢などの個 的属性 に基づいて個 やグループに対する差別をしないことを保証す ることを指す • ある属性を持つ のデータ りないこともある 人 用 用 口 人 足 人 D;E 方 6 人 生 人 方 用 4 3 2 2 公平性 8 1 方 1 1 1 4 Methods ( )

49.

• 肺の放射線画像に異常所 があ るか深層学習により予測モデル を作成した • 実際は「所 あり」だけど予測 モデルは「所 なし」と診断さ れた割合を属性(性別,年齢, 種,保険制度)により 較 性,若い,黒 ,国からの保 険適 の集団において,「所 なし」と間違って診断される割 合が かった 0 5 9 fi 5 1 0 1 2 0 1 9 5 8 3 0 1 0 1 見 1 2 0 見 比 2 2 8 1 2 – 6 7 1 2 人 7 2 見 見 高 用 治療機会の損失 1 Seyyed-Kalantari, L., Zhang, H., McDermott, M.B.A. et al. Underdiagnosis bias of arti cial intelligence algorithms applied to chest radiographs in under-served patient populations. Nat Med , ( ). https://doi.org/ . /s - 4 • 9 女 人 4 公平性の不均衡の例

50.

Section/Topic No Checklist item 適 • 予測モデルの出 (例:確率,分類)を特定する.あらゆる分 7 力 力 示 用 7 6 5 倫理承認 D • 医療環境,適格基準,アウトカム,および予測因 において, D;E 開発データと評価データの間にある違いを特定すること • 研究を承認した治験審査委員会または倫理委員会の名称を D;E し,参加者のインフォームドコンセントまたは,倫理委員会に よるインフォームドコンセントの免除について説明すること 示 モデルの開発と評価 類について,またそれらの閾値がどのように決めたかについて の詳細を すこと • リスクをカテゴライズするときの閾値.単純に50%にしない 子 モデルの出 0 1 1 1 5 Methods ( )

51.

Section/Topic No 適 研究資 a D;E • 研究資 の出所と資 提供者の研究における役割を すこと b D;E • すべての著者の利益相反と財務状況を開 すること D;E データの共有 e D;E f 登録されていない場合はその旨を述べること • 研究データの利 可能性に関する詳細を すこと • 分析コードの利 可能性に関する詳細を すこと[分析コードに は,データクリーニング,特徴量エンジニアリング,モデル開 発,モデル評価を含む] • 研究の設計,実施,報告,解釈,または普及において患者や市 民 示 示 示 D;E 示 手 入 • 研究の登録情報(登録名と登録番号を含む)を すか,研究が D;E 参画 金 用 用 民 金 金 用 9 8 8 8 8 8 できる場所を すか,プロトコルが準 備されていない場合はその旨を述べること がどのように関与したかを詳述するか,関与がなかった場合 はその旨を述べること 示 d 患者と市 • 研究のプロトコルを D;E 登録情報 コードの共有 8 c Checklist item 示 プロトコル 1 民 1 1 1 1 1 1 1 5 Open science,患者と市 参画

52.

Section/Topic No 研究参加者 Checklist item 適 a D;E b D;E c • 研究の流れを説明し,アウトカムイベントの有無ごとの参加者 数や,該当する場合は追跡期間の要約を す • フロー図を使う, 測のある参加者数やイベントの数も含む • 表を いるなどして,全体的な特徴と,該当する場合は各デー タソースまたは設定ごとの特徴を報告すること • Table • モデルの評価において,開発データとの 較を し,重要な予 E モデルの開発 測因 D;E の分布を 較する • 各分析(例:モデル開発,ハイパーパラメータチューニング, モデル評価)における参加者とアウトカムイベントの数を明確 に述べること • 新たな個 での予測を可能にし,第三者による評価と実装を可 示 示 比 用 能にするために,完全な予測モデル(例:予測式、コード、オ ブジェクト、API)の詳細を記載すること.アクセスや再利 に 対する制限(例: 由に利 可能、所有権)も含めること • 予測モデルを使えるようにする D 用 自 欠 比 1 人 1 子 用 用 2 1 0 0 0 モデルの仕様 2 2 2 2 2 2 5 Results ( )

53.

Section/Topic No Checklist item 適 • 主要なサブグループ(例:社会 モデルの性能 a b D;E D;E 口 一 人 E ・ 2 用 4 3 3 モデルの更新 3 2 2 2 5 Results ( ) 統計学的特性)を含む, モデルの性能の推定値(信頼区間含む)を報告すること.図表 での可視化を検討すること • 公平性を確認する • モデルの性能評価はグラフ化する • クラスター間のモデル性能の不均 性を評価した場合は、その 結果を報告すること • モデル更新の結果を,更新されたモデルとその後の性能を含め て報告すること

54.

Section/Topic No Checklist item 適 解釈 • 主な結果の全体的な解釈を提 すること.これには 的と先 D;E 研究の限界 研究の 脈における公平性の問題を含める • 研究のあらゆる限界(例:代表的でない標本,サンプルサイ D;E ズ,過剰適合, 測データ)とそれらがバイアス,統計的不確 実性, 般化可能性に与える影響について議論すること • D D データの取り扱いやモデルの使 において,利 者が関わ る必要があるかどうか,また利 者にどの程度の専 知識が求 められるかについて議論すること • モデルの適 可能性と 般化可能性に特に焦点を当てた,将来 D;E 行 門 用 の研究のための次のステップについて議論すること 言 入 用 用 用 用 用 示 一 一 力 欠 入 用 用 日 子 一 文 力 用 7 7 7 c 6 • 用 b 5 常診療におけるモデルの有 性:予測モデルを実装する際 に,品質の低い データや利 できない データをどのよ うに評価し処理すべきかを説明すること • モデルが 常診療の 部として使 される際に,利 できない 予測因 の値をどのように扱うべきかについて 及する 目 a 力 常診療における モデルの有 性 4 2 入 2 日 2 日 2 2 5 Discussion

55.

• ガイドラインを利 することで,研究の構成,論 執筆,論 チェックが楽になる • すべての項 を網羅して記載すべきである • くなるのでサプリを利 する • 論 の節 項の て は,オーサーガイドに準じつつ,ガイドラインも参考にする 文 文 用 方 用 立 目 ・ 文 良き研究ライフを! 5 長 5 まとめ