COSMINチェックリストの 概要と共通項目の理解

14.9K Views

May 24, 22

スライド概要

患者報告式アウトカム尺度の評価法:
信頼性と妥当性の新しい国際基準COSMINチェックリストの使い方

profile-image

一般社団法人臨床疫学研究推進機構

シェア

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

患者報告式アウトカム尺度の評価法: 信頼性と妥当性の新しい国際基準COSMINチェックリストの使い方 COSMINチェックリストの 概要と共通項目の理解 奥村泰之 一般財団法人 医療経済研究・社会保険福祉協会 医療経済研究機構 研究部 研究員 公益社団法人日本心理学会 心理・医学系研究者のためのデータ解析環境Rによる統計学の研究会 第10回研究集会 2012/5/18 (土) 13:20~17:45 東京医科歯科大学

2.

構成 使用目的 (6 min) 信頼性と妥当性の新定義 (3 min) チェックリストの使い方 (9 min) チェックリストの科学的評価 (2 min) 2

3.

使⽤⽬的 新定義 使い⽅ 科学的評価 英語表記 COSMIN (COnsensus-based Standards for the selection of health Measurement INstruments) 健康関連尺度の選択に関する合意に基づく指針 COSMIN (http://www.cosmin.nl/) 3

4.

使⽤⽬的 新定義 使い⽅ 科学的評価 COSMINのターゲット 健康関連の患者報告式アウトカム尺度 (Health Related Patient-Reported Outcomes: HR-PROs) 患者の健康状態を患者自身の直接的な報告 から情報を得て,患者の回答に関して臨床家 などによる修正や解釈を介さない尺度 尺度の例 症状の面接法 生活の質の質問紙 4

5.

使⽤⽬的 新定義 使い⽅ 科学的評価 健康関連の患者報告式アウトカム尺度 特徴 直接的に測定不可能 (i.e. 潜在変数) 多側面の構成 (i.e. 多因子) 実施形態 自己記入式 (i.e. 質問紙法) 他者評定式 (i.e. 面接法) コンピュータ支援式 5

6.

使⽤⽬的 新定義 使い⽅ 科学的評価 COSMINチェックリストの使用目的 文献レビューの段階 • 研究法の質の評価 • 尺度の選択 • 研究の必要性の同定 計画・投稿の段階 査読の段階 • 研究法の質向上 • 研究報告の質向上 • 査読の補助 COSMIN (http://www.cosmin.nl/) 6

7.

使⽤⽬的 新定義 使い⽅ 科学的評価 事例: 研究法の質の評価 目的 慢性閉塞性肺疾患の生活の質の評価尺度の 尺度特性を比較 方法 尺度研究の系統的展望 研究ごとの研究法の質を評定 尺度ごとの研究法の質を要約 Weldam SW et al: Int J Nurs Stud. in press. 7

8.

使⽤⽬的 新定義 使い⽅ 科学的評価 事例: 研究法の質の評価 7つの尺度特性を検討 研究ごとの研究法の質 研究 内容的 構造的 妥当性 妥当性 仮説 検定 異文化間 内的 信頼性 反応性 妥当性 一貫性 Chronic Respiratory Questionnaire (CRQ) Chan2006 ◎ NA △ × × △ NA Tsai2008 NA ◎ △ NA × × △ Wyrwich1999 NA ○ ○ NA ◎ NA NA McGill COPD Quality of Life Questionnaire (McGill COPD) Pakhale2010 ◎ NA NA NA NA NA NA ◎ excellent; ○good; △ fair; ×poor; NA not avilable Weldam SW et al: Int J Nurs Stud. in press. 8

9.

使⽤⽬的 新定義 使い⽅ 科学的評価 事例: 研究法の質の評価 13種から4尺度を推奨 尺度ごとの研究法の質 内容的 構造的 尺度名 妥当性 妥当性 疾患特異的尺度 (13種類) 仮説 検定 異文化間 内的 信頼性 反応性 妥当性 一貫性 CRQ +++ +++ +++ ? +++ ++ ++ SGRQ NA +++ ++ ? ++ +++ ++ CAT +++ +++ ++ NA +++ ++ +++ LCOPD +++ NA ++ ? +++ +++ NA McGillCOPD +++ NA NA NA NA NA NA SRI NA + NA NA + NA NA AQ20R NA NA + NA ? NA NA +++ strong evidence; ++ moderate evidence; + limited evidence; ? poor quality; NA not available Weldam SW et al: Int J Nurs Stud. in press. 9

10.

構成 使用目的 (6 min) 信頼性と妥当性の新定義 (3 min) チェックリストの使い方 (9 min) チェックリストの科学的評価 (2 min) 10

11.

使⽤⽬的 新定義 使い⽅ 科学的評価 尺度特性に関する4領域の新定義 信頼性 妥当性 内容的妥当性 内的一貫性 信頼性 表面的 妥当性 測定誤差 基準関連 妥当性 構成概念妥当性 異文化間 妥当性 反応性 反応性 構造的 妥当性 仮説検定 解釈 可能性 Mokkink LB et al: J Clin Epidemiol. 2010 Jul;63(7):737-45. 11

12.

使⽤⽬的 新定義 領域の定義 使い⽅ 科学的評価 信頼性 妥当性 信頼性 測定値に測定誤差を 含まない程度 反応性 解釈 可能性 信頼性 (拡張した定義) いくつかの条件下で反復測定したときに,変化して いない人の尺度得点が同一である程度 • • • • 同一の尺度内の複数の項目セットで測定 (内的一貫性) 同一の人を複数時点で測定 (再検査信頼性) 同一の時点で異なる人が測定 (評定者間信頼性) 複数時点で同一の人が測定 (評定者内信頼性) Mokkink LB et al: J Clin Epidemiol. 2010 Jul;63(7):737-45. 12

13.

使⽤⽬的 新定義 使い⽅ 領域の定義 妥当性 尺度が目的とした構成概念を 測定している程度 科学的評価 信頼性 妥当性 反応性 解釈 可能性 反応性 尺度が構成概念の継時的な変化を検出できる 能力 解釈可能性 尺度得点に質的な意味を付与できる程度 Mokkink LB et al: J Clin Epidemiol. 2010 Jul;63(7):737-45. 13

14.

使⽤⽬的 新定義 使い⽅ 科学的評価 研究会の発表分担 信頼性 市倉加奈子 内的一貫性 信頼性 測定誤差 内容的妥当性 表面的 妥当性 基準関連 妥当性 妥当性 竹林由武 構造的 妥当性 構成概念妥当性 異文化間 妥当性 仮説検定 反応性 反応性 土屋政雄 国里愛彦 解釈 可能性 14

15.

構成 使用目的 (6 min) 信頼性と妥当性の新定義 (3 min) チェックリストの使い方 (9 min) チェックリストの科学的評価 (2 min) 15

16.

使⽤⽬的 新定義 使い⽅ 科学的評価 4ステップ12ボックスの評価形式 尺度特性の検討の 有無の確認 A. 内的一貫性 B. 信頼性 C. 測定誤差 D. 内容的妥当性 E. 構造的妥当性 F. 仮説検定 G 異文化間妥当性 H. 基準関連妥当性 I. 反応性 J. 解釈可能性 Step 1 □ □ □ □ □ □ □ □ □ □ 項目反応理論 の評価 尺度特性の 具体的評価 Box A. 内的一貫性 利用 なし Box IRT 1. 2. 3. 4. モデル ソフトウェア 母数推定法 仮定の確認 Step 2 1. モデル 2. 共: 欠損の割合 F. 仮説検定 3. Box 共: 欠損値処理 欠損の割合 4. 1.共:共: 標本サイズの適切性 5. 2.一次元性 共: 欠損値処理 Box J. 解釈可能性 6. 3.標本サイズの適切性 共: 標本サイズの適切性 7. 4.尺度ごとに統計量の報告 1. 共: 欠損の割合 事前の仮説設定 8. 5.共:重大な研究法の欠陥 関連の方向性の予測 2. 共: 欠損値処理 9. 6.クロンバックのα係数 関連の大きさの予測 3. 共: 標本サイズの適切性 10. KR-20 7. 4. 他の尺度の記述 11. 適合度合計点の分布 8. 5. 他の尺度の尺度特性 最低点の回答割合 9. 6. 共:重大な研究法の欠陥 最高点の回答割合 10.統計手法の妥当性 7. 下位集団ごとの得点 一般化可能性の 評価 Box generalisability 1. 2. 3. 4. 5. 6. 7. 8. 年齢 性別 疾患と治療 セッティング 国 言語 標本抽出法 欠損値と回収率 8. 臨床的有意性 9. 共:重大な研究法の欠陥 Step 3 Step 4 16

17.

使⽤⽬的 新定義 使い⽅ 科学的評価 Step 1: 尺度特性の検討の有無の確認 尺度研究の尺度特性をチェック A. 内的一貫性 B. 信頼性 C. 測定誤差 D. 内容的妥当性 E. 構造的妥当性 F. 仮説検定 G 異文化間妥当性 H. 基準関連妥当性 I. 反応性 J. 解釈可能性 尺度特性の検討の 有無の確認 A. 内的一貫性 B. 信頼性 C. 測定誤差 D. 内容的妥当性 E. 構造的妥当性 F. 仮説検定 G 異文化間妥当性 H. 基準関連妥当性 I. 反応性 J. 解釈可能性 Step 1 ☑ □ □ □ □ ☑ □ □ □ □ 17 □ □ □ □ □ □ □ □ □ □

18.

使⽤⽬的 新定義 使い⽅ 科学的評価 項目反応理論 の評価 Step 2: 項目反応理論の評価 利用 なし Box IRT 1. 2. 3. 4. 項目反応理論とは モデル ソフトウェア 母数推定法 仮定の確認 Step 2 被験者の潜在特性 (θ) と項目の困難度 (b) を 分離するテスト理論  bi e Pi     bi 1 e 統計モデルは質的変数の因子分析 潜在変数 x1 x2 x3 xn 18

19.

使⽤⽬的 新定義 使い⽅ 科学的評価 項目反応理論 の評価 Step 2: 項目反応理論の評価 利用 なし Box IRT 1. 2. 3. 4. Step 2 0.2 0.4 0.6 椅子に座れる 杖なしで歩ける 早く歩ける 0.0 反応確率 0.8 1.0 身体機能の項目特性曲線 モデル ソフトウェア 母数推定法 仮定の確認 -4 -2 0 2 潜在特性θ=身体機能 4 19

20.

使⽤⽬的 新定義 使い⽅ 科学的評価 項目反応理論 の評価 Step 2: 項目反応理論の評価 利用 なし Box IRT モデル ソフトウェア 母数推定法 仮定の確認 Step 2 0.2 0.4 0.6 椅子に座れる 杖なしで歩ける 早く歩ける 0.0 反応確率 0.8 1.0 θ=0の反応確率 (0.73, 0.50, 0.18) 1. 2. 3. 4. -4 -2 0 2 潜在特性θ=身体機能 4 20

21.

使⽤⽬的 新定義 使い⽅ 科学的評価 項目反応理論 の評価 Step 2: 項目反応理論の評価 利用 なし Box IRT モデル ソフトウェア 母数推定法 仮定の確認 Step 2 0.2 0.4 0.6 椅子に座れる 杖なしで歩ける 早く歩ける 0.0 反応確率 0.8 1.0 θ=-1の反応確率 (0.50, 0.27, 0.08) 1. 2. 3. 4. -4 -2 0 2 潜在特性θ=身体機能 4 21

22.

使⽤⽬的 新定義 使い⽅ 科学的評価 項目反応理論 の評価 Step 2: 項目反応理論の評価 利用 なし Box IRT Box IRTの評価 (項目反応理論を「利用」した場合) 1. 2. 3. 4. モデル ソフトウェア 母数推定法 仮定の確認 Step 2 1. 項目反応理論のモデルは十分に記載されて いるか? • 例: 2母数ロジスティックモデル,段階反応モデル 2. 使用した統計ソフトウェアは十分に記載され ているか? • 例: MULTILOG,PARSCALE,BILOG,Mplus 22

23.

使⽤⽬的 新定義 使い⽅ 科学的評価 項目反応理論 の評価 Step 2: 項目反応理論の評価 利用 なし Box IRT Box IRTの評価 (項目反応理論を「利用」した場合) 1. 2. 3. 4. モデル ソフトウェア 母数推定法 仮定の確認 Step 2 3. 母数推定法は十分に記載されているか? • 例: 条件付最尤推定法,周辺最尤推定法 4. 項目反応理論のモデルの母数推定のため の仮定を検討しているか? • 例: 一次元性,局所独立の仮定,項目の適合度 23

24.

使⽤⽬的 新定義 使い⽅ 科学的評価 項目反応理論 の評価 Step 2: 項目反応理論の評価 利用 なし Box IRT 事例 1. 2. 3. 4. モデル ソフトウェア 母数推定法 仮定の確認 方法の節 (モデル) Step 2 » One of the IRT models that is applicable to items with ordered polytomous response categories — and that we used in the present study — is the logistic GRM[Graded Response Model] (Samejima, 1969). 方法の節 (ソフトウェア/母数推定法) » In the present study, each of the unidimensional Dutch CPHI scales was analyzed separately. Item parameter estimates were obtained by the method of marginal maximum likelihood. This method is able to handle items and subjects that have missing data without deleting them or imputing missing data (Reise & Henson, 2003). The a priori distribution of the trait level (θ) was the standard normal. We used the software package MULTILOG (Scientific Software, Chicago, IL). Mokkink LB et al: J Speech Lang Hear Res. 2010 Jun;53(3):556-71. 24

25.

使⽤⽬的 新定義 使い⽅ 科学的評価 項目反応理論 の評価 Step 2: 項目反応理論の評価 利用 なし Box IRT 事例 1. 2. 3. 4. モデル ソフトウェア 母数推定法 仮定の確認 Step 2 方法の節 (仮定の検討) » Goodness of fit of the GRM (i.e., the correspondence between model predictions and observed data) was investigated for each unidimensional scale. We examined goodness of fit of the items in the GRM as described by Stone and Zhang (2003) and as implemented in SAS (Stone, 2004). Mokkink LB et al: J Speech Lang Hear Res. 2010 Jun;53(3):556-71. 25

26.

使⽤⽬的 新定義 使い⽅ 科学的評価 Step 3: 尺度特性の具体的評価 Box A. 内的一貫性 1. モデル 2. 共: 欠損の割合 F. 仮説検定 3. Box 共: 欠損値処理 欠損の割合 4. 1.共:共: 標本サイズの適切性 5. 2.一次元性 共: 欠損値処理 Box J. 解釈可能性 6. 3.標本サイズの適切性 共: 標本サイズの適切性 7. 4.尺度ごとに統計量の報告 1. 共: 欠損の割合 事前の仮説設定 8. 5.共:重大な研究法の欠陥 関連の方向性の予測 2. 共: 欠損値処理 9. 6.クロンバックのα係数 関連の大きさの予測 3. 共: 標本サイズの適切性 10. KR-20 7. 4. 他の尺度の記述 合計点の分布 11. 適合度 Step 1で該当した尺度特性の具体的評価 Box A. 内的一貫性 1. モデル 2. 共: 欠損の割合 3. 共: 欠損値処理 4. 共: 標本サイズの適切性 5. 一次元性 6. 標本サイズの適切性 7. 尺度ごとに統計量の報告 8. 共:重大な研究法の欠陥 9. クロンバックのα係数 10. KR-20 11. 適合度 特異的項目 尺度特性の 具体的評価 8. 5. 他の尺度の尺度特性 最低点の回答割合 9. 6. 共:重大な研究法の欠陥 最高点の回答割合 10.統計手法の妥当性 7. 下位集団ごとの得点 8. 臨床的有意性 9. 共:重大な研究法の欠陥 Step 3 共通項目 Box F. 仮説検定 1. 共: 欠損の割合 2. 共: 欠損値処理 3. 共: 標本サイズの適切性 4. 事前の仮説設定 5. 関連の方向性の予測 6. 関連の大きさの予測 7. 他の尺度の記述 8. 他の尺度の尺度特性 9. 共:重大な研究法の欠陥 10.統計手法の妥当性 26

27.

使⽤⽬的 新定義 使い⽅ 科学的評価 Step 3: 尺度特性の具体的評価 2件法版と4件法版の評価形式 尺度特性の 具体的評価 Box A. 内的一貫性 1. モデル 2. 共: 欠損の割合 F. 仮説検定 3. Box 共: 欠損値処理 欠損の割合 4. 1.共:共: 標本サイズの適切性 5. 2.一次元性 共: 欠損値処理 Box J. 解釈可能性 6. 3.標本サイズの適切性 共: 標本サイズの適切性 7. 4.尺度ごとに統計量の報告 1. 共: 欠損の割合 事前の仮説設定 8. 5.共:重大な研究法の欠陥 関連の方向性の予測 2. 共: 欠損値処理 9. 6.クロンバックのα係数 関連の大きさの予測 3. 共: 標本サイズの適切性 10. KR-20 7. 4. 他の尺度の記述 合計点の分布 11. 適合度 8. 5. 他の尺度の尺度特性 最低点の回答割合 9. 6. 共:重大な研究法の欠陥 最高点の回答割合 10.統計手法の妥当性 7. 下位集団ごとの得点 8. 臨床的有意性 9. 共:重大な研究法の欠陥 Step 3 クロンバックのα係数を求めているか? (Box A-9) • 2件法版 – はい – いいえ – 該当しない • 4件法版 – excellent: 求めている – good: NA – fair: 項目全体相関だけ求めている – poor: α係数も項目全体相関も求めていない 27

28.

使⽤⽬的 新定義 使い⽅ 科学的評価 Step 3: 尺度特性の具体的評価 尺度特性ごとに共通項目を評価 尺度特性の 具体的評価 Box A. 内的一貫性 1. モデル 2. 共: 欠損の割合 F. 仮説検定 3. Box 共: 欠損値処理 欠損の割合 4. 1.共:共: 標本サイズの適切性 5. 2.一次元性 共: 欠損値処理 Box J. 解釈可能性 6. 3.標本サイズの適切性 共: 標本サイズの適切性 7. 4.尺度ごとに統計量の報告 1. 共: 欠損の割合 事前の仮説設定 8. 5.共:重大な研究法の欠陥 関連の方向性の予測 2. 共: 欠損値処理 9. 6.クロンバックのα係数 関連の大きさの予測 3. 共: 標本サイズの適切性 10. KR-20 7. 4. 他の尺度の記述 合計点の分布 11. 適合度 8. 5. 他の尺度の尺度特性 最低点の回答割合 9. 6. 共:重大な研究法の欠陥 最高点の回答割合 10.統計手法の妥当性 7. 下位集団ごとの得点 8. 臨床的有意性 9. 共:重大な研究法の欠陥 Step 3 1. 項目の欠損の割合は報告されているか? • 尺度ごとの欠損値数の平均 • 項目ごとの欠損値の割合 2. 欠損値の処理法は報告されているか? 3. 標本サイズは十分か? 4. その他の重大な研究法の欠陥はあるか? 28

29.

使⽤⽬的 新定義 使い⽅ 科学的評価 Step 3: 尺度特性の具体的評価 尺度特性の 具体的評価 Box A. 内的一貫性 1. モデル 2. 共: 欠損の割合 F. 仮説検定 3. Box 共: 欠損値処理 欠損の割合 4. 1.共:共: 標本サイズの適切性 5. 2.一次元性 共: 欠損値処理 Box J. 解釈可能性 6. 3.標本サイズの適切性 共: 標本サイズの適切性 7. 4.尺度ごとに統計量の報告 1. 共: 欠損の割合 事前の仮説設定 8. 5.共:重大な研究法の欠陥 関連の方向性の予測 2. 共: 欠損値処理 9. 6.クロンバックのα係数 関連の大きさの予測 3. 共: 標本サイズの適切性 10. KR-20 7. 4. 他の尺度の記述 合計点の分布 11. 適合度 8. 5. 他の尺度の尺度特性 最低点の回答割合 9. 6. 共:重大な研究法の欠陥 最高点の回答割合 10.統計手法の妥当性 7. 下位集団ごとの得点 事例 8. 臨床的有意性 9. 共:重大な研究法の欠陥 Step 3 結果の節 (欠損値の割合) » SF-36: Few individual items were missing. At the baseline measurement, 7 items of 101 patients × 36 items = 0.2% were missing. A total score could be calculated for all subjects for all subscales. 項目の内容 Thorborg K et al: Br J Sports Med. 2011 May;45(6):478-91. 項目ごとの欠損値数 29

30.

使⽤⽬的 新定義 使い⽅ Step 3: 尺度特性の具体的評価 事例 科学的評価 尺度特性の 具体的評価 Box A. 内的一貫性 1. モデル 2. 共: 欠損の割合 F. 仮説検定 3. Box 共: 欠損値処理 欠損の割合 4. 1.共:共: 標本サイズの適切性 5. 2.一次元性 共: 欠損値処理 Box J. 解釈可能性 6. 3.標本サイズの適切性 共: 標本サイズの適切性 7. 4.尺度ごとに統計量の報告 1. 共: 欠損の割合 事前の仮説設定 8. 5.共:重大な研究法の欠陥 関連の方向性の予測 2. 共: 欠損値処理 9. 6.クロンバックのα係数 関連の大きさの予測 3. 共: 標本サイズの適切性 10. KR-20 7. 4. 他の尺度の記述 合計点の分布 11. 適合度 8. 5. 他の尺度の尺度特性 最低点の回答割合 9. 6. 共:重大な研究法の欠陥 最高点の回答割合 10.統計手法の妥当性 7. 下位集団ごとの得点 8. 臨床的有意性 9. 共:重大な研究法の欠陥 Step 3 結果の節 (欠損処理法) » The SST [Simple Shoulder Test] consists of 12 questions with dichotomous response options. For each question, the patient indicates whether he or she is able to do the activity or not. The scores are summarized into a total score, which ranges from 0 (worst) to 12 (best) for shoulder functioning. Missing data were treated as follows: 1 or 2 missing values were substituted with the average value for the other items. If more than 2 items were missing, the response to this questionnaire was considered invalid and no total score was calculated. van Kampen DA et al: J Shoulder Elbow Surg. 2012 Jun;21(6):808-14. 30

31.

使⽤⽬的 新定義 使い⽅ Step 4: 一般化可能性の評価 Box generalisabilityの評価 科学的評価 一般化可能性の 評価 Box generalisability 1. 2. 3. 4. 5. 6. 7. 8. 年齢 性別 疾患と治療 セッティング 国 言語 標本抽出法 欠損値と回収率 Step 4 1. 年齢の代表値と散布度の記述 • 例: 平均値/中央値,標準偏差/範囲 2. 性別の分布の記述 3. 疾患と治療の記述 • 例: 重症度,状態,罹病期間 4. 研究実施のセッティングの記述 • 地域住民,プライマリケア,病院 31

32.

使⽤⽬的 新定義 使い⽅ Step 4: 一般化可能性の評価 Box generalisabilityの評価 科学的評価 一般化可能性の 評価 Box generalisability 1. 2. 3. 4. 5. 6. 7. 8. 年齢 性別 疾患と治療 セッティング 国 言語 標本抽出法 欠損値と回収率 Step 4 5. 研究実施の国の記述 6. 尺度の言語の記述 7. 標本抽出法の記述 • 例: 簡易抽出,連続抽出,無作為抽出 8. 欠損値や回収率の割合の許容性 32

33.

使⽤⽬的 新定義 使い⽅ 科学的評価 Step 4: 一般化可能性の評価 一般化可能性の 評価 Box generalisability 1. 2. 3. 4. 5. 6. 7. 8. 年齢 性別 疾患と治療 セッティング 国 言語 標本抽出法 欠損値と回収率 事例 Step 4 方法の節 (国/標本抽出法/セッティング) » Second, we assessed the measurement properties (reliability, validity) in the Dutch population. Institutional approval was waived by our local ethical committee, and written signed informed consent was obtained from all participants. A prospective cohort of patients was recruited consecutively between February 2009 and October 2010 at the orthopedic outpatient clinic of the Onze Lieve Vrouwe Gasthuis, Amsterdam, The Netherlands, by 1 orthopedic surgeon (W.J.W.). Inclusion criteria were age of 16 years or older and the presence of shoulder problems as diagnosed by the orthopedic surgeon (W.J.W.). van Kampen DA et al: J Shoulder Elbow Surg. 2012 Jun;21(6):808-14. 33

34.

使⽤⽬的 新定義 使い⽅ Step 4: 一般化可能性の評価 事例 科学的評価 一般化可能性の 評価 Box generalisability 1. 2. 3. 4. 5. 6. 7. 8. 年齢 性別 疾患と治療 セッティング 国 言語 標本抽出法 欠損値と回収率 Step 4 結果の節 (年齢/性別/疾患の特徴) van Kampen DA et al: J Shoulder Elbow Surg. 2012 Jun;21(6):808-14. 34

35.

構成 使用目的 (6 min) 信頼性と妥当性の新定義 (3 min) チェックリストの使い方 (9 min) チェックリストの科学的評価 (2 min) 35

36.

使⽤⽬的 新定義 使い⽅ 科学的評価 作成過程 プロトコル論文の公開[1](2006.1.24) 「尺度特性の系統的展望」の系統的展望[1] 「尺度特性の方法論の教科書」の系統的展望[1] デルファイ法による43名の専門家の合意形成[2] (2006.3-2007.11) 88名の評定者による評定者一致率調査[3] [1] Mokkink LB et al: BMC Med Res Methodol. 2006 Jan 24;6:2 [2] Mokkink LB et al: Qual Life Res. 2010 May;19(4):539-49 [3] Mokkink LB et al: BMC Med Res Methodol. 2010 Sep 22;10:82 36

37.

使⽤⽬的 新定義 使い⽅ 科学的評価 作成過程 教科書の公開[1] (2011.8.11) マニュアルの公開[2] (2012.1) [1] de Vet et al: Measurement in Medicine: A Practical Guide. Cambridge University Press [2] Mokkink LB et al: http://www.cosmin.nl/images/upload/File/COSMIN%20checklist%20manual%20v9.pdf 37

38.

使⽤⽬的 新定義 使い⽅ 科学的評価 系統的展望での活用 38

39.

使⽤⽬的 新定義 使い⽅ 科学的評価 系統的展望での活用  A Systematic Review of the Clinimetric Properties of Habitual Physical Activity Measures in Young Children with a Motor Disability (Int J Pediatr. in press)  Self-management: a systematic review of outcome measures adopted in selfmanagement interventions for stroke (Disabil Rehabil. in press)  Systematic Review of the Clinimetric Properties of Laboratory- and Field-Based Aerobic and Anaerobic Fitness Measures in Children With Cerebral Palsy (Arch Phys Med Rehabil. 2013 Feb;94(2):287-301)  Quality of life among breast cancer patients with lymphedema: a systematic review of patient-reported outcome instruments and outcomes (J Cancer Surviv. 2013 Mar;7(1):83-92)  Measurement properties of performance-based measures to assess physical function in hip and knee osteoarthritis: a systematic review (Osteoarthritis Cartilage. 2012 Dec;20(12):1548-62)  Psychometric properties of the Pain Attitudes and Beliefs Scale for Physiotherapists: A systematic review (Man Ther. 2012 Jun;17(3):213-8)  Clinimetrics of measures of oropharyngeal dysphagia for preschool children with cerebral palsy and neurodevelopmental disabilities: a systematic review (Dev Med Child Neurol. 2012 Sep;54(9):784-95) 39

40.

使⽤⽬的 新定義 使い⽅ 科学的評価 尺度研究での活用 40

41.

まとめ 文献レビュー,計画・投稿,査読で使用可能 尺度特性に関する4領域の新定義 (信頼性,妥当 性,反応性,解釈可能性) 評価形式は4ステップ12ボックス (尺度特性の検討 の有無の確認,項目反応理論の評価,尺度特性の具体的評価,一 般化可能性の評価) 妥当な作成過程と普及 41