t検定の基礎(Studentのt検定とWelchのt検定)

32.6K Views

March 28, 24

#[第9回大阪sas勉強会] #t検定 #Studentのt検定 #Welchのt検定 #統計解析 #SAS

スライド概要

[第9回大阪SAS勉強会] 杉本真理

森岡裕[SASユーザー総会世話人]

@6484025

スライド一覧

SAS言語を中心として，解析業務担当者・プログラマなのコミュニティを活性化したいです

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

MMRM入門

[第8回大阪sas勉強会]

森岡裕[SASユーザー総会世話人] 46.9K

SASユーザー総会論文集 2024年

sasユーザー総会論文集 2024年

森岡裕[SASユーザー総会世話人] 26.8K

SASのコールルーチンは57個あるねん10分で全部説明するねん

[第9回大阪sas勉強会]

森岡裕[SASユーザー総会世話人] 25.1K

統計解析・確率論に関連するパラドックス

森岡裕[SASユーザー総会世話人] 24.2K

ゼロからでも始められるSASプログラミングのエッセンス

森岡裕[SASユーザー総会世話人] 19.2K

RTF出力を活用した解析報告書の作成

[第9回大阪sas勉強会]

森岡裕[SASユーザー総会世話人] 15.6K

各ページのテキスト

t検定の基礎（Studentのt検定とWelchのt検定）大阪SAS勉強会 2024/3/22 エイツーヘルスケア株式会社杉本真理 © A2 Healthcare Corporation Confidential

Contents 1 © A2 Healthcare Corporation Confidential 検定とは 2 SASによる検定の実行方法 3 検定の頑健性 2

1 検定とは © A2 Healthcare Corporation Confidential 3

検定とは検定：平均値の差に関する検定 1標本の検定：母平均が特定の値と異なるかどうかを検定する例）帰無仮説H₀：A組の数学の平均点は60点ではない対立仮説H₁：A組の数学の平均点は60点である 2標本の検定：2群の母平均が等しいか否かを検定する例）帰無仮説H₀：A組とB組の数学の平均点に差はない対立仮説H₁：A組とB組の数学の平均点に差はある © A2 Healthcare Corporation Confidential 4

検定とは対応のあるデータ対応のないデータ同一の対象から抽出されたデータ異なる対象から抽出されたデータ VS 治験薬投与前の血圧治験薬A投与群の血圧治験薬投与後の血圧 VS 治験薬B投与群の血圧 © A2 Healthcare Corporation Confidential 5

2群のデータの分布 (ⅰ)平均も分散も同じ © A2 Healthcare Corporation Confidential (ⅱ)平均は同じ分散は異なる (ⅲ)分散は同じ平均は異なる 6 (ⅳ)平均も分散も異なる

Studentの検定 Studentの検定：2群の母分散が未知で等しいと仮定した場合 (ⅰ)平均も分散も同じ © A2 Healthcare Corporation Confidential (ⅱ)平均は同じ分散は異なる (ⅲ)分散は同じ平均は異なる 7 (ⅳ)平均も分散も異なる

Welchの検定 Welchの検定：2群の母分散が未知で等しいと仮定しない場合 (ⅰ)平均も分散も同じ © A2 Healthcare Corporation Confidential (ⅱ)平均は同じ分散は異なる (ⅲ)分散は同じ平均は異なる 8 (ⅳ)平均も分散も異なる

2標本の検定 Yes 対応のある検定対応のある 2群か？ Yes No 母集団の分散は等しいか？ No © A2 Healthcare Corporation Confidential Studentの検定 9 Welchの検定

10.

検定、どんなことしてるの？中心極限定理平均、分散 ²に従う母集団からサンプルサイズの標本を抽出する場合、その平均値の分布は、が大きくなるにつれて、平均値、 ² 分散の正規分布に収束する標本平均を算出標本を𝒏回抽出母集団 𝑁(𝜇, 𝜎²) 標本平均の分布 𝝈² 𝑁(𝜇 , ) 𝒏 ・・・ © A2 Healthcare Corporation Confidential 𝑥 10 𝑥̅

11.

検定、どんなことしてるの？標本平均の分布標準正規分布 𝑧 標準化 𝑥̅ © A2 Healthcare Corporation Confidential 11

12.

検定、どんなことしてるの？標本平均の分布分布 nが十分に大きくない場合に、標本分散の期待値は母分散に一致せず、母分散より小さくなる。 ↓ 不偏分散標準化標本分散の期待値が母分散に一致するように標本分散の算出式にをかけたもの 𝒏 𝒊 １標本の場合 𝒊 𝟏 © A2 Healthcare Corporation Confidential 12

13.

分布分布：自由度－1をパラメータとする確率分布自由度が大きくなると、標準正規分布に近づく →サンプルサイズが十分に大きければ、分布でも標準正規分布でも結果はほとんど変わらない自由度１：自由度２：自由度５：自由度10：標準正規分布： © A2 Healthcare Corporation Confidential 13

14.

分布分布：自由度－1をパラメータとする確率分布分布は標準正規分布に比べ、左右に広がる裾が厚い →同じ確率密度になるような値をとったときに、分布の方が信頼区間の幅が広くなる -4.30 抽出するサンプル数が少なくても、正確に母平均の推定が可能 © A2 Healthcare Corporation Confidential -1.96 自由度２：標準正規分布： 14 1.96 4.30

15.

検定（両側）を行う ① ② ③ ④ ⑤ ⑥ 帰無仮説、対立仮説をたてる。有意水準の設定を行う。検定統計量( 値）を算出する。自由度を算出する。分布表から、自由度、②で定めた有意水準の時の値を求める。帰無仮説の判定をする。例）実薬群、対照薬群の収縮期血圧の平均値に差はあるのか 1人目 2人目 3人目 4人目 5人目 6人目 7人目 8人目 9人目 10人目実薬群 153 153 152 156 158 151 151 150 148 157 対照薬群 153 146 138 152 140 146 156 142 147 153 © A2 Healthcare Corporation Confidential 15

16.

検定（両側）を行う例）実薬群、対照薬群の収縮期血圧の平均値に差はあるのか 1人目 2人目 3人目 4人目 5人目 6人目 7人目 8人目 9人目 10人目実薬群 153 153 152 156 158 151 151 150 148 157 対照薬群 153 146 138 152 140 146 156 142 147 153 ① 帰無仮説、対立仮説をたてる。帰無仮説H₀：実薬群、対照薬群の収縮期血圧の平均値に差はない対立仮説H₁：実薬群、対照薬群の収縮期血圧の平均値は異なる ② 有意水準の設定を行う。両側有意水準＝0.05とする。 © A2 Healthcare Corporation Confidential 16

17.

検定（両側）を行う「母分散は等しい」例）実薬群、対照薬群の収縮期血圧の平均値に差はあるのかと仮定しているため、 1人目 2人目 3人目2つの標本を1つにまとめた分散 4人目 5人目 6人目 7人目 8人目 (プールした分散)を用いる 9人目 10人目実薬群 153 153 152 156 158 151 151 150 148 157 対照薬群 153 146 138 152 140 146 156 142 147 153 ③ 検定統計量( 値)を算出する。(１：実薬群２：対照薬群) 【Studentの検定】 𝟏 （𝒏𝟏 （ 𝟏 ∑ 𝒙𝟏 𝒊 ＝ © A2 Healthcare Corporation Confidential 𝟐 𝟏 𝒏𝟐 【Welchの検定】 𝟏 ） 𝟐 𝝈𝟐 𝟏 𝒏𝟏 𝒙𝟏 ² ∑(𝒙𝟐 𝒊 𝒙𝟐 )² ） 𝒏𝟏 𝒏𝟐 𝟐 17 𝟐 𝝈𝟐 𝟐 𝒏𝟐

18.

検定（両側）を行う例）実薬群、対照薬群の収縮期血圧の平均値に差はあるのか 1人目 2人目 3人目 4人目 5人目 6人目 7人目 8人目 9人目 10人目実薬群 153 153 152 156 158 151 151 150 148 157 対照薬群 153 146 138 152 140 146 156 142 147 153 ③検定統計量( 値)を算出する。(１：実薬群２：対照薬群) 平均値 𝟏 不偏分散平均値 𝟐 不偏分散 © A2 Healthcare Corporation Confidential 𝟐 𝟏 (153+153+157+…＋157）/ 10 = 152.9 (153－152.9)²＋…＋(157－152.9)² / 9 ≒ 10.3 𝟐 𝟐 (153+146+138+…＋153）/ 10 = 147.3 (153-143.2)²＋…＋(153-143.2)² / 9 ≒ 37.1 18

19.

検定（両側）を行う例）実薬群、対照薬群の収縮期血圧の平均値に差はあるのか 1人目 2人目 3人目 4人目 5人目 6人目 7人目 8人目 9人目 10人目実薬群 153 153 152 156 158 151 151 150 148 157 対照薬群 153 146 138 152 140 146 156 142 147 153 ③ 検定統計量( 値)を算出する。(１：実薬群２：対照薬群) 【Studentの検定】【Welchの検定】 𝒙𝟏 𝒙𝟐 （𝒏𝟏 𝟏 （ 𝟏 𝒏𝟐 𝟏 ）𝝈𝟐 𝟐 𝟏 𝟏 ∑ 𝒙𝟏 𝒊 𝒙𝟏 ² ∑(𝒙𝟐 𝒊 𝒙𝟐 )² ＝） 𝒏𝟏 𝒏𝟐 𝟐 . . © A2 Healthcare Corporation Confidential . 19 . 𝟐 𝟐 𝟐 𝟐

20.

検定（両側）を行う例）実薬群、対照薬群の収縮期血圧の平均値に差はあるのか 1人目 2人目 3人目 4人目 5人目 6人目 7人目 8人目 9人目 10人目実薬群 153 153 152 156 158 151 151 150 148 157 対照薬群 153 146 138 152 140 146 156 142 147 153 ④ 自由度を算出する。(１：実薬群２：対照薬群) 【Studentの検定】【Welchの検定】 𝟐 𝝈𝟐 𝝈 𝟏 𝟐 𝟐 𝒏𝟏 𝒏𝟐 𝟐 𝝈𝟐 𝝈 𝟏 ( )𝟐 ( 𝟐 )𝟐 𝒏𝟏 𝒏𝟐 (𝒏𝟏 𝟏) (𝒏𝟐 𝟏) © A2 Healthcare Corporation Confidential 20 . ( ( ( . . ) ( ) ( ) . ) )

21.

検定（両側）を行う分布表から、有意水準、自由度の時の値を求める。 𝑣 【Studentの検定】両側有意水準＝0.05 自由度＝18 値＝ 2.571 【Welchの検定】両側有意水準＝0.05 自由度＝13.65 値＝ 2.572 © A2 Healthcare Corporation Confidential 21 𝛼 0.1 0.05 0.025 0.01 0.005 1 3.078 6.314 12.706 31.821 63.657 2 1.886 2.920 4.303 6.965 9.925 3 1.638 2.353 3.182 4.541 5.841 4 1.533 2.132 2.776 3.747 4.604 5 1.476 2.015 2.571 3.365 4.032 6 1.440 1.943 2.447 3.143 3.707 7 1.415 1.895 2.365 2.998 3.499 8 1.397 1.860 2.306 2.896 3.355 9 1.383 1.833 2.262 2.821 3.250 10 1.372 1.812 2.228 2.764 3.169 11 1.363 1.796 2.201 2.718 3.106 12 1.356 1.782 2.179 2.681 3.055 13 1.350 1.771 2.160 2.650 3.012 14 1.345 1.761 2.145 2.624 2.977 15 1.341 1.753 2.131 2.602 2.947 16 1.337 1.746 2.120 2.583 2.921 17 1.333 1.740 2.110 2.567 2.898 18 1.330 1.734 2.101 2.552 2.878 19 1.328 1.729 2.093 2.539 2.861 20 1.325 1.725 2.086 2.528 2.845

22.

検定（両側）を行う ⑥ 帰無仮説の判定をする。【Studentの検定】有意水準＝0.05 自由度＝18 値＝ 2.571 →2.571≧2.101 【Welchの検定】有意水準＝0.05 自由度＝13.65 値＝ 2.572 →2.572≧2.160 © A2 Healthcare Corporation Confidential 𝛼 𝑣 棄却域棄却域 -2.101 棄却域 2.101 2.571 棄却域 -2.160 2.160 2.572 22 0.1 0.05 0.025 0.01 0.005 1 3.078 6.314 12.706 31.821 63.657 2 1.886 2.920 4.303 6.965 9.925 3 1.638 2.353 3.182 4.541 5.841 4 1.533 2.132 2.776 3.747 4.604 5 1.476 2.015 2.571 3.365 4.032 6 1.440 1.943 2.447 3.143 3.707 7 1.415 1.895 2.365 2.998 3.499 8 1.397 1.860 2.306 2.896 3.355 9 1.383 1.833 2.262 2.821 3.250 10 1.372 1.812 2.228 2.764 3.169 11 1.363 1.796 2.201 2.718 3.106 12 1.356 1.782 2.179 2.681 3.055 13 1.350 1.771 2.160 2.650 3.012 14 1.345 1.761 2.145 2.624 2.977 15 1.341 1.753 2.131 2.602 2.947 16 1.337 1.746 2.120 2.583 2.921 17 1.333 1.740 2.110 2.567 2.898 18 1.330 1.734 2.101 2.552 2.878 19 1.328 1.729 2.093 2.539 2.861 20 1.325 1.725 2.086 2.528 2.845

23.

検定（両側）を行う ⑥ 帰無仮説の判定をする。 𝛼 𝑣 0.1 0.05 0.025 0.01 1 3.078 6.314 12.706 31.821 【Studentの検定】 2 1.886 2.920 4.303 6.965 3 1.638 2.353 3.182 4.541 有意水準＝0.05 4 1.533 2.132 2.776 3.747 棄却域棄却域 5 1.476 2.015 2.571 3.365 自由度＝18 6 1.440 1.943 2.447 3.143 値＝ 2.571 7 1.415 1.895 2.365 2.998 -2.101 2.101 8 1.397 1.860 2.306 2.896 2.571 帰無仮説H₀：実薬群、対照薬群の収縮期血圧の平均値に差はない →2.571≧2.101 9 1.383 1.833 2.262 2.821 10 1.372 1.812 2.228 2.764 対立仮説H₁：実薬群、対照薬群の収縮期血圧の平均値は異なる【Welchの検定】有意水準＝0.05 自由度＝13.65 値＝ 2.572 →2.572≧2.160 © A2 Healthcare Corporation Confidential 棄却域棄却域 -2.160 2.160 2.572 23 0.005 63.657 9.925 5.841 4.604 4.032 3.707 3.499 3.355 3.250 3.169 11 1.363 1.796 2.201 2.718 3.106 12 1.356 1.782 2.179 2.681 3.055 13 1.350 1.771 2.160 2.650 3.012 14 1.345 1.761 2.145 2.624 2.977 15 1.341 1.753 2.131 2.602 2.947 16 1.337 1.746 2.120 2.583 2.921 17 1.333 1.740 2.110 2.567 2.898 18 1.330 1.734 2.101 2.552 2.878 19 1.328 1.729 2.093 2.539 2.861 20 1.325 1.725 2.086 2.528 2.845

24.

2 SASによる検定の実行方法 © A2 Healthcare Corporation Confidential 24

25.

ttestプロシジャ proc ttest data=data; class ARM; var AVAL; run; Studentのt検定 Welchのt検定 © A2 Healthcare Corporation Confidential 25

26.

glmプロシジャ proc glm data=data; class ARM; model AVAL = ARM; lsmeans ARM / tdiff = control("対照群") cl; quit; Welchのt検定も選択可能 proc glm data=data; class ARM; model AVAL = ARM ; means ARM /welch; quit; © A2 Healthcare Corporation Confidential 26

27.

mixedプロシジャ proc mixed data = data ; class ARM; model AVAL = ARM ; lsmeans ARM / pdiff = control("対照群") cl; run ; © A2 Healthcare Corporation Confidential 27

28.

29.

Studentの検定 vs Welchの検定デフォルトでWelchの t検定のほうが良い？下記状況の2群について、各群のサンプルサイズが同じ、または、異なる場合に、Studentの検定とWelchの検定をそれぞれ1000回実施し、各検定が帰無仮説を棄却した割合を算出する (ⅰ)平均も分散も同じ (ⅱ)平均は同じ標準偏差は異なる (ⅲ)標準偏差は同じ平均は異なる (ⅳ)平均も標準偏差も異なる帰無仮説H₀：実薬群、対照薬群の収縮期血圧の平均値に差はない対立仮説H₁：実薬群、対照薬群の収縮期血圧の平均値は異なる © A2 Healthcare Corporation Confidential 29

30.

Studentの検定 vs Welchの検定表１．平均、標準偏差ともに等しい場合のStudentの𝑡検定およびWelchの𝑡検定の棄却割合(シミュレーション回数：1000回) サンプルサイズ平均標準偏差 Studentの Welchの実薬群対照薬群実薬群対照薬群実薬群対照薬群 𝑡検定(%) 𝑡検定(%) サンプルサイズは等しい 100 100 0 0 1 1 6.30 6.30 10 10 0 0 1 1 5.20 5.10 サンプルサイズは異なる 200 100 0 0 1 1 4.20 4.20 20 10 0 0 1 1 5.30 5.10 © A2 Healthcare Corporation Confidential 30 Studentの検定サンプルサイズの違いに関係なく、 αエラーは、5％程度 Welchの検定サンプルサイズの違いに関係なく、 αエラーは、5％程度

31.

Studentの検定 vs Welchの検定表2．平均は同じ場合のStudentの𝑡検定およびWelchの𝑡検定の棄却割合 (シミュレーション回数：1000回) サンプルサイズ平均標準偏差 Studentの Welchの実薬群対照薬群実薬群対照薬群実薬群対照薬群 𝑡検定(%) 𝑡検定(%) サンプルサイズが等しい 100 100 0 0 1 0.25 5.10 4.90 100 100 0 0 1 0.5 5.30 5.10 100 100 0 0 1 2 5.50 5.50 100 100 0 0 1 4 6.50 6.40 10 10 0 0 1 0.25 6.00 5.20 10 10 0 0 1 0.5 4.70 4.50 10 10 0 0 1 2 6.90 6.40 10 10 0 0 1 4 7.50 6.80 サンプルサイズが異なる 200 100 0 0 1 0.25 0.90 4.80 200 100 0 0 1 0.5 2.00 4.30 200 100 0 0 1 2 11.00 4.80 200 100 0 0 1 4 15.90 4.60 20 10 0 0 1 0.25 1.50 6.10 20 10 0 0 1 0.5 2.40 6.00 20 10 0 0 1 2 10.90 5.00 20 10 0 0 1 4 16.10 5.00 © A2 Healthcare Corporation Confidential 31 Studentの検定サンプルサイズが異なり、標準偏差の差が大きいほど、 αエラーは大きくなる Welchの検定サンプルサイズ、標準偏差の違いに関係なく、 αエラーは、5％程度

32.

Studentの検定 vs Welchの検定表3．標準偏差は同じ場合のStudentの𝑡検定およびWelchの𝑡検定の棄却割合 (シミュレーション回数：1000回) サンプルサイズ平均標準偏差 Studentの Welchの実薬群対照薬群実薬群対照薬群実薬群対照薬群 𝑡検定(%) 𝑡検定(%) サンプルサイズは等しい 100 100 0 0.5 1 1 94.50 94.50 100 100 0 1 1 1 100.00 100.00 100 100 0 2 1 1 100.00 100.00 100 100 0 4 1 1 100.00 100.00 10 10 0 0.5 1 1 18.60 18.20 10 10 0 1 1 1 56.50 56.10 10 10 0 2 1 1 99.30 99.30 10 10 0 4 1 1 100.00 100.00 サンプルサイズは異なる 200 100 0 0.5 1 1 98.40 98.30 200 100 0 1 1 1 100.00 100.00 200 100 0 2 1 1 100.00 100.00 200 100 0 4 1 1 100.00 100.00 20 10 0 0.5 1 1 24.80 24.30 20 10 0 1 1 1 69.80 68.50 20 10 0 2 1 1 100.00 99.90 20 10 0 4 1 1 100.00 100.00 © A2 Healthcare Corporation Confidential 32 Studentの検定サンプルサイズが小さく、平均の差も小さいと検出力は下がる Welchの検定サンプルサイズが小さく、平均の差も小さいと検出力は下がる

33.

Studentの検定 vs Welchの検定表４．平均、分散ともに異なる場合のStudentの𝑡検定およびWelchの𝑡検定の棄却割合(シミュレーション回数：1000回) サンプルサイズ平均標準偏差 Studentの Welchの実薬群対照薬群実薬群対照薬群実薬群対照薬群 𝑡検定(%) 𝑡検定(%) サンプルサイズは等しい 100 100 0 2 1 0.25 100.00 100.00 100 100 0 2 1 0.5 100.00 100.00 100 100 0 2 1 2 100.00 100.00 100 100 0 2 1 4 99.70 99.70 10 10 0 2 1 0.25 100.00 100.00 10 10 0 2 1 0.5 100.00 100.00 10 10 0 2 1 2 74.50 73.00 10 10 0 2 1 4 31.10 27.40 サンプルサイズは異なる 200 100 0 2 1 0.25 100.00 100.00 200 100 0 2 1 0.5 100.00 100.00 200 100 0 2 1 2 100.00 100.00 200 100 0 2 1 4 99.80 99.80 20 10 0 2 1 0.25 100.00 100.00 20 10 0 2 1 0.5 100.00 100.00 20 10 0 2 1 2 89.50 77.10 20 10 0 2 1 4 54.00 29.30 © A2 Healthcare Corporation Confidential 33 Studentの検定サンプルサイズが小さく、標準偏差の差が大きいと検出力は下がる Welchの検定サンプルサイズが小さく、標準偏差の差が大きいと Studentのt検定よりも顕著に検出力は下がる

34.

Studentの検定 vs Welchの検定表４．平均、分散ともに異なる場合のStudentの𝑡検定およびWelchの𝑡検定の棄却割合(シミュレーション回数：1000回) サンプルサイズ平均標準偏差 Studentの Welchの実薬群対照薬群実薬群対照薬群実薬群対照薬群 𝑡検定(%) 𝑡検定(%) サンプルサイズは等しい 100 100 0 0.5 1 0.25 100.00 100.00 100 100 0 0.5 1 0.5 99.50 99.50 100 100 0 0.5 1 2 61.80 61.60 100 100 0 0.5 1 4 24.30 24.30 10 10 0 0.5 1 0.25 32.00 29.30 10 10 0 0.5 1 0.5 28.20 27.10 10 10 0 0.5 1 2 10.80 9.90 10 10 0 0.5 1 4 8.40 7.30 サンプルサイズは異なる 200 100 0 0.5 1 0.25 100.00 100.00 200 100 0 0.5 1 0.5 100.00 100.00 200 100 0 0.5 1 2 75.70 64.20 200 100 0 0.5 1 4 40.70 22.70 20 10 0 0.5 1 0.25 28.60 53.30 20 10 0 0.5 1 0.5 27.00 42.50 20 10 0 0.5 1 2 21.40 10.60 20 10 0 0.5 1 4 19.30 6.40 © A2 Healthcare Corporation Confidential 34 Studentの検定分散の差が大きいと検出力は下がるサンプルサイズが小さく、分散の差が大きいとさらに検出力は下がる Welchの検定分散の差が大きいと検出力は下がるサンプルサイズが小さく、分散の差が大きいと Studentのt検定よりも顕著に検出力は下がる

35.

Studentの検定 vs Welchの検定表４．平均、分散ともに異なる場合のStudentの𝑡検定およびWelchの𝑡検定の棄却割合(シミュレーション回数：1000回) サンプルサイズ平均標準偏差 Studentの Welchの実薬群対照薬群実薬群対照薬群実薬群対照薬群 𝑡検定(%) 𝑡検定(%) サンプルサイズは等しい 100 100 0 1 1 0.25 100.00 100.00 100 100 0 1 1 0.5 100.00 100.00 100 100 0 1 1 2 99.10 99.10 100 100 0 1 1 4 68.70 68.30 10 10 0 1 1 0.25 83.00 79.00 10 10 0 1 1 0.5 77.50 75.10 10 10 0 1 1 2 26.80 25.20 10 10 0 1 1 4 12.50 11.30 サンプルサイズは異なる 200 100 0 1 1 0.25 100.00 100.00 200 100 0 1 1 0.5 100.00 100.00 200 100 0 1 1 2 99.80 99.50 200 100 0 1 1 4 83.40 67.40 20 10 0 1 1 0.25 90.70 98.80 20 10 0 1 1 0.5 85.80 94.20 20 10 0 1 1 2 45.50 28.00 20 10 0 1 1 4 28.30 11.20 © A2 Healthcare Corporation Confidential 35 Studentの検定分散の差が大きいと検出力は下がるサンプルサイズが小さく、分散の差が大きいとさらに検出力は下がる Welchの検定分散の差が大きいと検出力は下がるサンプルサイズが小さく、分散の差が大きいと Studentのt検定よりも顕著に検出力は下がる

36.

Studentの検定 vs Welchの検定表４．平均、分散ともに異なる場合のStudentの𝑡検定およびWelchの𝑡検定の棄却割合(シミュレーション回数：1000回) サンプルサイズ平均標準偏差 Studentの Welchの実薬群対照薬群実薬群対照薬群実薬群対照薬群 𝑡検定(%) 𝑡検定(%) サンプルサイズは等しい 100 100 0 4 1 0.25 100.00 100.00 100 100 0 4 1 0.5 100.00 100.00 100 100 0 4 1 2 100.00 100.00 100 100 0 4 1 4 100.00 100.00 10 10 0 4 1 0.25 100.00 100.00 10 10 0 4 1 0.5 100.00 100.00 10 10 0 4 1 2 99.90 99.90 10 10 0 4 1 4 81.80 78.70 サンプルサイズは異なる 200 100 0 4 1 0.25 100.00 100.00 200 100 0 4 1 0.5 100.00 100.00 200 100 0 4 1 2 100.00 100.00 200 100 0 4 1 4 100.00 100.00 20 10 0 4 1 0.25 100.00 100.00 20 10 0 4 1 0.5 100.00 100.00 20 10 0 4 1 2 100.00 100.00 20 10 0 4 1 4 94.30 79.00 © A2 Healthcare Corporation Confidential 36 Studentの検定サンプルサイズが小さく、分散の差が大きいと検出力は下がる Welchの検定サンプルサイズが小さく、分散の差が大きいと Studentのt検定よりも顕著に検出力は下がる

37.

Studentの検定 vs Welchの検定サンプルサイズ大きい等しい小さい大きい異なる小さい標準偏差 αエラー Studentの Welchの𝑡検定 𝒕検定等しいーーーーー ↑ ーーーーーーーー異なる ↑ ー等しい異なる等しい異なる等しい異なる Studentの検定において、サンプルサイズ、標準偏差が異なる場合、標準偏差の差が大きくなるほど、αエラーが大きくなる →Studentの検定は、標準偏差の違いに頑健性がない © A2 Healthcare Corporation Confidential 37

38.

Studentの検定 vs Welchの検定サンプルサイズ大きい等しい小さい大きい異なる小さい標準偏差検出力 Studentの Welchの𝒕検定 𝑡検定等しいーーー ↓ ーーー異なる ↓ 等しい異なる等しい異なる等しい異なるーーー ↓ ーーー ↓ サンプルサイズが小さく、標準偏差の差が大きい場合、Welchの検定、 Studentの検定共に検出力が低下する。加えて、サンプルサイズが異なる場合、Welchの検定は、 Studentの検定と比較して、顕著に検出力が低下する。 → Welchの検定は、サンプルサイズの大きさ、違いに頑健性がない © A2 Healthcare Corporation Confidential 38

39.

Studentの検定 vs Welchの検定サンプルサイズ標準偏差検出力 Studentの Welchの𝒕検定 𝑡検定ーー異なるーー等しい等しいーー小さい異なる ↓ ↓ 等しいー →Welchの検定がStudentのー検定と比較して、大きい異なるーー異なる必ずしも頑健であるとは言えない等しいーー大きい小さい等しい異なる ↓ ↓ サンプルサイズが小さく、標準偏差の差が大きい場合、Welchの検定、 Studentの検定共に検出力が低下する。加えて、サンプルサイズが異なる場合、Welchの検定は、 Studentの検定と比較して、顕著に検出力が低下する。 → Welchの検定は、サンプルサイズの大きさ、違いに頑健性がない © A2 Healthcare Corporation Confidential 39

40.

まとめ Studentの検定(等分散性を仮定する)：分散の違い Welchの検定(等分散性を仮定しない)：サンプルサイズの大きさ、違いに頑健性がない →場合により、Welchの検定、Studentの検定を使い分ける必要がある検定をSASで実行する場合、ttestプロシジャが使用できるまた、glmプロシジャやmixedプロシジャを使用することもできる © A2 Healthcare Corporation Confidential 40

41.

参考文献 MIXED.pdf (osaka-u.ac.jp) 【SAS】分散分析 | Data Science Blog (clear-data-science-blog.com) PROC GLM: Randomized Complete Blocks with Means Comparisons and Contrasts :: SAS/STAT(R) 9.3 User's Guide Technical Support (sas.com) t分布を超わかりやすく解説(t分布で区間推定！)【統計学入門26】 (datawokagaku.com) 坂巻顕太朗. “第15回無計画な解析における問題”. 生物統計学の道標.一般財団法人厚生労働統計協会, 2023, 149154 田中豊、中西寛子、姫野哲人、酒折文武、山本義郎. 改訂版日本統計学会公式認定統計検定2級対応統計学基礎, 2018, 150-154 229-230 宮岡悦良、吉澤敦子．データ解析のためのSAS統計入門.株式会社朝倉書店, 2008, 178 316-317 吉村功．毒性・薬効データの統計解析ー事後研究によるアプローチー.株式会社サイエンティスト社, 2005, 30-34 小島寛之．完全独習統計学入門.ダイヤモンド社, 2022, 180-187 Reporting degrees of freedom for Welch t-test - Cross Validated (stackexchange.com) © A2 Healthcare Corporation Confidential 41

42.

データサイエンス本部杉本真理 0 3- 38 3 0 -11 22 ／[email protected] 〒112-0002 東京都文京区小石川 1-4-1住友不動産後楽園ビル 20F（総合受付） http://www.a2healthcare.com/

http://www.a2healthcare.com/