経営統計_11_統計的仮説検定の例

656 Views

January 05, 24

スライド概要

神戸大学経営学部で2022年度より担当している「経営統計」の講義資料「11_統計的仮説検定の例」を公開用に調整したものです。

profile-image

神戸大学経営学研究科准教授 分寺杏介(ぶんじ・きょうすけ)です。 主に心理学的な測定・教育測定に関する研究を行っています。 講義資料や学会発表のスライドを公開していきます。 ※スライドに誤りを見つけた方は,炎上させずにこっそりお伝えいただけると幸いです。

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

経営統計 11 統計的仮説検定の例 分寺 杏介 神戸大学  経営学部 bunji@bear.kobe-u.ac.jp ※本スライドは,クリエイティブ・コモンズ 表示-非営利 4.0 国際 ライセンス(CC BY-NC 4.0)に従って利用が可能です。

2.

前回のおさらい 検定の種類によって 使用する検定統計量 その確率分布が異なる ▼ すべて覚えるのは無理 ▼ 基本的な流れだけ 頭に叩き込んでおく ▼ あとは必要に応じて 調べながらやるだけ 細かい書き方は教科書によって異なるので 基本的な流れだけは理解しておいてください。 1 仮説を設定する 2 帰無仮説が正しいときの検定統計量の分布を考える 3 標本から得られた検定統計量の値の起こりやすさを考える 4 帰無仮説を棄却するかを判断する 今回は具体的な仮説検定の流れを ひたすら紹介していきます ということで以後はほぼ同じフォーマットを繰り返していきます 11 統計的仮説検定の例 2

3.

平均値の検定 11 統計的仮説検定の例 3

4.

平均値の検定 問 ある会社では電球を作っています。 今年度からSDGsの煽りを受けて一部の素材を再資源化されたものに切り替えました。 変更した素材が電球の寿命に影響を及ぼさないか確認するため, ランダムに25個の電球を取り出してテストを行いました。 その結果,新しい電球の寿命は平均で1960時間となりました。 ちなみに,素材変更前の電球は,その寿命が平均2000時間,標準偏差100時間でした。 さて,この電球の寿命は従来のものより短くなっているでしょうか?統計的に検証してください。 旧 平均2000時間 素材の一部に 空き缶を再利用 SDGs 11 統計的仮説検定の例 新 まあ誤差ってことで 見なかったことにするか… 平均1960時間 4

5.

平均値の検定 1 仮説を設定する ▌まずは母集団分布を仮定する 母集団分布の仮定は問題設定に含まれていることもありますが 特に指定がない場合には自分で考える必要があります。 電球の耐久時間は正規分布に従うはず(そう仮定しても問題ないだろう) ▌どのパラメータが検証の対象かをはっきりさせておくとよい 母集団分布が正規分布ならば… 新しい電球の寿命の分布 𝑁 𝜇, 1002 もちろん電球の寿命には個体差があるが, 平均的には従来と同じ2000時間ならば とりあえず問題はないと言えそう ▶ 𝑁 𝜇, 𝜎 2 の 𝜇 が2000かどうかを検定する ここでは一旦標準偏差を過去の結果と同じ100時間としておきます 11 統計的仮説検定の例 5

6.

平均値の検定 1 仮説を設定する ▌まずは母集団分布を仮定する 母集団分布の仮定は問題設定に含まれていることもありますが 特に指定がない場合には自分で考える必要があります。 電球の耐久時間は正規分布に従うはず ▌どのパラメータが検証の対象かをはっきりさせておくとよい 母集団分布が正規分布ならば, 𝑁 𝜇, 1002 の 𝜇 に関心がある 今回は両側検定にしておきます 【実際に検証したいこと】 平均寿命は2000時間ではない 𝜇 ≠ 2000 alternative hypothesis 現実には どちらか 一方だけが 正しい 対立仮説 11 統計的仮説検定の例 【◀の逆】 平均寿命は2000時間である 𝜇 = 2000 null hypothesis 帰無仮説 6

7.

平均値の検定 2 帰無仮説が正しいときの検定統計量の分布を考える ▌検定統計量は推定のときと同じ考え方で 母平均の検定の場合は,標本平均を用いて考えたら良い 平均寿命は2000時間である 𝜇 = 2000 𝑁 2000, 202 帰無仮説の元での分布 null hypothesis 帰無仮説 ▶ 帰無分布 こちらが正しい場合 25個体(標本)での寿命の標本平均は 100 𝑋ത ∼ 𝑁 2000, 25 2 = 𝑁 2000, 202 に従う 中心極限定理により 11 統計的仮説検定の例 7

8.

平均値の検定 3 標本から得られた検定統計量の値の起こりやすさを考える 𝑁 2000, 202 ▌両側検定 正規分布 𝑋ത ∼ 𝑁 2000, 202 において 標本平均が1960時間よりも極端になる確率は 極端に低い 𝑃 𝑋ത ≤ 1960 極端に高い + 𝑃(𝑋ത ≥ 2040) 標準化したら 極端に低い 1960 − 2000 ҧ 𝑃 𝑍≤ 20 極端に高い 2040 − 2000 ҧ + 𝑃 𝑍≥ 20 11 統計的仮説検定の例 どうせ標準化するので 初めから検定統計量を 𝑍ҧ とすることも多い 𝑍ҧ ∼ 𝑁(0,1) 8

9.

平均値の検定 3 標本から得られた検定統計量の値の起こりやすさを考える 𝑁 0, 1 ▌両側検定 正規分布 𝑋ത ∼ 𝑁 2000, 202 において 𝜇 = 2000 の場合 25個体での標本平均が 2000時間から40時間以上ずれる確率は およそ4.55% 4 𝑃 𝑍ҧ ≤ −2 𝑃 𝑍ҧ ≥ 2 𝑝 = 0.0455 帰無仮説を棄却するかを判断する 25個体の平均が1960時間というのは 𝜇 = 2000 だとすると結構レアなこと 𝑝 < 𝛼 のため ▶ 帰無仮説が間違っていると言えそう(棄却する) 11 統計的仮説検定の例 耐久性下がってますよ! 元の素材に戻すべきだ! 問題視するほどの誤差なのかは また別の話 9

10.

(補足)平均値の検定|片側検定の場合 3 標本から得られた検定統計量の値の起こりやすさを考える 𝑁 2000, 202 ▌片側検定 正規分布 𝑋ത ∼ 𝑁 2000, 202 において 標本平均が1960時間よりも短くなる確率は 極端に低い 𝑃 𝑋ത ≤ 1960 極端に高い + 𝑃(𝑋ത ≥ 2040) 標準化したら 極端に低い 1960 − 2000 ҧ 𝑃 𝑍≤ 20 極端に高い 2040 − 2000 ത + 𝑃 𝑋≥ 20 11 統計的仮説検定の例 どうせ標準化するので 初めから検定統計量を 𝑍ҧ とすることも多い 𝑍ҧ ∼ 𝑁(0,1) 10

11.

(補足)平均値の検定|片側検定の場合 3 標本から得られた検定統計量の値の起こりやすさを考える 𝑁 0, 1 ▌片側検定 正規分布 𝑋ത ∼ 𝑁 2000, 202 において 𝜇 = 2000 の場合 25個体での標本平均が 2000時間より40時間以上短くなる確率は およそ2.28% 𝑃 𝑍ҧ ≤ −2 𝑝 = 0.0288 (両側検定のときの半分) 4 帰無仮説を棄却するかを判断する 25個体の平均が1960時間というのは 𝜇 = 2000 だとすると結構レアなこと 𝑝 < 𝛼 のため ▶ 帰無仮説が間違っていると言えそう(棄却する) 11 統計的仮説検定の例 11

12.

平均値の検定 母分散がわからないバージョン 11 統計的仮説検定の例 12

13.

平均値の検定その2 問 【前の例の続き】 よく考えたら,素材変更後も電球の寿命の個体差が同じ(標準偏差100時間)とは限りません。 実際に,先程テストした25個の電球では,平均が1960時間,標準偏差120時間でした。 さて,この電球の寿命は従来のものより短くなっているでしょうか?統計的に検証してください。 旧 平均2000時間 標準偏差100時間 素材の一部に 空き缶を再利用 SDGs 新 中心極限定理では標本平均の標本分布が 𝜎2 𝑁 𝜇, 𝑛 ▼ 平均1960時間 母分散がいくつなのかによって 𝑝 値は大きく変わるはず 標準偏差120時間 ばらつきが大きいってことは たまたまザコ個体が選ばれてたかも? 11 統計的仮説検定の例 13

14.

平均値の検定 1 仮説を設定する ▌まずは母集団分布を仮定する 母集団分布の仮定は問題設定に含まれていることもありますが 特に指定がない場合には自分で考える必要があります。 電球の耐久時間は正規分布に従うはず(そう仮定しても問題ないだろう) ▌どのパラメータが検証の対象かをはっきりさせておくとよい 母集団分布が正規分布ならば… 新しい電球の寿命の分布 𝑁 𝜇, 𝜎 2 もちろん電球の寿命には個体差があるが, 平均的には従来と同じ2000時間ならば とりあえず問題はないと言えそう ▶ 𝑁 𝜇, 𝜎 2 の 𝜇 が2000かどうかを検定する 前の例との違いは 𝜎 2 がわからないということだけ 11 統計的仮説検定の例 14

15.

平均値の検定 1 仮説を設定する ▌まずは母集団分布を仮定する 母集団分布の仮定は問題設定に含まれていることもありますが 特に指定がない場合には自分で考える必要があります。 電球の耐久時間は正規分布に従うはず(そう仮定しても問題ないだろう) ▌どのパラメータが検証の対象かをはっきりさせておくとよい 母集団分布が正規分布ならば, 𝑁 𝜇, 𝜎 2 の 𝜇 に関心がある 今回は両側検定にしておきます 【実際に検証したいこと】 平均寿命は2000時間ではない 𝜇 ≠ 2000 alternative hypothesis 現実には どちらか 一方だけが 正しい 対立仮説 11 統計的仮説検定の例 【◀の逆】 平均寿命は2000時間である 𝜇 = 2000 null hypothesis 帰無仮説 15

16.

平均値の検定 2 帰無仮説が正しいときの検定統計量の分布を考える ▌検定統計量は推定のときと同じ考え方で 母平均の検定の場合は,標本平均を用いて考えたら良い 母分散が分からないので 標本分散からの推定値を使う ▼ 平均寿命は2000時間である 𝜇 = 2000 null hypothesis 帰無仮説 こちらが正しい場合の 25個体(標本)での 標本平均の標本分布を考えたい 不偏分散は 𝑛 𝑠𝑥2 𝑛−1 = 25 24 × 1202 = 15000 ▼ 中心極限定理的には標本平均の標本分布は 15000 𝑋ത ∼ 𝑁 2000, ≃ 𝑁 2000, 24.492 25 となりそうだが…? 11 統計的仮説検定の例 16

17.

平均値の検定 2 帰無仮説が正しいときの検定統計量の分布を考える ▌母分散ではなく不偏分散を用いたときの標本分布は 母分散が 資料09 p. 48 の場合の標本平均の標本分布 標本平均の標本分布を 分布で表していく 標本平均の標本分布を 出する場合は = 1 【 】 母分散を使って標本平均を標準化した値 2 2 2 × 1 2 ( = 1) 1 2 ( 1) 1 不偏分散を使って標本平均を標準化した値 の標本分布は の標本分布は 1 標準正規分布になる 自 度 2 1 の 分布になる 定 11 統計的仮説検定の例 17

18.

平均値の検定 2 帰無仮説が正しいときの検定統計量の分布を考える 母分散がわかっているとき 不偏分散で代用したとき 分散の推定値のばらつき の影響が加わるため 正規分布 標本平均の 標本分布 正規分布 よりも 少しだけ 裾が重い 標準正規分布 𝑁(0,1) 標準化したら 𝑡 分布 𝑡(𝑛 − 1) 11 統計的仮説検定の例 18

19.

平均値の検定 3 標本から得られた検定統計量の値の起こりやすさを考える ▌両側検定 標本平均 𝑋ത を平均値2000,不偏分散に基づく標準誤差 標準化した値 𝑡 = ▶ 𝑡 が標本での値 𝑋ത −2000 15000/25 は自由度 24 の 𝑡 分布に従う 1960−2000 15000/25 15000 25 によって 𝑡 24 ≃ −1.63 よりも 極端になる確率は 極端に低い 𝑃 𝑡 ≤ −1.63 極端に高い + 𝑃(𝑡 ≥ 1.63) 11 統計的仮説検定の例 19

20.

平均値の検定 3 標本から得られた検定統計量の値の起こりやすさを考える 𝑡 24 ▌両側検定 𝑡 分布 𝑡(24) において 𝜇 = 2000 の場合 不偏分散をもとに標準化した標本平均が -1.63よりも極端になる確率は 𝑡 分布表にはありませんが とりあえず5%よりは高い 4 ちゃんと計算すると 𝑝 = 0.1161 帰無仮説を棄却するかを判断する 25個体の平均が1960時間というのは 𝑝 ≥ 𝛼 のため 𝜇 = 2000 だとしてもまあまああり得ること 安定性下がってるけど それはいいのかい? ▶ 帰無仮説が間違っているとは言えない(棄却できない) 11 統計的仮説検定の例 20

21.

(補足)母平均の検定について ▌中心極限定理のおかげで 母集団分布が何であっても標準正規分布 または 𝑡 分布の検定になる ▌基本的には 𝑡 検定 母分散がわかっているのはかなり限られたケースだと思っておいて良い サンプルサイズが大きければ 𝑁(0,1) と 𝑡 分布はほぼ同じになる ▌母集団分布が二項分布の場合 帰無仮説は成功確率 𝑝 について設定される (𝑛 は既知) ▶ 平均値 [𝑛𝑝] と分散 𝑛𝑝 1 − 𝑝 が同時に決まるため標準正規分布の検定になる 11 統計的仮説検定の例 21

22.

(補足)標本平均に関する検定は他にも 𝑡 分布に帰着する ▌2標本の検定 問 血圧を下げる2つの新薬A, Bを考えます。 ランダムに選ばれた50人ずつを対象にテストを行いました。 その結果,新薬Aを投与された人は平均で15mmHg, 新薬Bを投与された人は平均で12mmHg下がりました。 この新薬AとBの効果に差はあるでしょうか?統計的に検証してください。 効果の平均に差はない 𝜇𝐴 − 𝜇𝐵 = 0 (𝜇𝐴 = 𝜇𝐵 ) null hypothesis 帰無仮説 2 平均値差を(平均0)と不偏分散𝑠෢ 𝑥 に基づく標準誤差で標準化した値 𝑡= 𝑥𝐴ҧ − 𝑥ҧ𝐵 (−0) 1 2 1 𝑠෢ + 𝑥 𝑛 𝑛2 1 ▶ これが自 度𝑛1 + 𝑛2 − 2の𝑡分布に従う 2 𝑠෢ 𝑥 は各グループの標本で算出した不偏分散を サンプルサイズで重みづけた平均 11 統計的仮説検定の例 22

23.

(補足)標本平均に関する検定は他にも 𝑡 分布に帰着する ▌2標本の検定その2 問 ID 効果A 効果B 𝑥𝐴 − 𝑥𝐵 血圧を下げる2つの新薬A, Bを考えます。 ランダムに選ばれた50人に,初日は新薬Aを,翌日には新薬Bを 投与してみました。 その結果,個人ごとの効果が右の表のようになりました。 この新薬AとBの効果に差はあるでしょうか?統計的に検証してください。 1 8 12 -4 2 10 7 3 ︙ ︙ ︙ ︙ 49 0 5 -5 50 -3 -6 3 2 個人ごとの効果差 𝑥𝐴 − 𝑥𝐵 の母集団分布が正規分布 𝑁 𝜇𝐴−𝐵 , 𝜎𝐴−𝐵 に従うと考えると 効果の平均に差はない 𝜇𝐴−𝐵 = 0 null hypothesis 帰無仮説 𝑡= 𝑥𝐴 − 𝑥𝐵 (−0) ▶ これが自 2 𝑠෣ 𝐴−𝐵 /𝑛 度𝑛 − 1の 𝑡 分布に従う つまりpp. 13-20と全く同じです 11 統計的仮説検定の例 23

24.

相関係数の検定 ルーティーンだけ感じてください 11 統計的仮説検定の例 24

25.

相関係数の検定 あるスーパーでは新商品のおせんべいのDMを送るターゲットを決めることにしました。 そこで,過去1年間におけるお ん いの が多い属性を探ることにしました。 100人分の顧客のPOSデータから との相関を算出したところ,0.2の相関が見られました。 さて,おせんべい購入数と年齢には相関があるでしょうか?統計的に検証してください。 母集団 せんべいをよく買う ▶ 広告を出す意味がありそう 標本 ん い 問 高齢者 𝑟 = 0.2 (潜在的な) すべての顧客 POSデータがある 顧客100人 若者 11 統計的仮説検定の例 せんべいをあまり買わない ▶ 広告を出しても意味なさそう 25

26.

相関係数の検定 1 仮説を設定する そもそも以前紹介した相関係数自体が正規分布を前提としたもの なので,正規分布以外ではこの検定は使えないと思ってください。 ▌まずは母集団分布を仮定する 2つの変数がいずれも正規分布に従っていると仮定します ▌どのパラメータが検証の対象かをはっきりさせておくとよい 母集団での真の相関係数を 𝜌 (ロー) と置きます 母集団 年齢と (潜在的な)せんべい購入数 の相関 𝜌 今回の 標本 𝑟 = 0.2 𝑟 = 0.15 𝑟 = −0.04 𝑟 = 0.01 母集団で相関があるか検証したい ▶ 𝜌 が0かどうかを検定する サンプリングを繰り返したとしたら 標本ごとに異なる標本相関係数が出る 資料05 p. 23 の考え方 ▶ 標本相関係数の標本分布が得られる 11 統計的仮説検定の例 26

27.

相関係数の検定 1 仮説を設定する ▌まずは母集団分布を仮定する 母集団分布の仮定は問題設定に含まれていることもありますが 特に指定がない場合には自分で考える必要があります。 2つの変数がいずれも正規分布に従っていると仮定します ▌どのパラメータが検証の対象かをはっきりさせておくとよい 母集団分布での相関係数 𝜌 に関心がある 【実際に検証したいこと】 母集団の相関係数は0ではない 𝜌≠0 alternative hypothesis 対立仮説 現実には どちらか 一方だけが 正しい 11 統計的仮説検定の例 【◀の逆】 母集団の相関係数は0である 𝜌=0 null hypothesis 帰無仮説 27

28.

相関係数の検定 2 帰無仮説が正しいときの検定統計量の分布を考える ▌検定統計量は推定のときと同じ考え方で 母相関係数の検定の場合は,標本相関係数を用いて考えたら良い 母集団の相関係数は0である 𝜌=0 null hypothesis 𝑡 98 帰無仮説の元での分布 帰無仮説 ▶ 帰無分布 こちらが正しい場合 標本相関係数 𝑟 を変換した値 𝑡= 𝑟 1− 𝑟2 𝑛 − 2 は自 度 𝑛 − 2 の 𝑡 分布に従う 実際にはソフトウェアがやってくれるので原理だけ理解しましょう 11 統計的仮説検定の例 28

29.

相関係数の検定 3 標本から得られた検定統計量の値の起こりやすさを考える ▌両側検定 標本相関係数 𝑟 を変換した値 𝑡 = ▶ 𝑡 が標本での値 0.2 1−0.22 𝑟 1−𝑟 2 𝑛 − 2 は自由度 𝑛 − 2 の 𝑡 分布に従う 98 ≃ 1.99 よりも 極端になる確率は 極端に低い 𝑃 𝑡 ≤ −1.99 𝑡 98 極端に高い + 𝑃(𝑡 ≥ 1.99) 11 統計的仮説検定の例 29

30.

相関係数の検定 3 標本から得られた検定統計量の値の起こりやすさを考える 𝑡 98 ▌両側検定 母相関係数が 𝜌 = 0 だとすると 𝜌 = 0 の場合 100人での標本相関係数の絶対値が 0.2以上になる確率は とりあえず5%よりは低い 4 ちゃんと計算すると 𝑝 = 0.0494 帰無仮説を棄却するかを判断する 100人での標本相関係数が0.2というのは 𝜌 = 0 だとすると結構レアなこと 𝑝 < 𝛼 のため ▶ 帰無仮説が間違っていると言えそう(棄却する) 11 統計的仮説検定の例 つまり高齢者メインで DMを送りつけたらいいんだね? 30

31.

(超補足)母相関係数の推定 Ingram Olkin. John W. Pratt. "Unbiased Estimation of Certain Correlation Coefficients." Ann. Math. Statist. 29 (1) 201 - 211, March, 1958. https://doi.org/10.1214/aoms/1177706717 ▌点推定 実用的には標本相関係数が用いられる(最尤 定量のため) ※不偏 定量ではないが,不偏 定量は計算が相当めんどくさいのでほぼ使われない ▌ 区間推定 1 2 母相関係数が 𝜌 のとき, 𝜌∗ = log 1+𝜌 1−𝜌 とおくと 1 2 標本相関係数 𝑟 を同様に変換した 𝑟 ∗ = log ▶ 𝜌 の95%信頼区間は ∗ 資料09 p. 42 𝜌𝐿∗ = 𝑟 ∗ − 1.96 1 𝑛−3 𝜌𝐻∗ = 𝑟 ∗ + 1.96 1 𝑛−3 ▶ 具体的には 1+𝑟 1−𝑟 フィッシャーのz変換と呼ばれるものです。 「そういう変換があるんだなぁ」と頭の片隅においてください。 は近似的に正規分布 𝑁 𝜌∗ , 1 𝑛−3 に従う と同じように 𝑟 ∗ ± 1.96 ×(標準誤差)になる exp 2𝜌𝐿∗ − 1 exp 2𝜌𝐻∗ − 1 ▶ 𝜌 に戻すと ≤𝜌≤ exp 2𝜌𝐿∗ + 1 exp 2𝜌𝐻∗ + 1 11 統計的仮説検定の例 31

32.

クロス表の検定 11 統計的仮説検定の例 32

33.

クロス表の検定 問 【前の例のつづき】 DMのターゲットを決めるために,続いて性別との関連を見てみることにしました。 100人分の顧客のPOSデータから「性別」と「 ん いを買ったことがあるか」の2つの変数で でクロス表を作成しました。 さて,おせんべい購入歴と性別には関連があるでしょうか?統計的に検証してください。 母集団 (潜在的な) すべての顧客 標本 POSデータがある 顧客100人 11 統計的仮説検定の例 クロス表 男 女 計 せんべい 有 購入歴 無 17 18 35 23 42 65 計 40 60 100 性別によって購入率に有意差があれば どちらかにターゲットを絞ってもよさそう 33

34.

クロス表の検定 1 仮説を設定する ▌まずは母集団分布を仮定する 厳密に言えば,「クロス表の各セルに所属する確率がそれぞれある値」 という確率分布(多項分布)が仮定されます 特別な仮定は不要です。 ▌どのパラメータが検証の対象かをはっきりさせておくとよい 母集団での真の連関の強さを 𝜙 (ファイ) と置きます 母集団 今回の 標本 せんべい 購入歴 性別と (潜在的な)せんべい購入有無 の連関 𝜙 せんべい 購入歴 男 女 計 せんべい 有 購入歴 無 17 18 35 23 42 65 計 40 60 100 男 女 計 有 19 16 35 無 21 44 65 計 40 60 100 男 女 計 有 15 20 35 無 25 40 65 計 40 60 100 𝜌 や 𝜇 などと違って特によく使われる表記ではない 母集団で連関があるか検証したい ▶ 𝜙 が0かどうかを検定する 資料05 サンプリングを繰り返したとしたら 標本ごとに異なる連関の強さのクロス表が出る p. 23 ▶ 標本での連関の強さの標本分布が得られる 11 統計的仮説検定の例 の考え方 34

35.

クロス表の検定 1 仮説を設定する ▌まずは母集団分布を仮定する 特別な仮定は不要です。 厳密に言えば,「クロス表の各セルに所属する確率がそれぞれある値」 という確率分布(多項分布)が仮定されます ▌どのパラメータが検証の対象かをはっきりさせておくとよい 母集団での真の連関の強さ 𝜙 (ファイ) に関心がある 【実際に検証したいこと】 母集団の連関は0ではない 𝜙≠0 alternative hypothesis 対立仮説 現実には どちらか 一方だけが 正しい 11 統計的仮説検定の例 【◀の逆】 母集団の連関は0である 𝜙=0 null hypothesis 帰無仮説 35

36.

クロス表の検定 2 帰無仮説が正しいときの検定統計量の分布を考える ▌検定統計量は推定のときと同じ考え方で 母相関係数の検定の場合は,標本相関係数を用いて考えたら良い 母集団の連関は0である 𝜙=0 𝜒2 1 帰無仮説の元での分布 null hypothesis 帰無仮説 資料03 pp. 39-42 ▶ 帰無分布 こちらが正しい場合 標本での連関の強さを表す 𝜒 2 自 値は 度 (行数-1)×(列数-1)の𝜒 2 分布に従う 2×2クロス表の場合の自 度は1 11 統計的仮説検定の例 36

37.

(補足)クロス表の自 度 ▌クロス表にあるデータの個数 基本的には行数×列数だけ値が存在する せんべい 有 購入歴 無 男 女 ① ② ③ ④ 2×2=4個 ▌クロス表での「固定」 周辺度数が固定されていると考える ①が決まると… ▼ 2×2の場合,1個決まるとあとは自動で決まる せんべい 有 購入歴 無 計 サイズが増えても… 変数2 変数1 A B C 自動 B 自動 自動 自動 自動 女 計 ① 36-① 36 41-① 23+① 64 41 59 100 自由度1 D A C 男 自由度は(行数-1)×(列数-1) 自動 11 統計的仮説検定の例 37

38.

クロス表の検定 3 標本から得られた検定統計量の値の起こりやすさを考える ▌片側検定 標本での連関の強さを表す 𝜒 2 値は自由度(行数-1)×(列数-1)の𝜒 2 分布に従う ▶ 𝜒 2 値が標本での値 1.648 よりも 極端になる確率は 𝜒2 1 極端に高い 𝑃 𝜒 2 > 1.648 連関のように,0を起点として一方向しかないようなケースでは 必ず片側検定になります 11 統計的仮説検定の例 38

39.

(補足) 𝜒 2 値の計算 資料03 pp. 39-42 ▌期待度数を求める 同じ周辺度数で連関が全くないとしたら 男 女 せんべい 有 購入歴 無 計 計 男 女 計 14 21 35 65 せんべい 有 購入歴 無 26 39 65 100 計 40 60 100 35 40 60 有×男の場合,【有の周辺度数】×【男の周辺度数】を総度数で割る (40×35)/100 ▌ズレをもとに計算する 期待度数ー観測度数 各セルごとに 期待度数 男 せんべい 購入歴 2 を計算すると 女 有 0.643 0.429 無 0.346 0.230 総和を取れば𝜒 11 統計的仮説検定の例 2 = 1.648 39

40.

クロス表の検定 3 標本から得られた検定統計量の値の起こりやすさを考える 𝜒2 1 ▌検定 母集団での連関が 𝜙 = 0 だとすると 𝜙 = 0 の場合 100人の標本で𝜒 2 が 1.648以上になる確率は とりあえず5%よりは高い 4 ちゃんと計算すると 𝑝 = 0.1992 帰無仮説を棄却するかを判断する 100人の標本で今回くらいの連関は 𝜙 = 0 だとしても割とあり得ること 𝑝 ≥ 𝛼 のため 性別はあまり関係ないかぁ ▶ 帰無仮説が間違っているとは言いきれない(棄却できない) 11 統計的仮説検定の例 40

41.

検定統計量とサンプルサイズ 資料10 pp. 23-25 ▌すべての検定統計量に共通の性質 効果の大きさと と の積になっている サンプルサイズ 𝑋ത − 𝜇0 例|標本平均の検定統計量は 𝑍ҧ = 𝜎2 𝑛 𝑋ത − 𝜇0 = × 𝜎 𝑛 ▌ということは,統計的仮説検定は 効果の大きさ が大きいほど有意になりやすい サンプルサイズ が大きいほど有意になりやすい 本質的には帰無仮説は必ず棄却されるので サンプルサイズが無限なら必ず有意になる ▌有意なら良いのか? サンプルサイズ が極端に大きい場合, 効果の大きさ がほぼゼロでも有意になる ▶ 検定の結果だけでなく,実質的な大きさも確認しておく し 11 統計的仮説検定の例 41

42.

区間推定と統計的仮説検定の関係 実はほぼ同じなのです 11 統計的仮説検定の例 42

43.

信頼区間と棄却域 ▌母分散既 の母平均の検定における棄却域 pp. 4-9 標準化 を 戻す ത 𝑋−2000 1002 /25 < −1.96 または ത 𝑋−2000 1002 /25 > 1.96 標本平均が 𝑋ത < 1960.8 または 𝑋ത > 2039.2 ならば帰無仮説は棄却される 11 統計的仮説検定の例 43

44.

信頼区間と棄却域 標準化 を ▌棄却されるギリギリの場合を考える 戻す 1/25 100 2000 2 2000 < 1.96 または > 1.96 標本平均がちょうど1960.8のとき 2 100 /25 母平均が1960.8だとしたら標本分布は 1002 𝑁 1960.8, 25 2 標本平均が 標本平均がちょうど2039.2のとき <母平均が2039.2だとしたら標本分布は 1960.8 または > 2039.2 ならば帰無仮説は棄却される 1002 𝑁 2039.2, 25 統計的仮説検定の例 95%信頼区間は 1921.6から 2000 95%信頼区間は 2000 から2078.4 95%信頼区間の端が 帰無仮説の値 (𝜇 =2000) になっている 11 統計的仮説検定の例 44

45.

つまりどういうことか 標本平均 棄却域 𝜇 = 2000 1960 1960.8 標本平均が この間 にあれば 95%区間は 帰無仮説の値 𝜇 = 2000 を含む pp. 4-9の例ではこの区間 1920.8 標本平均の値が変わると 95%区間はどう変化するか 1999.2 1921.6 1980 2000 1940.8 2019.2 1960.8 2039.2 2020 1980.8 2059.2 2039.2 2078.4 棄却域 2040 2000.8 11 統計的仮説検定の例 2079.2 45

46.

つまりどういうことか ▌統計的仮説検定と区間推定は表裏一体の関係にある における棄却域 有意水準を 𝛼 とすると(普通は 𝛼 = 5%) 両側検定の場合に限ります つまりどういうことか の例ではこの区間 = 2000 標本平均の値が変わると 区間はどう変化するか = 2000 標準化 を 戻す > 1.96 統計的仮説検定の例 標本平均が 得られた標本統計量から作った 検定統計量が棄却域に含まれる < 1960.8 または 母数の 100 − 𝛼 %信頼区間が > 2039.2 ▶ 帰無仮説が棄却される 帰無仮説の値を含まない ならば帰無仮説は棄却される 統計的仮説検定の例 実践では,検定結果と信頼区間を両方とも報告しておくのが良いとされています 11 統計的仮説検定の例 46