経営統計_08_標本分布

633 Views

December 08, 23

スライド概要

神戸大学経営学部で2022年度より担当している「経営統計」の講義資料「08_標本分布」を公開用に調整したものです。

profile-image

神戸大学経営学研究科准教授 分寺杏介(ぶんじ・きょうすけ)です。 主に心理学的な測定・教育測定に関する研究を行っています。 講義資料や学会発表のスライドを公開していきます。 ※スライドに誤りを見つけた方は,炎上させずにこっそりお伝えいただけると幸いです。

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

経営統計 08 標本分布 分寺 杏介 神戸大学 経営学部  bunji@bear.kobe-u.ac.jp ※本スライドは,クリエイティブ・コモンズ 表示-非営利 4.0 国際 ライセンス(CC BY-NC 4.0)に従って利用が可能です。

2.

前回のおさらい 確率分布を関数で表せたらだいぶ楽になってきた 例 今回はこの部分 ▶ 母集団分布が 𝑁(𝜇, 𝜎 2 ) の場合 標本分布は 𝑁(? , ? ) になる ? 母集団分布 例 標本分布𝑁(? , ? )を生み出す母集団分布は 𝑁(𝜇, 𝜎 2 )と考えるのが最も妥当 ▶ 母平均は 𝜇 と考えるのが妥当だろう! 08 標本分布 例 母集団分布に確率分布を仮定した場合 標本分布も確率分布になります ▶ 各標本の値と同じように標本統計量も 確率変数だということです 標本分布 私達が実際に 分かる範囲 標本平均 𝑥ҧ 標本平均 𝑥ҧ を生み落とした 標本分布は𝑁(? , ? )が最もしっくり来る 2

3.

標本分布とは 標本統計量の確率分布です ▶ 「標本平均の標本分布」「標本分散の標本分布」 「標本相関係数の標本分布」といった使い方をします 標本分布をもとに母数の統計的推測を行います ▶ 母集団の平均値 を推測するときには「標本平均の標本分布」を使います 母集団の 分散 を推測するときには「標本分散の標本分布」を使います 具体的に標本分布はどんな分布になるのか? ▶ もちろん標本統計量によって異なります 08 標本分布 3

4.

標本分布は無限さ 少なくとも 関数の種類 × 標本統計量の種類 だけ存在するような気がする 母集団分布が 関数の種類 標本統計量の種類 正規分布 二項分布 ポアソン分布 ︙ ガンマ分布 負の二項分布 ︙ 標本平均 標本分散 標本中央値 ︙ 標本最大値 標本相関係数 ︙ 実際には のときの の標本分布 • よく使う(関心がある)標本統計量は平均値と分散くらい • 標本平均と標本分散の標本分布には関数の種類によらない特徴がある まずは標本平均の標本分布を見てみましょう 08 標本分布 4

5.

まずは直感的に ここから先では,しばらくの間母集団分布には正規分布を仮定します サンプルサイズと標本平均の関係性を考えてみる 𝑁 170,82 ざっくり分割 全国の高校生の身長 平均値±10cmのところで 3つに分けてみる 08 標本分布 5

6.

まずは直感的に サンプルサイズと標本平均の関係性を考えてみる 1 𝑛 = 2のとき 選ばれる組み合わせの確率 1人目\2人目 Low Mid High Low 1.12% 8.33% 1.12% Mid 8.33% 62.20% 8.33% High 1.12% 8.33% 1.12% 𝑁 170,82 選ばれた2人で計算した標本平均 1人目\2人目 Low Mid High Low かなり低い やや低い 170くらい Mid やや低い 170くらい やや高い High 170くらい やや高い かなり高い 全国の高校生の身長 Lowの人とHighの人がいたら 打ち消し合って平均的なところ(170)付近に落ち着く 08 標本分布 6

7.

まずは直感的に 選ばれた 人で計算した標本平均 サンプルサイズと標本平均の関係性を考えてみる 1 全国の高校生の身長 𝑛 = 2のとき • 𝑁 170,82 人目\ 人目 かなり低い やや低い くらい やや低い くらい やや高い くらい やや高い かなり高い の人と の人がいたら 打ち消し合って平均的なところ( )付近に落ち着く 平均的には170付近の人が選ばれやすい 標本分布 • たまにすごく高い人・すごく低い人も選ばれる ▶ ただし,1人が高い値でももう1人が低い値ならば 標本平均は170くらいに落ち着いてくれる • 2人だけ選ぶと2人ともすごく低い可能性もありそう ▶ その場合標本平均も170よりすごく低くなる 全国の高校生の身長 標本平均の • 平均値は170くらいになりそうだ • でも170から大きく離れた値になる可能性もありそうだ 08 標本分布 7

8.

まずは直感的に サンプルサイズと標本平均の関係性を考えてみる 2 𝑛 = 100のとき 100人の表は作れないので Highの人数 𝑁 170,82 Lowの人数 ー の発生確率を出してみました (右に行くほど標本平均も大きい) 全国の高校生の身長 の そもそもMidの出現確率が高い上に LowとHighが相殺されることが増えるため 08 標本分布 100人の場合,High-Lowの 人数差は高確率で10人以内 8

9.

まずは直感的に サンプルサイズと標本平均の関係性を考えてみる 2 𝑛 = 100のとき の • 平均的には170付近の人が選ばれやすい 𝑁 170,82 • たまにすごく高い人やすごく低い人も選ばれる ▶ ただし,1人が高い値でももう1人が低い値ならば 標本平均は170くらいに落ち着いてくれる • 100人もいると高い/低い人ばかりの可能性はほぼゼロ ▶ 打ち消し合った結果,標本平均は170周辺に 落ち着く可能性が高くなっている 全国の高校生の身長 標本平均の • 平均値は170くらいになりそうだ • 170から大きく離れた値になる可能性は先程より低そう 08 標本分布 9

10.

実際にデータを出して見てみる 1 2人選ぶ ▶ 平均値の計算 を10万回繰り返してみる 𝑛 = 2のとき 𝑁 170,82 1人目 2人目 平均値 162.8 165.6 164.2 171.7 171.3 171.5 164.2 173.4 168.8 ︙ ︙ 186.8 全国の高校生の身長 10万個の標本平均 ▶ ヒストグラムを描くと ︙ ︙ 167.7 177.2 標本平均が最小になった回では 2人の値が(154.2, 140.2)となりました 標本平均 標本平均の • 平均値は170くらいになりそうだ • でも170から大きく離れた値になる可能性もありそうだ 08 標本分布 10

11.

実際にデータを出して見てみる 2 100人選ぶ ▶ 平均値の計算 を10万回繰り返してみる 𝑛 = 100のとき 𝑁 170,82 1人目 … 100人目 平均値 162.8 … 183.4 168.9 171.7 … 162.7 169.4 164.2 … 177.5 170.3 ︙ ︙ 186.8 全国の高校生の身長 … 10万個の標本平均 ▶ ヒストグラムを描くと ︙ ︙ 161.4 169.0 標本平均は最小でも166.7でした 標本平均 標本平均の • 平均値は170くらいになりそうだ • 170から大きく離れた値になる可能性は先程より低そう 08 標本分布 11

12.

最後に理論的な結論を 母集団分布が ここまでで感じられたこと 標本平均の標本分布の平均値は,母平均と同じ値っぽい 関数の種類 標本統計量の種類 正規分布 二項分布 ポアソン分布 ︙ ガンマ分布 負の二項分布 ︙ 標本平均 標本分散 標本中央値 ︙ 標本最大値 標本相関係数 ︙ 実際には のときの の標本分布 よく使う(関心がある)標本統計量は平均値と分散くらい 標本平均と標本分散の標本分布には関数の種類によらない特徴がある まずは標本平均の標本分布を見てみましょう 標本平均の標本分布の分散は,サンプルサイズが大きくなるほど小さいっぽい 標本分布 実際にそうなのです …ということがすでに判明しています 母集団分布が正規分布 𝑁 𝜇, 𝜎 2 であるとき 標本平均の標本分布は正規分布 𝑁 前ページまでの例では 母集団分布が 𝑁(170, 82 ) だったので… 1 2 𝑛 = 2のとき 𝑛 = 100のとき 08 標本分布 𝜎2 𝜇, 𝑛 になる 標本分布は 𝑁 82 170, 2 標本分布は 𝑁 82 170, 100 ≃ 𝑁 170, 5.662 ≃ 𝑁 170, 0.82 12

13.

標準誤差 母集団分布が正規分布 𝑁 𝜇, 𝜎 2 であるとき 標本平均の標本分布は正規分布 𝑁 𝜎2 𝜇, 𝑛 になる 𝜎 standard error (SE) 𝑛 標本分布の標準偏差のことを 標準誤 と呼ぶ 1 標本平均 𝑛 が小さいと 2 𝑛 が大きいと サンプリングを繰り返す度に 標本平均が変動しまくる サンプリングを繰り返しても 標本平均はあまり変動しない 標本平均を使って母平均を推測しても その結果は変動しまくる(=誤差) 標本平均を使って母平均を推測しても 安定した結果が得られる 標本平均 誤差は小さい方がいい ▶ サンプルサイズが大きいほど推測の確信度が上がる 08 標本分布 13

14.

正規分布以外では? 母集団分布が 17ページまでは母集団分布が正規分布の場合の話でした。 では,母集団分布が正規分布ではなかったら? 例 関数の種類 標本統計量の種類 正規分布 二項分布 ポアソン分布 ︙ ガンマ分布 負の二項分布 ︙ 標本平均 標本分散 標本中央値 ︙ 標本最大値 標本相関係数 ︙ 実際には のときの よく使う(関心がある)標本統計量は平均値と分散くらい 標本平均と標本分散の標本分布には関数の種類によらない特徴がある まずは標本平均の標本分布を見てみましょう 標本分布 当たり確率 5% の10連ガチャを引いたときの当たり回数の平均値の標本分布 母集団分布 ① 10連ガチャを3回引いたときの平均あたり回 𝐵(0.05, 10) 平均値:10 × 0.05 = 0.5 ここから17ページまでのヒストグラムは 「10連ガチャを○回引く」をそれぞれ10万回繰り返して 当たり回数の平均値を10万回計算した結果です 分散:10 × 0.05 × 0.95 = 0.475 標本平均 なかなか当たらんよね… 母平均(0.5)付近が多いけどばらついている 08 標本分布 の標本分布 14

15.

正規分布以外では? 母集団分布が 17ページまでは母集団分布が正規分布の場合の話でした。 では,母集団分布が正規分布ではなかったら? 例 関数の種類 標本統計量の種類 正規分布 二項分布 ポアソン分布 ︙ ガンマ分布 負の二項分布 ︙ 標本平均 標本分散 標本中央値 ︙ 標本最大値 標本相関係数 ︙ 実際には のときの よく使う(関心がある)標本統計量は平均値と分散くらい 標本平均と標本分散の標本分布には関数の種類によらない特徴がある まずは標本平均の標本分布を見てみましょう 標本分布 当たり確率 5% の10連ガチャを引いたときの当たり回数の平均値の標本分布 母集団分布 ② 10連ガチャを10回引いたときの平均あたり回 𝐵(0.05, 10) 平均値:10 × 0.05 = 0.5 分散:10 × 0.05 × 0.95 = 0.475 標本平均 なかなか当たらんよね… さっきよりばらつきは小さくなった気がする 08 標本分布 の標本分布 15

16.

正規分布以外では? 母集団分布が 17ページまでは母集団分布が正規分布の場合の話でした。 では,母集団分布が正規分布ではなかったら? 例 関数の種類 標本統計量の種類 正規分布 二項分布 ポアソン分布 ︙ ガンマ分布 負の二項分布 ︙ 標本平均 標本分散 標本中央値 ︙ 標本最大値 標本相関係数 ︙ 実際には のときの よく使う(関心がある)標本統計量は平均値と分散くらい 標本平均と標本分散の標本分布には関数の種類によらない特徴がある まずは標本平均の標本分布を見てみましょう 標本分布 当たり確率 5% の10連ガチャを引いたときの当たり回数の平均値の標本分布 母集団分布 ③ 10連ガチャを100回引いたときの平均あたり回 𝐵(0.05, 10) 平均値:10 × 0.05 = 0.5 分散:10 × 0.05 × 0.95 = 0.475 標本平均 なかなか当たらんよね… 相当母平均(0.5)周辺に集まっている 08 標本分布 の標本分布 16

17.

正規分布以外では? 母集団分布が 17ページまでは母集団分布が正規分布の場合の話でした。 では,母集団分布が正規分布ではなかったら? 例 関数の種類 標本統計量の種類 正規分布 二項分布 ポアソン分布 ︙ ガンマ分布 負の二項分布 ︙ 標本平均 標本分散 標本中央値 ︙ 標本最大値 標本相関係数 ︙ 実際には のときの よく使う(関心がある)標本統計量は平均値と分散くらい 標本平均と標本分散の標本分布には関数の種類によらない特徴がある まずは標本平均の標本分布を見てみましょう 標本分布 当たり確率 5% の10連ガチャを引いたときの当たり回数の平均値の標本分布 母集団分布 ④ 10連ガチャを10000回引いたときの平均あたり回 𝐵(0.05, 10) 平均値:10 × 0.05 = 0.5 分散:10 × 0.05 × 0.95 = 0.475 標本平均 なかなか当たらんよね… もう母平均(0.5)といっても過言ではない 08 標本分布 の標本分布 17

18.

拡大して見てみると ④ 10連ガチャを10000回引いたときの平均あたり回 見事に正規分布 0.47から0.53 の部分だけ 拡大すると 標本平均 【わかったこと】 標本平均 • 二項分布でも,サンプルサイズが大きくなると 標本平均はほぼ母平均に一致する • 二項分布でも,サンプルサイズが大きくなると 標本平均の標本分布は正規分布になる そういえば,p. 8に出てきた棒グラフも正規分布っぽかったなぁ… 08 標本分布 身長 Low Mid High 𝑥 -1 0 1 𝑃(𝑋 = 𝑥) 0.106 0.789 0.106 𝑛 = 100 の 18

19.

理論的には… law of large numbers 大 central limit theorem の法則 中心極限定理 母集団分布が正規分布でなくても何であっても 母集団分布が正規分布でなくても何であっても 母集団分布の平均を𝜇で表すと 母集団分布の平均を𝜇,分散を𝜎 2 で表すと サンプルサイズが大きくなるほど サンプルサイズが十分に大きいと 標本平均はどんどん母平均 𝜇 に収束していく 標本平均の標本分布は ※厳密には「期待値が定義できるとき常に成り立つ」法則 正規分布 𝑁 𝜎2 𝜇, に近づいていく 𝑛 ※厳密には「期待値と分散が定義できるとき常に成り立つ」定理 例 当たり確率 5% の10連ガチャを 𝑛 回引いたときの当たり回数の標本平均の標本分布 母集団分布が 𝐵(0.05, 10) ということは 平均0.5,分散0.475となるため 10連ガチャを 𝑛 回引いたときの当たり回数の標本平均の標本分布は 𝑁 0.5, 08 標本分布 0.475 𝑛 となる 19

20.

標本平均に関する推測|母集団分布が正規分布の場合 理論的な結果を当てはめたら 母集団分布が 𝑁(𝜇, 𝜎 2 ) の場合 標本分布は 𝑁 𝜎2 𝜇, 𝑛 になる 私達が実際に 分かる範囲 標本分布 母集団分布 標本平均 𝑥ҧ 𝜎2 標本分布𝑁 𝑥,ҧ を生み出す母集団分布は 𝑛 𝑁(𝑥,ҧ 𝜎 2 )と考えるのが最も妥当 ▶ 母平均は 𝑥ҧ と考えるのが妥当だろう! 08 標本分布 標本平均 𝑥ҧ を生み落とした 標本分布は𝑁 𝜇 = 𝜎2 𝑥,ҧ 𝑛 が最もしっくり来る 𝜎 2 がすでに分かっているとしたら 20

21.

標本平均に関する推測|正規分布以外でも 更にいうと 母集団分布が平均𝜇,分散𝜎 2 の場合 標本分布は 𝑁 𝜎2 𝜇, 𝑛 母集団が正規分布じゃなくても になる 私達が実際に 分かる範囲 標本分布 母集団分布 標本平均 𝑥ҧ 𝜎2 𝑥,ҧ 𝑛 標本分布𝑁 を生み出す母集団分布は 形はともかく母平均は 𝑥ҧ と考えるのが妥当だろう! 標本平均 𝑥ҧ を生み落とした 標本分布は𝑁 𝜇 = 𝜎2 𝑥,ҧ 𝑛 が最もしっくり来る 𝜎 2 がすでに分かっているとしたら 母集団が正規分布じゃなくても 08 標本分布 21

22.

続いて標本分散の標本分布 母集団分布が まずは母集団に正規分布を仮定した場合 関数の種類 標本統計量の種類 正規分布 二項分布 ポアソン分布 ︙ ガンマ分布 負の二項分布 ︙ 標本平均 標本分散 標本中央値 ︙ 標本最大値 標本相関係数 ︙ 実際には 𝑋 ∼ 𝑁(𝜇, 𝜎 2 ) 確率変数 𝑋 は平均 𝜇 分散 𝜎 2 の正規分布に従う,という意味です のときの よく使う(関心がある)標本統計量は平均値と分散くらい 標本平均と標本分散の標本分布には関数の種類によらない特徴がある まずは標本平均の標本分布を見てみましょう 標本分布 標準化 𝑋−𝜇 𝑍= ∼ 𝑁(0,1) 𝜎 ここからは,標準化後(𝑍)の分散の標本分布を考えます ※ もとに戻す場合は得られた確率分布を 𝜎 2 倍したら良いので 標準化された変数の分散はシンプル 𝑛 1 標本分散は 𝑠𝑥 = ෍ 𝑥 − 𝑥ҧ 𝑛 𝑖=1 𝑛 2 1 𝑍 の標本分散は 𝑠𝑧 = ෍ 𝑧 2 で求められる 𝑛 𝑖=1 単純に二乗和を取れば良い ここで, 𝑧 2 の和の確率分布を紹介します ※ 得られた確率分布を 𝑛 で割れば 𝑠𝑧 の確率分布になるので 08 標本分布 の標本分布 22

23.

カイ二乗分布|chi-square distribution 標準正規分布に従う独立な確率変数の二乗の和の確率分布 𝑘 𝑥 1 −1 −2 2 𝑓 𝑋 = 𝑥 = 𝑘/2 𝑥 𝑒 2 Γ 𝑘/2 関数 パラメータ 𝑘 何個の和か あるいは自由度 (degree of freedom) 略記 𝜒 2 (𝑘) または 𝜒𝑘2 平均値 𝑘 分散 2𝑘 𝜒 2 (1) 𝑛 1 𝑍 の標本分散は 𝑧ҧ = ෍ 𝑧 2 𝑛 𝑖=1 𝑘 カイ二乗分布は ෍ 𝑧 2 の確率分布 𝑖=1 ▶ 和なので 𝑘 が大きいほど分布は右に 𝜒 2 (3) 08 標本分布 𝜒 2 (10) 23

24.

自由度? 自由度(じゆうど,英語: degree of freedom)とは,一般に,変数のうち独立に選べるものの数,すなわち, 全変数の数から,それら相互間に成り立つ関係式(束縛条件,拘束条件)の数を引いたものである。 数学的に言えば,多様体の次元である。 Wikipediaより 基本的には自由度=サンプルサイズ 例|2人の身長のデータの自由度 2人目 𝑥2 ▶ 1人目と2人目は全く関係ないので,自由度は2 統計量を考えるときには自由度がいくつか減ることも 例|身長の平均値が170cmのときの2人の身長のデータの自由度 ▶ 1人目の値によって2人目が決まってしまうので自由度は1 どこでも良い ▶ 2次元 1人目の身長 𝑥1 2人目 𝑥2 𝑥1 + 𝑥2 = 170 2 の直線上 ▶ 1次元 1人目の身長 𝑥1 08 標本分布 24

25.

標本分散の標本分布 ポイントは「標準化」しているという点 標本を標準化する場合,標本平均 𝑥ҧ を使って標準化する 𝑧 = 𝑥−𝑥ҧ 𝜎 ▶ 𝑧 2 の和を考える場合,標準化している時点で標本平均は固定される 標本における 𝑧2 𝑧 は 𝑥ҧ に関して標準化されたもの ▶ 𝑥ҧ が変われば 𝑧 も変わるため の和 標本平均が 𝑥ҧ ならば 𝑥𝑛 = 𝑛𝑥ҧ − (𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛−1 ) でないといけない ▶ 自由度は 𝑛 − 1 になる 𝑧 2 の和 ∼ 𝜒 2 (𝑛 − 1) ▼ まとめると 母集団分布が正規分布 𝑁 𝜇, 𝜎 であるとき 標準化した標本の二乗の和の標本分布は 自由度 𝑛 − 1 のカイ二乗分布 𝜒 2 (𝑛 − 1) になる 2 08 標本分布 1 𝑧 の分散 ∼ 𝑛 𝜒 2 (𝑛 − 1) ▼ 𝑥 の分散 ∼ 𝜎2 2 𝜒 (𝑛 𝑛 − 1) 25

26.

(補足)標本分散の標本分布とサンプルサイズ 標本分散に関してもサンプルサイズが大きいほど標準誤差は小さい 𝜎2 2 標本分散の標本分布は 𝜒 (𝑛 𝑛 − 1) 𝑛 が大きくなるほど 標準誤差は小さくなる 𝜒 (𝑛 − 1) の分散は 2(𝑛 − 1) なので 2 𝜎2 2 𝜒 (𝑛 𝑛 − 1) の分散は 𝜎4 2 𝑛2 𝑛−1 = 𝑛−1 𝑛2 × 2𝜎 4 ▶ 標準誤差は 𝑛−1 𝑛2 × 2𝜎 4 【𝜎 2 = 8 のとき】 𝑛 = 10 𝑛 = 100 𝑛 = 1000 標準誤差3.39 標準誤差1.13 標準誤差0.36 標本分散 標本分散 08 標本分布 標本分散 26

27.

もう少し一般化してみる 母集団分布が 母集団分布が正規分布ではない場合は? ※スライドpp. 14-17と同じようにシミュレーションしてみる 例 関数の種類 標本統計量の種類 正規分布 二項分布 ポアソン分布 ︙ ガンマ分布 負の二項分布 ︙ 標本平均 標本分散 標本中央値 ︙ 標本最大値 標本相関係数 ︙ 実際には のときの よく使う(関心がある)標本統計量は平均値と分散くらい 標本平均と標本分散の標本分布には関数の種類によらない特徴がある まずは標本平均の標本分布を見てみましょう 当たり確率 5% の10連ガチャを引いたときの当たり回数の分散の標本分布 母集団分布 ① 10連ガチャを3回引いたときのあたり回 標本分布 の分散 標本分散の平均=0.317 𝐵(0.05, 10) 平均値:10 × 0.05 = 0.5 ここから30ページまでのヒストグラムは 「10連ガチャを○回引く」をそれぞれ10万回繰り返して 当たり回数の分散を10万回計算した結果です 分散:10 × 0.05 × 0.95 = 0.475 標本分散 母分散(0.475)よりちょっと小さいのが多い? 08 標本分布 の標本分布 27

28.

もう少し一般化してみる 母集団分布が 母集団分布が正規分布ではない場合は? ※スライドpp. 14-17と同じようにシミュレーションしてみる 例 関数の種類 標本統計量の種類 正規分布 二項分布 ポアソン分布 ︙ ガンマ分布 負の二項分布 ︙ 標本平均 標本分散 標本中央値 ︙ 標本最大値 標本相関係数 ︙ 実際には のときの よく使う(関心がある)標本統計量は平均値と分散くらい 標本平均と標本分散の標本分布には関数の種類によらない特徴がある まずは標本平均の標本分布を見てみましょう 当たり確率 5% の10連ガチャを引いたときの当たり回数の分散の標本分布 母集団分布 標本分布 ② 10連ガチャを10回引いたときのあたり回 の分散 標本分散の平均=0.426 𝐵(0.05, 10) 平均値:10 × 0.05 = 0.5 分散:10 × 0.05 × 0.95 = 0.475 標本分散 やっぱり母分散(0.475)よりちょっと小さい? 08 標本分布 の標本分布 28

29.

もう少し一般化してみる 母集団分布が 母集団分布が正規分布ではない場合は? ※スライドpp. 14-17と同じようにシミュレーションしてみる 例 関数の種類 標本統計量の種類 正規分布 二項分布 ポアソン分布 ︙ ガンマ分布 負の二項分布 ︙ 標本平均 標本分散 標本中央値 ︙ 標本最大値 標本相関係数 ︙ 実際には のときの よく使う(関心がある)標本統計量は平均値と分散くらい 標本平均と標本分散の標本分布には関数の種類によらない特徴がある まずは標本平均の標本分布を見てみましょう 当たり確率 5% の10連ガチャを引いたときの当たり回数の分散の標本分布 母集団分布 標本分布 ③ 10連ガチャを100回引いたときのあたり回 の分散 標本分散の平均=0.470 𝐵(0.05, 10) 平均値:10 × 0.05 = 0.5 分散:10 × 0.05 × 0.95 = 0.475 標本分散 母分散(0.475)に近づいてきたけどまだ小さい? 08 標本分布 の標本分布 29

30.

もう少し一般化してみる 母集団分布が 母集団分布が正規分布ではない場合は? ※スライドpp. 14-17と同じようにシミュレーションしてみる 例 関数の種類 標本統計量の種類 正規分布 二項分布 ポアソン分布 ︙ ガンマ分布 負の二項分布 ︙ 標本平均 標本分散 標本中央値 ︙ 標本最大値 標本相関係数 ︙ 実際には のときの の標本分布 よく使う(関心がある)標本統計量は平均値と分散くらい 標本平均と標本分散の標本分布には関数の種類によらない特徴がある まずは標本平均の標本分布を見てみましょう 当たり確率 5% の10連ガチャを引いたときの当たり回数の分散の標本分布 母集団分布 標本分布 ④ 10連ガチャを10000回引いたときのあたり回 の分散 標本分散の平均=0.475 𝐵(0.05, 10) 平均値:10 × 0.05 = 0.5 分散:10 × 0.05 × 0.95 = 0.475 標本分散 ここまで来たらさすがに母分散(0.475)付近 08 標本分布 30

31.

▶ 2 の和を考える場合, 標準化している時点で標本平均は固定される 理論的には 標本における 2 の和 中心極限定理みたいなものはないですが… 標本平均が ならば = ( 1+ 2+ + 母集団分布が 1) 標本平均 は に関して標準化されたもの 標本分散 標本中央値 ▶ が変われば も変わるため のときの の標本分布 正規分布 二項分布 ポアソン分布 ︙ ガンマ分布 負の二項分布 ︙ まずは標本平均の標本分布を見てみましょう 具体的に何分布になるかは 母集団によって変わるが 2 𝑛 標本分布 2 1 ( 2 2 の分散 1) ( 2 1) ( 1) 標準正規分布に従う独立な確率変数の二乗の和の 𝜒 2 (𝑛 − 1) 標本分布 𝜒 2 (𝑛 − 1) の期待値は 𝑛 − 1 なので 𝜎2 2 𝜒 (𝑛 𝑛 の和 の分散 カイ二乗分布| もちろん母集団分布が正規分布のときも 2 1 ( 1) 標本分散の標本分布は よく使う(関心がある)標本統計量は平均値と分散くらい 標本平均と標本分散の標本分布には関数の種類によらない特徴がある 実際には まとめると 𝑛−1 2 標本分散の標本分布の期待値は 2 𝜎 となる , 𝑛 ちょっとだけ小さい 𝜎2 ︙ 標本最大値 標本相関係数 ︙ でないといけない 母集団分布が正規分布でなくても何であっても ▶ 自由度は 1 になる 母集団分布の分散を𝜎 2 で表すと 標本統計量の種類 関数の種類 関数 = 略記 2( 2 /2 2 1 /2 2 ) または の カイ 2 ▶ 平均値 分散 2 2 (1) 08 標本分布 1 何個の和か あるいは自由度 パラメータ 𝑛−1 2 − 1) の期待値はやはり 𝜎 𝑛 = 2 (3) 31

32.

標本分散に関する推測 理論的な結果を当てはめたら 母集団分布が平均𝜇,分散𝜎 2 の場合の標本分布は 𝑛−1 2 形はともかく期待値が 𝜎 になる 母集団が正規分布じゃなくても 𝑛 標本分布 母集団分布 形は母集団分布による 𝑛−1 2 とにかく期待値が 𝜎 𝑛 私達が実際に 分かる範囲 標本分散 𝑠𝑥2 標本分散 期待値が𝑠𝑥2 になる標本分布を生み出す母集団分布は 𝑛 形はともかく母分散は 𝑠𝑥2 と考えるのが妥当だろう! 標本分散 𝑠𝑥2 を生み落とした 標本分布の期待値は当然 𝑠𝑥2 が最もしっくり来る 𝑛−1 上の青い部分の逆数 08 標本分布 32

33.

標本分散に関する推測 母集団分布が正規分布だったら 母集団分布が 𝑁(𝜇, 𝜎 2 ) の場合 𝜎2 2 標本分布は 𝜒 (𝑛 𝑛 − 1) になる 正確には 標準化した値の和の標本分布が𝜒 2 (𝑛 − 1) 標本分布 母集団分布 私達が実際に 分かる範囲 標本分散 𝑠𝑥2 標本分散 𝑠𝑥2 標本分布 𝜒 2 (𝑛 − 1)を生み出す母集団分布は 𝑛−1 𝑛 𝑁 𝑥,ҧ 𝑠𝑥2 と考えるのが最も妥当 𝑛−1 𝑛 ▶ 母分散は 𝑠𝑥2 と考えるのが妥当だろう! 𝑛−1 08 標本分布 標本分散 𝑠𝑥2 を生み落とした 𝑠𝑥2 標本分布は 𝜒 2 (𝑛 𝑛−1 𝜎 2 のところに 𝑛 𝑠𝑥2 𝑛−1 − 1)が最もしっくり来る を代入したもの ▶ 詳細は次回! 33