27.9K Views
February 18, 23
スライド概要
2022年度統計学Iの講義資料です。
好きな色は緑です。
統計学 I-2 ・統計学の導入 ・記述統計 ・確率論 https://logics-of-blue.com/
本資料について 本資料の成り立ち 馬場が担当する学部1年生向け統計学Iの講義資料抜粋 統計学を初めて学ぶ、文系の学生が受講する想定 本資料の取り扱い あくまでも、本来の講義資料の抜粋なので注意 (計算演習・講義内クイズ・前回講義の復習 口頭での説明内容等は省略) SNSなどでスライドのスクショを張り付けるのは、 避けてほしい (文脈がわからないと、誤った理解を促すため) 2
本資料について 本資料の使い方 想定①:講義の受講者が復習に利用する 想定②:未受講者が統計学入門資料として利用する ※想定②の場合は、下記参考文献も参照すること 参考文献 馬場真哉,2022,翔泳社 『Pythonで学ぶあたらしい統計学の教科書 第2版』 倉田博史・星野崇宏,2009,新世社 『入門統計解析』 鈴木武・山田作太郎,1996,内田老鶴圃 『数理統計学』 3
本資料の範囲 8.確率論の基礎1 9.確率論の基礎2 10.確率分布の基礎1 11.確率分布の基礎2 12.代表的な確率分布 13.多次元確率分布の基礎 14.独立同一分布に従う確率変数 15.期末テスト
統計学 I 第8回:確率論の基礎
内容 1.中間テストについて 2.確率論はなぜ必要か 3.集合の記号の読み方の復習 4.確率論の基礎 6
中間テストについて 7
確率論はなぜ必要か 8
確率論について データを分析するのに、なぜ確率が必要か? 統計学の教科書では、思い出したように(?) 確率論がいきなり現れます。 →前期の後半(中間テスト以降)は確率論です 確率論が、なぜ、どのようにして使われるのか、 データを分析するのに、なぜ確率を学ぶ必要があるのか、 推測統計の基本的な考え方と合わせて説明します。
データに基づく判断・意思決定のために 【記述統計】手持ちのデータの集計 【推測統計】未知のデータに対する判断・推測 推測統計を理解するためには、確率の知識が必要 ・・・・・・なぜ?
内容 1.ガチャの事例 2.湖調査の事例
内容 1.ガチャの事例 2.湖調査の事例
確率論を学ぶ意義 ダメそうな推論の仕方 スマホゲームで10連ガチャを回しても、当たりが出ない ↓ このガチャは、当たりが一人も入ってない。不正だ!! 根拠のないクレームでは?
確率論を学ぶ意義 ダメそうな推論の流れ Step1.データ取得:10連ガチャを回す 結果:当たりキャラが出ない ↓ Step2.未知のデータに対する推測 このガチャでは、当たりキャラ出現率が0%である! ↓ Step3.予測 誰が回しても、ガチャで当たりなんか出ないよ!!! この推測・予測は明らかに間違い 確率的に、当たったり外れたりするはず
内容 1.ガチャの事例 2.湖調査の事例
推測統計の使い道 すべての魚(およそ1億尾) 湖にいる魚の体長を調べたい しかし全ての魚の体長を調べるのは無理 16
推測統計の使い道 500尾くらいなら、 体長を調べられそう 17
推測統計のテーマ 湖の中のすべての魚の体長 母集団 すべてのデータ 未知のデータを含む 標本 母集団の一部 手に入ったデータ 釣りをして得られた魚の体長 標本を使って、母集団について議論する 手持ちのデータで未知データの議論をする
確率はどこで登場するか たまたま 「中くらいのサイズ」 の魚が釣れた 19
確率はどこで登場するか たまたま 「小さめのサイズ」 の魚が釣れた 20
確率はどこで登場するか たまたま 「大きめのサイズ」 の魚が釣れた 21
確率はどこで登場するか ランダムに一部の魚を標本として抽出 ここで確率が登場する 22
確率はどこで登場するか 同じ母集団から標本を抽出しても、毎回違う結果になる 平均3cm 平均7cm 確率的に結果が変わる! 確率的に、標本の体長の平均値が 大きくなったり小さくなったりする
確率論を学ぶ意義 確率論を学ぶ理由① 後期で学ぶ推測統計の基礎となるから →推測統計を理解するためには、確率論の理解が必須 確率論を学ぶ理由② 確率論そのものも、ビジネスで活用できる →誤った解釈をしないように 確率論を扱ったビジネス書も多く出版されている (基本的には、講義指定の教科書が1冊あれば十分)
推測統計と確率論の関わり 推測統計では確率論の理解が必要 標本(データ)は、確率的に得られるから 推測統計学の用語(詳しくは後期で解説) 母集団 未知データを含む、対象全体 標本 母集団の一部。手に入るデータはこれだけ
まとめ 統計学とは データを収集、表示、解析する科学 以下の2つに分けられる 記述統計 なるべく情報量を減らさないで 比較・解釈を簡単にする集計方法を探る 推測統計 全体の一部である標本だけを使って、 まだ手に入れていない未知データの推測・予測をする (確率論の理解が必須)
集合の記号の読み方の復習 27
集合の記号 なぜ集合を学ぶのか 集合論は、数学におけるアルファベットのABC アルファベットが読めないで、英語の長文読解は不可能 記号は後で復習 資料を見れば意味が分かるようにしておく 28
内容 1.集合の記号の初歩 2.複数の集合の関係を表す記号 3.集合に関するその他の記号
内容 1.集合の記号の初歩 2.複数の集合の関係を表す記号 3.集合に関するその他の記号
集合の記号 集合の基本 集合とは「客観的に範囲が決められたモノの集まり」のこと 個別のモノは集合の要素と呼ばれる 例) 集合 個別の要素 𝐴 𝑎 31
集合の記号 集合の基本 「客観的に範囲が決められたモノの集まり」が大事 これはOK 「0以上4以下の整数の集合」 𝐴 = 0,1,2,3,4 個別の要素 𝑎1 = 0, 𝑎2 = 1, 𝑎3 = 2, 𝑎4 = 3, 𝑎5 = 4 これはダメ 「小さな数値の集合」 →「小さな」って具体的にどんな値? 32
集合の記号 集合と要素 ある要素𝑎が、ある集合𝐴に属することを𝑎 ∈ 𝐴と表記する 属していない場合は𝑎 ∉ 𝐴と表記する 例) 0以上4以下の整数の集合 𝐴 = 0,1,2,3,4 個別の要素 𝑎1 = 0, 𝑎2 = 1, 𝑎3 = 2, 𝑎4 = 3, 𝑎5 = 4 このとき 𝑎1 ∈ 𝐴 (もちろん、𝑎2 ∈ 𝐴であるし、𝑎5 ∈ 𝐴である) 33
集合の記号 集合の記法① 外延的記法 𝐴 = 0,1,2,3,4 のように、要素を中カッコの中に並べる →シンプルだけど、要素が増えると大変…… →0から100までの整数がすべて要素だったらどうする? 集合の記法② 内包的記法 𝐴 = 𝑎; 𝑎は整数、かつ、0 ≤ 𝑎 ≤ 4 のように、条件を書く →一見するとややこしいけど、要素が増えても大丈夫 →0から100までの整数がすべて要素だったらどうする? 𝐴 = 𝑎; 𝑎は整数、かつ、0 ≤ 𝑎 ≤ 100 条件はセミコロン「 ; 」や縦棒「 |」の 右側に書く。内包的記法にも慣れておこう 34
内容 1.集合の記号の初歩 2.複数の集合の関係を表す記号 3.集合に関するその他の記号
集合の記号 部分集合 2つの集合𝐴, 𝐵において「 𝑎 ∈ 𝐴 ならば𝑎 ∈ 𝐵 」である時 𝐴を𝐵の部分集合と呼び、 𝐴 ⊂ 𝐵と表記する 例) 𝐴 = 0,1,2,3,4,5 𝐵 = 0,1,2,3,4,5,6,7 このとき、 𝐴 ⊂ 𝐵 𝐵の方が、なんとなく𝐴より大きそうな気がする 36
集合の記号 ベン図 複数の集合を比較するときに便利な図 部分集合などが一目でわかる 𝐴 = 0,1,2,3,4,5 𝐵 = 0,1,2,3,4,5,6,7 集合B 6,7 集合A 0,1,2 3,4,5 37
集合の記号 積集合 2つの集合𝐴, 𝐵において、以下を積集合と呼ぶ 𝐴 ∩ 𝐵 = 𝑎; 𝑎 ∈ 𝐴 かつ𝑎 ∈ 𝐵 和集合 2つの集合𝐴, 𝐵において、以下を和集合と呼ぶ 𝐴 ∪ 𝐵 = 𝑎; 𝑎 ∈ 𝐴 または𝑎 ∈ 𝐵 積集合 𝐴 ∩ 𝐵 集合A 集合B 和集合 𝐴 ∪ 𝐵 集合A 集合B 38
集合の記号 差集合 2つの集合𝐴, 𝐵において、以下を差集合と呼ぶ 𝐴 − 𝐵 = 𝑎; 𝑎 ∈ 𝐴 かつ𝑎 ∉ 𝐵 差集合 集合A 𝐴−𝐵 集合B 39
内容 1.集合の記号の初歩 2.複数の集合の関係を表す記号 3.集合に関するその他の記号
集合の記号 空集合 要素を1つも含まない集合。∅と表記する ちなみに∅ ∪ ∅ = ∅ 全体集合 「ある集合(例えば𝑆)の部分集合しか扱わない」 と定めた時、集合𝑆を全体集合と呼ぶ (全体集合の記号は𝑆でも𝐾でも、 見分けがつけば何でも良い) 41
集合の記号 補集合 全体集合を𝑆とする 𝑆の部分集合𝐴に対して、以下を補集合と呼ぶ 𝐴𝑐 = 𝑆 − 𝐴 全体集合S 集合A 補集合 𝐴c 42
確率論の基礎 43
内容 1.標本空間と事象 2.確率の公理主義的定義 3.確率の取り扱いの基本 44
内容 1.標本空間と事象 2.確率の公理主義的定義 3.確率の取り扱いの基本 45
確率論の基礎 試行 調査や実験、観測のこと 例)アンケート調査・薬の効能の実験 イカサマコインかどうかを判定するためのコイン投げ 標本空間 試行の結果として、 起こり得る可能な結果の全体を要素とする集合 記号Ω(オメガ)を使うことが多い 個別の要素は標本点と呼ぶ 事象 標本空間の部分集合 要素が1つしかない場合を根源事象と呼ぶ 46
確率論の基礎 コイン投げの例 コインを1回投げて、表か裏かを観測するという試行 ただし、表を1、裏を0と表記する 標本空間 Ω = 0,1 事象 (標本空間の部分集合) 表が出るという事象𝐴 = 1 根源事象 裏が出るという事象𝐵 = 0 根源事象 47
確率論の基礎 サイコロ投げの例 サイコロを1回投げて、出た目を観測するという試行 標本空間 Ω = 1,2,3,4,5,6 事象 (標本空間の部分集合) 1の目が出るという事象𝐴 = 1 2の目が出るという事象𝐵 = 2 偶数が出るという事象𝐶 = 2,4,6 奇数が出るという事象𝐷 = 1,3,5 5以上の目が出るという事象𝐸 = 5,6 などなど…… 根源事象 根源事象 根源事象ではない 根源事象ではない 根源事象ではない 48
確率論の基礎 確率論と集合 標本空間も事象も集合なので、集合の記法が使える 余事象(補集合みたいなもの) 事象𝐴の余事象は𝐴𝑐 = Ω − 𝐴 積事象と和事象 (積集合と和集合みたいなもの) 事象𝐴, 𝐵において 積事象𝐴 ∩ 𝐵 = 𝑎; 𝑎 ∈ 𝐴 かつ𝑎 ∈ 𝐵 和事象𝐴 ∪ 𝐵 = 𝑎; 𝑎 ∈ 𝐴 または𝑎 ∈ 𝐵 49
確率論の基礎 排反事象(とても重要) 事象𝐴, 𝐵において、「重なり」が無いとき すなわち積事象𝐴 ∩ 𝐵 = ∅であるとき、 𝐴, 𝐵は互いに排反であると呼ぶ 標本空間Ω 事象A 事象B 50
確率論の基礎 サイコロ投げの例 サイコロを1回投げて、出た目を観測するという試行 標本空間 Ω = 1,2,3,4,5,6 事象 (標本空間の部分集合) 1の目が出るという事象𝐴 = 1 2の目が出るという事象𝐵 = 2 事象𝐴, 𝐵は排反 偶数が出るという事象𝐶 = 2,4,6 奇数が出るという事象𝐷 = 1,3,5 事象𝐶, 𝐷は排反 なお、事象𝐴, 𝐷は排反ではない(1の目は事象𝐷にもある) 51
内容 1.標本空間と事象 2.確率の公理主義的定義 3.確率の取り扱いの基本 公理とは約束事くらいの意味 「ある約束事」を満たすものを確率と呼ぶ 52
確率論の基礎 確率の公理主義的定義 標本空間Ωの任意の事象𝐴に対して、 実数 𝑃 𝐴 が定まっていて 以下の3つの公理を満たす𝑃 𝐴 を事象𝐴の確率と呼ぶ 公理1: 任意の事象𝐴に対して0 ≤ 𝑃 𝐴 ≤ 1 公理2: 標本空間Ωに対して𝑃 Ω = 1 公理3: 互いに排反な事象𝐴1 , 𝐴2 ,…に対して、 𝑃 𝐴1 ∪𝐴2 ∪… = 𝑃 𝐴1 + 𝑃 𝐴2 + ⋯ 53
確率論の基礎 確率の公理主義的定義 公理の意味 公理1: 任意の事象𝐴に対して0 ≤ 𝑃 𝐴 ≤ 1 意味:確率は0以上、1以下ですよ 例:確率1.2で発生する→「1.2」は確率じゃないよ 「俺が単位を取る確率は、120%だ!」はダメ 例:確率−0.4で発生する→「−0.4 」は確率じゃないよ 「来週小テストが行われる確率は、 −40%だ!」はダメ 54
確率論の基礎 確率の公理主義的定義 公理の意味 公理2: 標本空間Ωに対して𝑃 Ω = 1 意味:「起こり得る何か」が起こる確率は、1ですよ 例:単位が取れているか、いないか、それが問題だ Ω = 単位が取れた, 単位を落とした 𝑃 単位が取れた = 0.7 𝑃 単位を落とした = 0.2 →残りの0.1はどこへ行った? 55
確率論の基礎 確率の公理主義的定義 公理の意味 公理3: 互いに排反な事象𝐴1 , 𝐴2 ,…に対して、 𝑃 𝐴1 ∪𝐴2 ∪… = 𝑃 𝐴1 + 𝑃 𝐴2 + ⋯ 意味:「重なりが無い事象のどれかが起こる確率」は 「個別の事象が起こる確率の合計」ですよ 例:成績がAランク、または、Sランクを取る確率は、 「Aランクを取る確率」+「Sランクを取る確率」 言ってること自体は、とても当たり前 56
確率論の基礎 なんで公理3をわざわざ置くのか 例えば空事象∅に対して𝑃 ∅ はいくらになるだろう? なんとなく(中身が空だから) 直感的に𝑃 ∅ = 0になる気がするし、 実際のところ𝑃 ∅ = 0になる これは公理1,3から導ける! なんで公理1,3から導けるの? 57
確率論の基礎 空事象が起こる確率が0になる理由 まずは確率の公理3より (空事象同士は∅ ∩ ∅ = ∅なので、互いに排反)、 𝑃 ∅∪∅ =𝑃 ∅ +𝑃 ∅ ここで、空事象の定義より∅ ∪ ∅ = ∅ ということで 𝑃 ∅∪∅ =𝑃 ∅ すなわち 𝑃 ∅ =𝑃 ∅ +𝑃 ∅ 58
確率論の基礎 空事象が起こる確率が0になる理由 よって以下が成り立つ 𝑃 ∅ =𝑃 ∅ +𝑃 ∅ +𝑃 ∅ … 𝑃 ∅ は何回足してても𝑃 ∅ のまま! 公理1より 0≤𝑃 ∅ ≤1 これを満たす𝑃 ∅ は𝑃 ∅ = 0しかない 公理3があると、いろんな性質が導ける 59
確率論の基礎 高校生までの確率と何が変わったか 高校生までで学んだ確率 ある事象の場合の数 確率 = 全事象の場合の数 例)コインを1回投げて表が出る確率 1 確率 = 2 この定義の何が悪いんや? 60
確率論の基礎 高校生までの確率と何が変わったか 高校生までで学んだ確率 ある事象の場合の数 確率 = 全事象の場合の数 明日、帝京大学に隕石が落ちて校舎が木端微塵になる確率 Ω = 大学は無事, 大学は破壊されました ある事象の場合の数 1 確率 = = 2 全事象の場合の数 帝京大学が隕石でつぶれる確率は2分の1? 61
確率論の基礎 「場合の数」が扱いにくい場合の対応 数直線[0,1]の範囲に針を落とす (0から1の範囲内ではどこにでも刺さり、 どの地点にでも、刺さりやすさは同様に確からしい) (針の先端は、大きさが0である点とみなされる) 針が落ちた場所が0.5以下の場所である確率は? ある事象の場合の数 ∞ 確率 = = =? ∞ 全事象の場合の数 講義ではやらないが、その気になれば、 確率についていろんな問いを検討できる 62
内容 1.標本空間と事象 2.確率の公理主義的定義 3.確率の取り扱いの基本 63
確率論の基礎 確率の加法定理 (乗法定理は来週) 互いに排反な事象A, 𝐵に対して、 𝑃 𝐴∪𝐵 =𝑃 𝐴 +𝑃 𝐵 単なる公理3の言い直し。でも大事 64
確率論の基礎 確率の加法定理の例 間違いの例) 俺はどうせS評価なんてもらえないよ!! だから「S評価、またはA評価」がもらえる確率よりも 「A評価」がもらえる確率の方が高いと考えるのは誤り 𝑃 𝑆∪𝐴 =𝑃 𝑆 +𝑃 𝐴 また、確率は必ず0以上なので 𝑃 𝑆∪𝐴 ≥𝑃 𝐴 「どちらかが起こる確率」は 片方起こる確率より高い 65
確率論の基礎 「または」の確率の計算 互いに排反とは限らない事象A, 𝐵に対して、 𝑃 𝐴∪𝐵 =𝑃 𝐴 +𝑃 𝐵 −𝑃 𝐴∩𝐵 和事象 事象A 𝐴∪𝐵 事象B 66 66
確率論の基礎 「または」の確率の計算 互いに排反とは限らない事象A, 𝐵に対して、 𝑃 𝐴∪𝐵 =𝑃 𝐴 +𝑃 𝐵 −𝑃 𝐴∩𝐵 和事象 事象A 𝐴∪𝐵 事象B 𝐴 ∩ 𝐵を ダブルカウントしてる 67 67
確率論の基礎 「または」の確率の計算 互いに排反とは限らない事象A, 𝐵に対して、 𝑃 𝐴∪𝐵 =𝑃 𝐴 +𝑃 𝐵 −𝑃 𝐴∩𝐵 和事象 事象A 𝐴∪𝐵 事象B 事象A 事象B 積事象 𝐴∩𝐵 68
クイズ 確率の加法定理 サイコロを1回投げて出た目を観測するという試行を行う Ω = 1,2,3,4,5,6 偶数が出るという事象𝐴 = 2,4,6 𝑃 𝐴 = 1Τ2 5以上の目が出るという 事象𝐵 = 5,6 𝑃 𝐵 = 1Τ3 偶数、かつ、5以上の目である事象𝐴 ∩ 𝐵 = 6 𝑃 𝐴 ∩ 𝐵 = 1Τ6 この時「偶数、または、5以上の目」が出る確率、 すなわち𝑃 𝐴 ∪ 𝐵 はいくらになる? 𝟏 ① 𝟐 𝟏 ② 𝟑 𝟏 ③ 𝟔 𝟐 ④ 𝟑
クイズ(回答) 確率の加法定理 サイコロを1回投げて出た目を観測するという試行を行う Ω = 1,2,3,4,5,6 偶数が出るという事象𝐴 = 2,4,6 𝑃 𝐴 = 1Τ2 5以上の目が出るという 事象𝐵 = 5,6 𝑃 𝐵 = 1Τ3 偶数、かつ、5以上の目である事象𝐴 ∩ 𝐵 = 6 𝑃 𝐴 ∩ 𝐵 = 1Τ6 この時「偶数、または、5以上の目」が出る確率、 すなわち𝑃 𝐴 ∪ 𝐵 はいくらになる? 𝟏 ① 𝟐 𝟏 ② 𝟑 𝟏 ③ 𝟔 𝟐 ④ 𝟑