色々な確率分布

2.9K Views

March 26, 24

スライド概要

[第9回大阪SAS勉強会] 德田 芳稀

profile-image

SAS言語を中心として,解析業務担当者・プログラマなのコミュニティを活性化したいです

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

関連スライド

各ページのテキスト
1.

色々な確率分布 大阪SAS勉強会 2024/3/22 エイツーヘルスケア株式会社 德田 芳稀 E-mail: tokuda-y@a2healthcare.com

2.

色々な確率分布 1. 確率分布について 2. 連続変数の確率分布 目次 3. カテゴリカル変数の確率分布

3.

色々な確率分布 1. 確率分布について 2. 連続変数の確率分布 目次 3. カテゴリカル変数の確率分布

4.

1. 確率分布について ◆ 確率:事象の起こりやすさを定量的に示すもの ◼ ◼ ◆ 事象Aの起こる確率について、𝑃𝑟(𝐴)のように表す 𝑃𝑟(𝐴)は[0, 1]の値を取る 確率変数:各取りうる値に対して確率が与えられている変数 ◼ ◼ ◆ コルモゴロフの公理(確率の公理) 1. 任意の事象𝐴𝑖 に対して0 ≤ Pr(𝐴𝑖 ) ≤ 1 2. 全事象Ωに対してPr Ω = 1 3. 互いに排反な事象𝐴𝑖 に対してPr ‫ = 𝑖𝐴 𝑖ڂ‬σ𝑖 Pr(𝐴𝑖 ) サイコロの目𝑋は1~6の目に対して1/6が与えられるので確率変数 𝑃𝑟 𝑋 = 1 6 (𝑋 = 1,2,3,4,5,6) 実現値:確率変数が実際に取りうる値 ◼ 𝑋 = 1,2,3,4,5,6はすべて実現値である 4/38

5.

1. 確率分布について ◆ 確率分布:確率変数の実現値と確率の関係を関数で表したもの サイコロの目𝑋 実現値 1 2 3 4 5 6 確率 1/6 1/6 1/6 1/6 1/6 1/6 この例では離散一様分布 (今回は紹介しない) 0.167 0 確率分布:𝑓 𝑥 = 1 6 1 2 3 4 5 6 5/38

6.

1. 確率分布について ◆ SASによる確率分布の描画 ◼ 今回はSASのPDF関数とSGPLOTプロシジャを用いて描画 ◼ PDF関数 ✓ ✓ ✓ PDF(‘distribution’ , 𝑥, Parameter 1, …, Parameter K); Distribution: 確率分布を指定 Parameter: 確率分布に付随する母数の値を設定 6/38

7.

1. 確率分布について ◆ SASによる確率分布の描画 ◼ Ex.)標準正規分布を指定する場合:𝑃𝐷𝐹(′𝑁𝑜𝑟𝑚𝑎𝑙′ , 𝑥, 0,1) ✓ ✓ distribution=Normalで正規分布を指定 第3引数は平均𝜇、第4引数は分散𝜎 2 を指定する 𝑁𝑜𝑟𝑚𝑎𝑙 2 0,12 1 1 2 = exp − 2 2𝜋 2 = 0.054 7/38

8.

1. 確率分布について ◆ 今回紹介する確率分布 確率分布 母数 期待値 分散 (連続)一様分布 𝑎, 𝑏 (𝑎 + 𝑏)/2 正規分布 𝜇, 𝜎 2 𝜇 𝜎2 対数正規分布 𝜇, 𝜎 2 𝑒𝑥𝑝(𝜇 + 𝜎 2 /2) 𝑒𝑥𝑝 2𝜇 + 𝜎 2 指数分布 1/𝜆 𝜆 𝜆2 𝑃𝐷𝐹(′𝐸𝑥𝑝𝑜𝑛𝑒𝑛𝑡𝑖𝑎𝑙′, 𝑥, 𝜆) コーシー分布 𝜇, 𝛾 − − 𝑃𝐷𝐹(′𝐶𝑎𝑢𝑐ℎ𝑦′, 𝑥, 𝜇, 𝛾) ベータ分布 𝛼, 𝛽 𝛼/(𝛼 + 𝛽) ガンマ分布 𝛼, 𝛽 𝛼/𝛽 𝛼/𝛽 2 𝑃𝐷𝐹(′𝐺𝑎𝑚𝑚𝑎′, 𝑥, 𝛼, 𝛽) ベルヌーイ分布 𝜃 𝜃 𝜃(1 − 𝜃) 𝑃𝐷𝐹(′𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑖′, 𝑥, 𝜃) 二項分布 𝑁, 𝜃 𝑁𝜃 𝑁𝜃(1 − 𝜃) 𝑃𝐷𝐹(′𝐵𝑖𝑛𝑜𝑚𝑖𝑎𝑙′, 𝑥, 𝜃, 𝑁) ポアソン分布 𝜆 𝜆 𝜆 𝑃𝐷𝐹(′𝑃𝑜𝑖𝑠𝑠𝑜𝑛′, 𝑥, 𝜆) PDF関数 𝑏 − 𝑎 2 /12 𝑃𝐷𝐹(′𝑈𝑛𝑖𝑓𝑜𝑟𝑚′, 𝑥, 𝑎, 𝑏) 𝑃𝐷𝐹(′𝑁𝑜𝑟𝑚𝑎𝑙′, 𝑥, 𝜇, 𝜎 2 ) 𝑒𝑥𝑝 𝜎 2 − 1 𝑃𝐷𝐹(′𝐿𝑜𝑔𝑁𝑜𝑟𝑚𝑎𝑙′, 𝑥, 𝜇, 𝜎 2 ) ここは後ほど紹介 𝛼 𝛽/ 𝛼 + 𝛽 𝛼 + 𝛽 + 1 𝑃𝐷𝐹(′𝐵𝑒𝑡𝑎′, 𝑥, 𝛼, 𝛽) 2 2 8/38

9.

色々な確率分布 目次 1. 確率分布について 1. (連続)一様分布 2. 連続変数の確率分布 2. 正規分布 3. カテゴリカル変数の確率分布 3. 対数正規分布 4. 指数分布 5. コーシー分布 6. ベータ分布 7. ガンマ分布

10.

2-0. 構図 確率密度関数 or 確率質量関数 確率分布の図示 期待値・分散 確率分布に関するメモ(性質・用途等)

11.

2-1. (連続)一様分布 𝑈𝑛𝑖𝑓𝑜𝑟𝑚 𝑥 𝑎, 𝑏 = ቐ ◆ (𝑎 ≤ 𝑥 ≤ 𝑏) 黒: 𝑎 = 0, 𝑏 = 10 赤: 𝑎 = 2, 𝑏 = 7 0 (𝑂𝑡ℎ𝑒𝑟𝑤𝑖𝑠𝑒) 期待値・分散 𝐸𝑋 = ◆ 1 𝑏−𝑎 𝑎+𝑏 , 2 𝑉𝑋 = 𝑏−𝑎 2 12 Memo: ◼ パラメータ𝑎, 𝑏に制限がなければ(−∞, ∞)の範囲で十分な幅を取ることができる ◼ ベイズ統計では無情報事前分布として用いられる 11/38

12.
[beta]
2-1. (連続)一様分布
%let a1 = 0; %let b1 = 10;
%let a2 = 2; %let b2 = 7;

黒: 𝑎 = 0, 𝑏 = 10
赤: 𝑎 = 2, 𝑏 = 7

data uniform_pdf;
do x=-1 to 11 by 0.1;
pdf1=pdf('uniform',x,&a1.,&b1.);
pdf2=pdf('uniform',x,&a2.,&b2.);
output;
end;
run;
proc sgplot data=uniform_pdf noautolegend;
styleattrs datalinepatterns=(1);
series x=x y=pdf1 / lineattrs=(color=black thickness=2);
series x=x y=pdf2 / lineattrs=(color=red thickness=2);;
xaxis label="X" min=-1 max=11;
yaxis label="Probability Density" min=0 max=0.25;
run;

12/38

13.

2-2. 正規分布 𝑁𝑜𝑟𝑚𝑎𝑙 𝑥 (𝜇, 𝜎 2 > 0) 𝜇, 𝜎 2 = 1 exp 2𝜋𝜎 1 𝑥−𝜇 2 − 2 𝜎 黒: 𝜇 = 0, 𝜎 2 = 1 赤: 𝜇 = 0, 𝜎 2 = 3 青: 𝜇 = 2, 𝜎 2 = 1 ◆ 期待値・分散 𝐸 𝑋 = 𝜇, 𝑉 𝑋 = 𝜎 2 ◆ Memo: 2 ◼ 𝜇 = 0, 𝜎 = 1のとき標準正規分布 ◼ 再生性を持つ (𝑥1 ~𝑁 𝜇1 , 𝜎12 , 𝑥2 ~𝑁 𝜇2 , 𝜎22 のとき𝑥1 + 𝑥2 ~𝑁(𝜇1 + 𝜇2 , 𝜎12 + 𝜎22 )) ◼ 中心極限定理より、標本が従う分布に依らず標本平均の分布は正規分布に 分布収束する 13/38

14.
[beta]
2-2. 正規分布
%let mu1 = 0; %let sigma1 = 1;
%let mu2 = 0; %let sigma2 = 3;
%let mu3 = 2; %let sigma3 = 1;

黒: 𝜇 = 0, 𝜎 2 = 1
赤: 𝜇 = 0, 𝜎 2 = 3
青: 𝜇 = 2, 𝜎 2 = 1

data normal_pdf;
do x=-5 to 5 by 0.1;
pdf1=pdf('normal',x,&mu1.,&sigma1.);
pdf2=pdf('normal',x,&mu2.,&sigma2.);
pdf3=pdf('normal',x,&mu3.,&sigma3.);
output;
end;
run;
proc sgplot data=normal_pdf noautolegend;
styleattrs datalinepatterns=(1);
series x=x y=pdf1 / lineattrs=(color=black thickness=2);
series x=x y=pdf2 / lineattrs=(color=red thickness=2);
series x=x y=pdf3 / lineattrs=(color=blue thickness=2);
xaxis label="X" min=-5 max=5;
yaxis label="Probability Density" min=0 max=0.4;
run;

14/38

15.

2-3. 対数正規分布 𝐿𝑜𝑔𝑁𝑜𝑟𝑚𝑎𝑙 𝑥 𝜇, 𝜎 2 = 1 1 𝑒𝑥𝑝 2𝜋𝜎 𝑥 1 𝑙𝑜𝑔𝑥−𝜇 2 − 2 𝜎 𝜇 = 0, 𝜎 2 = 1 ◆ 期待値・分散 𝐸 𝑋 = 𝑒𝑥𝑝 𝜇 + 𝜎 2 /2 𝑉 𝑋 = 𝑒𝑥𝑝 2𝜇 + 𝜎 2 (𝑒𝑥𝑝 𝜎 2 − 1) ◆ Memo: 2 ◼ 𝑦 = 𝑙𝑜𝑔𝑥としたとき、𝑦は正規分布𝑁(𝑦|𝜇, 𝜎 )に従う ◼ 抗体価や多くのPKパラメータがこの分布に従う(https://www.jstage.jst.go.jp/article/jjb/36/Special_Issue/36_S19/_pdf) 15/38

16.

2-3. 対数正規分布 %let mu1 = 0; %let sigma1 = 1; 𝜇 = 0, 𝜎 2 = 1 data lognormal_pdf; do x=0 to 5 by 0.01; pdf1=pdf('lognormal',x,&mu1.,&sigma1.); output; end; run; proc sgplot data=lognormal_pdf noautolegend; styleattrs datalinepatterns=(1); series x=x y=pdf1 / lineattrs=(color=black thickness=2); xaxis label="X" min=0 max=5; yaxis label="Probability Density" min=0 max=0.7; run; 16/38

17.

2-4. 指数分布 𝐸𝑥𝑝𝑜𝑛𝑒𝑛𝑡𝑖𝑎𝑙 𝑥 1/𝜆 = 1 𝑒𝑥𝑝 𝜆 1 − 𝑥 𝜆 (𝑥 ≥ 0) ◆ 期待値・分散 𝐸 𝑋 = 𝜆, 𝑉 𝑋 = 𝜆2 ◆ Memo: ◼ ある期間に平均して𝜆回起こる事象が、次に起こるまでの期間𝑥が従う ◼ 無記憶性がある(連続型分布では唯一) 赤: lambda=0.5 黒: lambda=1 青: lambda=2 𝑃𝑟 𝑌 > 𝑡 = 𝑒𝑥𝑝 −𝜆𝑡 及び𝑃𝑟 𝑌 > 𝑠 + 𝑡 = 𝑒𝑥𝑝 −𝜆(𝑠 + 𝑡) より、 𝑃𝑟 𝑌 > 𝑠 + 𝑡 / 𝑃𝑟 𝑌 > 𝑡 = 𝑃𝑟 𝑌 > 𝑠 となりtに依存しない 17/38

18.
[beta]
2-4. 指数分布
%let lambda1 = 1;
%let lambda2 = 0.5;
%let lambda3 = 2;

赤: lambda=0.5
黒: lambda=1
青: lambda=2

data exponential_pdf;
do x=0 to 5 by 0.01;
pdf1=pdf('exponential',x,&lambda1.);
pdf2=pdf('exponential',x,&lambda2.);
pdf3=pdf('exponential',x,&lambda3.);
output;
end;
run;
proc sgplot data=exponential_pdf noautolegend;
styleattrs datalinepatterns=(1);
series x=x y=pdf1 / lineattrs=(color=black thickness=2);
series x=x y=pdf2 / lineattrs=(color=red thickness=2);
series x=x y=pdf3 / lineattrs=(color=blue thickness=2);
xaxis label="X" min=0 max=5;
yaxis label="Probability Density" min=0 max=2;
run;

18/38

19.

2-5. コーシー分布 𝐶𝑎𝑢𝑐ℎ𝑦 𝑥 𝜇, 𝛾 = 1 1 𝜋𝛾 1+ 𝑥−𝜇 2 赤: 標準正規分布 黒: 標準コーシー分布 𝜎 (𝜇 = 0, 𝛾 = 1を標準コーシー分布と呼ぶ) ◆ 期待値・分散はいずれもなし ◆ Memo: ◼ 正規分布よりも裾が重く、外れ値を考慮したような分布 ◼ 期待値・分散が存在しないので、大数の法則は成立しない 19/38

20.

2-5. コーシー分布 %let mu = 0; %let gamma = 1; 赤: 標準正規分布 黒: 標準コーシー分布 data cauchy_pdf; do x = -10 to 10 by 0.1; pdf1 = pdf(‘cauchy’,x,&mu.,&gamma.);*標準コーシー分布; pdf2 = pdf(‘normal’,x,&mu.,&gamma.);*標準正規分布; output; end; run; proc sgplot data=cauchy_pdf noautolegend; styleattrs datalinepatterns=(1); series x=x y=pdf1 / lineattrs=(color=black thickness=2); series x=x y=pdf2 / lineattrs=(color=red thickness=2); xaxis label="X"; yaxis label="Probability Density"; run; 20/38

21.

2-5. コーシー分布 標準正規分布 標準コーシー分布 標準正規分布は0付近に分布する それに対して標準コーシー分布は0付近に分布するものの一定の頻度で外れ値が出現する 21/38

22.

2-5. コーシー分布 標準正規分布 標準コーシー分布 標準正規分布は平均が0に収束するが、標準コーシー分布は平均が収束しない 22/38

23.

2-6. ベータ分布 𝐵𝑒𝑡𝑎 𝜃 𝛼, 𝛽 = 1 𝐵 𝛼,𝛽 𝜃 𝛼−1 1 − 𝜃 𝛽−1 黒: 𝛼 = 1, 𝛽 = 1 赤: 𝛼 = 2, 𝛽 = 10 青: 𝛼 = 34, 𝛽 = 16 𝜃: 0, 1 の実数, 𝛼, 𝛽: 正の実数 𝐵 𝛼, 𝛽 = ◆ Γ(𝛼)Γ(𝛽) , Γ 𝛼+𝛽 Γ 𝑥 = ∞ 𝑥−1 −𝑡 𝑒 𝑑𝑡 ‫׬‬0 𝑡 期待値・分散 𝐸𝑋 = 𝛼 , (𝛼+𝛽) VX = 𝛼2 𝛽 { 𝛼+𝛽 2 (𝛼+𝛽+1)} 23/38

24.

2-6. ベータ分布 𝐵𝑒𝑡𝑎 𝜃 𝛼, 𝛽 = 1 𝐵 𝛼,𝛽 𝜃 𝛼−1 1 − 𝜃 𝛽−1 黒: 𝛼 = 1, 𝛽 = 1 赤: 𝛼 = 2, 𝛽 = 10 青: 𝛼 = 34, 𝛽 = 16 𝜃: 0, 1 の実数, 𝛼, 𝛽: 正の実数 𝐵 𝛼, 𝛽 = ◆ Γ(𝛼)Γ(𝛽) , Γ 𝛼+𝛽 Γ 𝑥 = ∞ 𝑥−1 −𝑡 𝑒 𝑑𝑡 ‫׬‬0 𝑡 Memo: ◼ 表が出る確率が不明なコインを何回か投げて、 表が(α − 1)回、裏が(𝛽 − 1)回出たときに、表が出る確率が従う分布 ◼ 𝛼 = 𝛽 = 1のとき、一様分布 ◼ 二項分布の共役事前分布 24/38

25.
[beta]
2-6. ベータ分布
%let alpha1 = 1; %let beta1 = 1;
%let alpha2 = 2; %let beta2 = 10;
%let alpha3 = 34; %let beta3 = 16;

黒: 𝛼 = 1, 𝛽 = 1
赤: 𝛼 = 2, 𝛽 = 10
青: 𝛼 = 34, 𝛽 = 16

data beta_pdf;
do x=0 to 1 by 0.01;
pdf1=pdf('beta',x,&alpha1., &beta1.);
pdf2=pdf('beta',x,&alpha2., &beta2.);
pdf3=pdf('beta',x,&alpha3., &beta3.);
output;
end;
run;
proc sgplot data=beta_pdf noautolegend;
styleattrs datalinepatterns=(1);
series x=x y=pdf1 / lineattrs=(color=black thickness=2);
series x=x y=pdf2 / lineattrs=(color=red thickness=2);
series x=x y=pdf3 / lineattrs=(color=blue thickness=2);
xaxis label="X" min=0 max=1;
yaxis label="Probability Density" min=0 max=7;
run;

25/38

26.

2-7. ガンマ分布 𝐺𝑎𝑚𝑚𝑎 𝑥 𝛼, 𝛽 = 𝛽 𝛼 𝛼−1 𝑥 𝑒𝑥𝑝(−𝛽𝑥) Γ(𝛼) 黒: 𝛼 = 1, 𝛽 = 1 赤: 𝛼 = 2, 𝛽 = 5 青: 𝛼 = 10, 𝛽 = 5 ∞ 𝑥, 𝛼, 𝛽: 正の実数 , Γ 𝑥 = ‫׬‬0 𝑡 𝑥−1 𝑒 −𝑡 𝑑𝑡 ◆ 期待値・分散 𝛼 𝐸𝑋 = , VX = 𝛽 ◆ 𝛼 𝛽2 Memo: ◼ ある期間𝛽に平均して1回起こる事象が、𝛼回起こるまでの期間𝑥が従う ◼ ポアソン分布の共役事前分布 ◼ 𝛼 = 1の時、指数分布(= 𝛽exp(−𝛽𝑥))に一致する 26/38

27.
[beta]
2-7. ガンマ分布
%let alpha1 = 1; %let beta1 = 1;
%let alpha2 = 2; %let beta2 = 5;
%let alpha3 = 10; %let beta3 = 5;
data gamma_pdf;
do x=0 to 100 by 1;
pdf1=pdf('gamma',x,&alpha1., &beta1.);
pdf2=pdf('gamma',x,&alpha2., &beta2.);
pdf3=pdf('gamma',x,&alpha3., &beta3.);
output;
end;
run;
proc sgplot data=gamma_pdf noautolegend;
styleattrs datalinepatterns=(1);
series x=x y=pdf1 / lineattrs=(color=black thickness=2);
series x=x y=pdf2 / lineattrs=(color=red thickness=2);
series x=x y=pdf3 / lineattrs=(color=blue thickness=2);
xaxis label="X" min=0 max=100;
yaxis label="Probability Density" min=0 max=0.1;
run;

黒: 𝛼 = 1, 𝛽 = 1
赤: 𝛼 = 2, 𝛽 = 5
青: 𝛼 = 10, 𝛽 = 5

27/38

28.

色々な確率分布 目次 1. 確率分布について 1. ベルヌーイ分布 2. 連続変数の確率分布 2. 二項分布 3. カテゴリカル変数の確率分布 3. ポアソン分布

29.

3-1. ベルヌーイ分布 𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖 𝑥 𝜃 = 𝜃 𝑥 1 − 𝜃 1−𝑥 𝜃 , 𝑥=1 =ቊ 1 − 𝜃, 𝑥 = 0 𝜃 = 0.4 𝜃: 0, 1 の実数 ◆ 期待値・分散 𝐸 𝑋 = 𝜃, 𝑉 𝑋 = 𝜃(1 − 𝜃) ◆ Memo: ◼ コインを1回投げて表(𝑥 = 1)が出る確率が𝜃、裏(𝑥 = 0)が出る確率が1 − 𝜃のように 考えることができる(ベルヌーイ試行) 29/38

30.

3-1. ベルヌーイ分布 %let theta1 = 0.4; data bernouli_pdf; do x=0 to 1 by 1; pdf1=pdf('bernouli',x,&theta1.); output; end; run; 𝜃 = 0.4 proc sgplot data=bernouli_pdf noautolegend; styleattrs datalinepatterns=(1); vbarparm category=x response=pdf1 / fillattrs=(color=white); xaxis label="X"; yaxis label="Probability Density" min=0 max=1; run; 30/38

31.

3-2. 二項分布 𝐵𝑖𝑛𝑜𝑚𝑖𝑎𝑙 𝑥 𝑁, 𝜃 = 𝑁! 𝜃 𝑥 (1 − 𝑥! 𝑁−𝑥 ! 𝜃)𝑁−𝑥 黒: 𝑁 = 100, 𝜃 = 0.5 赤: 𝑁 = 100, 𝜃 = 0.3 青: 𝑁 = 200, 𝜃 = 0.5 𝜃: 0, 1 の実数 ◆ 期待値・分散 𝐸 𝑋 = 𝑁𝜃, 𝑉 𝑋 = 𝑁𝜃(1 − 𝜃) ◆ Memo: ◼ ベルヌーイ試行を𝑁回行う状況と一致する ◼ 再生性を持つ (𝜃が同じであれば) 𝑥1 ~𝐵𝑖𝑛 𝑁1 , 𝜃 , 𝑥2 ~𝐵𝑖𝑛 𝑁2 , 𝜃 のとき、𝑥 = 𝑥1 + 𝑥2 ~𝐵𝑖𝑛(𝑁1 + 𝑁2 , 𝜃)となる 31/38

32.
[beta]
3-2. 二項分布
%let n1=100; %let theta1 = 0.5;
%let n2=100; %let theta2 = 0.3;
%let n3=200; %let theta3 = 0.5;

黒: 𝑁 = 100, 𝜃 = 0.5
赤: 𝑁 = 100, 𝜃 = 0.3
青: 𝑁 = 200, 𝜃 = 0.5

data binomial_pdf;
do x=0 to 200 by 1;
pdf1=pdf('binom',x,&theta1.,&n1.);
pdf2=pdf('binom',x,&theta2.,&n2.);
pdf3=pdf('binom',x,&theta3.,&n3.);
output;
end;
run;
proc sgplot data=binomial_pdf noautolegend;
styleattrs datalinepatterns=(1);
series x=x y=pdf1 / lineattrs=(color=black thickness=2);
series x=x y=pdf2 / lineattrs=(color=red thickness=2);
series x=x y=pdf3 / lineattrs=(color=blue thickness=2);
xaxis label="X" min=0 max=150;
yaxis label="Probability Density" min=0 max=0.10;
run;

32/38

33.

3-3. ポアソン分布 𝑃𝑜𝑖𝑠𝑠𝑜𝑛 𝑥 𝜆 = 1 𝑥 𝜆 𝑒𝑥𝑝(−𝜆) 𝑥! 黒: lambda=1 赤: lambda=2 青: lambda=5 𝜆: 正の実数 ◆ 期待値・分散 𝐸 𝑋 = 𝜆, 𝑉 𝑋 = 𝜆 ◆ Memo: ◼ 単位時間あたり𝜆回発生する事象が、𝑥回起こる確率の分布 ◼ 二項分布の𝑁 → ∞, 𝜃 → 0としたときに導出可能(ポアソン少数の法則) ◼ 指数分布と関連あり(ポアソン分布:発生回数, 指数分布:発生間隔に焦点) 33/38

34.
[beta]
3-3. ポアソン分布
%let lambda1 = 1;
%let lambda2 = 2;
%let lambda3 = 5;

黒: lambda=1
赤: lambda=2
青: lambda=5

data poisson_pdf;
do x=0 to 10 by 1;
pdf1=pdf('poisson',x,&lambda1.);
pdf2=pdf('poisson',x,&lambda2.);
pdf3=pdf('poisson',x,&lambda3.);
output;
end;
run;
proc sgplot data=poisson_pdf noautolegend;
styleattrs datalinepatterns=(1);
series x=x y=pdf1 / lineattrs=(color=black thickness=2);
series x=x y=pdf2 / lineattrs=(color=red thickness=2);
series x=x y=pdf3 / lineattrs=(color=blue thickness=2);
xaxis label="X" min=0 max=10;
yaxis label="Probability Density" min=0 max=0.4;
run;

34/38

35.

まとめ ◆ 今回紹介した確率分布 確率分布 母数 期待値 分散 (連続)一様分布 𝑎, 𝑏 (𝑎 + 𝑏)/2 正規分布 𝜇, 𝜎 2 𝜇 𝜎2 対数正規分布 𝜇, 𝜎 2 𝑒𝑥𝑝(𝜇 + 𝜎 2 /2) 𝑒𝑥𝑝 2𝜇 + 𝜎 2 指数分布 1/𝜆 𝜆 𝜆2 𝑃𝐷𝐹(′𝐸𝑥𝑝𝑜𝑛𝑒𝑛𝑡𝑖𝑎𝑙′, 𝑥, 𝜆) コーシー分布 𝜇, 𝛾 − − 𝑃𝐷𝐹(′𝐶𝑎𝑢𝑐ℎ𝑦′, 𝑥, 𝜇, 𝛾) ベータ分布 𝛼, 𝛽 𝛼/(𝛼 + 𝛽) 𝛼 2 𝛽/ 𝛼 + 𝛽 ガンマ分布 𝛼, 𝛽 𝛼/𝛽 𝛼/𝛽 2 𝑃𝐷𝐹(′𝐺𝑎𝑚𝑚𝑎′, 𝑥, 𝛼, 𝛽) ベルヌーイ分布 𝜃 𝜃 𝜃(1 − 𝜃) 𝑃𝐷𝐹(′𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑖′, 𝑥, 𝜃) 二項分布 𝑁, 𝜃 𝑁𝜃 𝑁𝜃(1 − 𝜃) 𝑃𝐷𝐹(′𝐵𝑖𝑛𝑜𝑚𝑖𝑎𝑙′, 𝑥, 𝜃, 𝑁) ポアソン分布 𝜆 𝜆 𝜆 𝑃𝐷𝐹(′𝑃𝑜𝑖𝑠𝑠𝑜𝑛′, 𝑥, 𝜆) PDF関数 𝑏 − 𝑎 2 /12 𝑃𝐷𝐹(′𝑈𝑛𝑖𝑓𝑜𝑟𝑚′, 𝑥, 𝑎, 𝑏) 𝑃𝐷𝐹(′𝑁𝑜𝑟𝑚𝑎𝑙′, 𝑥, 𝜇, 𝜎 2 ) 𝑒𝑥𝑝 𝜎 2 − 1 2 𝛼+𝛽+1 𝑃𝐷𝐹(′𝐿𝑜𝑔𝑁𝑜𝑟𝑚𝑎𝑙′, 𝑥, 𝜇, 𝜎 2 ) 𝑃𝐷𝐹(′𝐵𝑒𝑡𝑎′, 𝑥, 𝛼, 𝛽) 35/38

36.

まとめ ◆ 今回紹介しきれなかった確率分布 (もちろんこれら以外にも極値分布など たくさんあります) 確率分布 負の二項分布 幾何分布 超幾何分布 ◆ *がついているものはPDF関数非対応 t分布 F分布 カイ二乗分布 ラプラス分布(二重対数分布) 逆ウィシャート分布* アーラン分布* ワイブル分布 36/38

37.

参考資料 <リンク> ◆ SAS Help – PDF Function https://documentation.sas.com/doc/en/pgmsascdc/9.4_3.5/lefunctionsref/n164yyfgppedmkn1320b oncqkh6r.htm <書籍> 絶版 37/38

38.

ご清聴ありがとうございました