ポアソン分布とは
「確率分布」の一つである『ポアソン分布』について、その定義や質量関数、期待値・分散をはじめとする性質、モーメント母関数などを総まとめしました。
目次(タップした所へ飛びます)
ポアソン分布とは?
ここでは、数ある確率分布の中でも、離散型でありベルヌーイ分布の応用版?とも言える”ポアソン(poisson)分布”を見ていきましょう。
定義とイメージ(ポアソン分布を使う場面)
二項分布の時と比べて、nが大きくp(=ベルヌーイ試行の確率)が非常に小さい(たまーにしか起こらないような現象)を考える場合、ポアソン分布を用いることを考えます。
たとえば、ペットボトル飲料を販売している会社には、一週間に平均して5回品質についての相談の電話がかかって来る;このとき、1週間に”ちょうど”7回電話がかかって来るような確率を知りたいとします。
(ここから先の計算式の意味は次の項から詳細に解説しているので、”流れ”だけをザッと見ておいてもらえれば結構です)
X~Po(5):(Po(5)は『λ=5のポアソン分布に従うものとする』という意味)
確率質量関数は次のようになり、
$$P(X=r)=e^{-\lambda}\frac{\lambda^{r}}{r!}$$
\(r=7,\lambda=5 \)より、
$$P(X=7)=e^{-5}\frac{5^{7}}{7!}=\frac{5^{6}}{1008e^{5}}≒ 0.1044$$
よって、およそ10.44%の確率であることが分かります。
ポアソン分布の確率質量関数と二項分布からの導出
上の項で使用した、次の式を満たす:$$P(X=r)=\frac{\lambda^{r}\exp(-\lambda)}{r!}\cdots (※)$$
時、”Xはλのポアソン分布に従う”と言います。(※:ポアソン分布は”離散型”なので、「確率”質量”関数」です)
これを実際に導出してみます。
ベルヌーイ試行を繰り返す
なお、”ポアソン分布”といっても、結局は上の例のように品質の相談電話が《かかって来る”or”かかって来ない》の【どちらかしか起こり得ない】ので、『ベルヌーイ試行である』と考えることができます。
二項分布での質量関数とコンビネーション
二項分布の場合:質量関数は次のように表すことができました。
$$\mathrm{P(X=r)=\underbrace{{}_n C_r}_{n回中r回を選ぶ}\underbrace{(\frac{\lambda}{n})^{r}}_{事象が起こる確率}\underbrace{(1-\left(\frac{\lambda}{n}\right))^{n-r}}_{事象が起こらない確率}}\cdots (**)$$
これ(**)をうまく(※)へと変形していきましょう。
\(\mathrm{{}_n C_r =\frac{n!}{r!\times (n-r)!}}\)
コンビネーションの公式の変形は問題ないでしょうか?
基本的な内容ですが、もし忘れてしまったら具体的な数字で考えると↑の変形もカンタンに思い出せます。
$${}_7 C_3=\frac{7・6・5}{3・2・1}=\frac{7\cdot6\cdot5\times(4・3・2・1)}{3・2・1\times(7-3)!}$$で求まることが確認できます。
さて、(**)式に戻ります。
from二項分布toポアソン分布の質量関数への式変形
$$\mathrm{P(X=r)=\frac{n!}{r!(n-r)!}(\frac{\lambda}{n})^{r}(1-\left(\frac{\lambda}{n}\right))^{n-r}}\cdots (**)$$
$$\mathrm{=\frac{n(n-1)\cdots (n-r+1)}{r!}(\frac{\lambda}{n})^{r}(1-\frac{\lambda}{n})^{n-r}}\cdots (3)$$
(3)式中の”nCr”を変形した部分の分子に注目すると、
nを含む項が【\({n-(n-r+1)+1}=r個\)分】だけ掛け合わされている
(+1しているのは植木算の要領です)ことより、
\(n^{r}\)と、
さらに、後ろの\((\lambda/n)^{r}(1-\lambda/n)^{n-r}\)部分の\((\lambda/n)^{r}\)を括り出すと、
$$(\frac{\lambda}{n})^{n}\{(1-\frac{λ}{n})^{n}(1-\frac{λ}{n})^{-r}\}$$
↓式を{}・(1-)〜の部分で途中で分けていますが、続いています。
$$(**)=n^{r}(\frac{\lambda}{n})^{r}\cdot\frac{1}{r!}\cdot\{1\cdot(1-\frac{1}{n})\cdots(1-\frac{r-1}{n})\}\cdot$$
$$\cdot(1-\frac{\lambda}{n})^{n}(1-\frac{\lambda}{n})^{-r}$$
ネイピア数の定義式の利用
ここで、下段の式を「ネイピア数とは?」で紹介している様なeの定義式となる様に変形し
$$(1-\frac{\lambda}{n})^{n}を(1+\frac{1}{\frac{-n}{λ}})^{n}$$
さらに、$$\mathrm{\lim_{n→∞}[\{1+\frac{1}{\left(\frac{-n}{λ}\right)}\}^{\frac{n}{λ}}]^{-λ}=e^{-λ}}$$
下段のもう一項は\(\lim_{n→∞}(1-λ/n)^{-r}=1\)
n→∞より、
上段の\(\{1\cdot(1-\frac{1}{n})\cdots(1-\frac{r-1}{n})\}\)の部分はそれぞれ\(1・1・1・・・1=1\)
各々の変形をまとめる→ポアソン分布の質量関数へ
これらを全てあわせると
$$(**)=λ^{r}\times\frac{1}{r!}\times 1\times e^{-λ}\times 1$$
$$(∴):(**)=\frac{λ^{r}}{r!}e^{-λ}$$
となって確かにポアソン分布の初めに紹介した”確率質量関数”が上の式で表せることが確認出来ました。
ポアソン分布の特徴
ここからはポアソン分布の母関数、期待値など特徴的部分を見ていきます。
積率母関数
下に、ポアソン分布の”モーメント(積率)母関数”を掲載しておきます。
(詳しくは「モーメント母関数の意味と求め方」を参照ください。)
$$\mathrm{M(\theta)=E[e^{X\theta}]}= e^{-λ}e^{λe^{\theta}}$$
期待値=分散を母関数から導く!
期待値・分散を上の項で示した”積率母関数”から求めます。
まずは、上のモーメント母関数を”一回微分”、”二階微分”した導関数を計算します。
\(\mathrm{M'(\theta)=(e^{-\lambda}\cdot e^{\lambda e^{\theta}})'=e^{-\lambda}\cdot \lambda e^{\theta}\cdot e^{\lambda e^{\theta}}}\)
ゆえに、
\(M'(\theta)=\lambda e^{-\lambda}\cdot e^{\theta+\lambda e^{\theta}}\)
\(\mathrm{M''(\theta)=\lambda e^{-\lambda}\cdot(1+\lambda e^{\theta})\cdot e^{(\theta +\lambda e^{\theta})}}\)
ここで、期待値はM(θ)を一回微分した式に、θ=0を代入したものだったので、
\(\mathrm{E[X]=M'(0)=\lambda\cdot e^{\lambda}\cdot e^{-\lambda}=\lambda}\)
分散は\(\mathrm{M''(X)\theta}\)(二階微分)に、\(\theta=0\)
を代入して求まる
\(\mathrm{M"(0)=\lambda e^{0}+\lambda^{2}e^{0}=\lambda+\lambda^{2}}\)
以下のような"分散と積率母関数の関係"より実際に計算していくと、
\(\mathrm{V[X]=\{E[X^{2}]-\{E[X]\}^{2}\}}=\lambda+\lambda^{2}-\lambda^{2}=\lambda\)
ゆえに、\(\mathrm{E[X]=V[X]=\lambda}\)となる=『(期待値=分散)非常に興味深い性質がある』事がわかります。
ポアソン分布まとめ(確率分布シリーズ)
ポアソン分布は、ベルヌーイ分布を起点として広がっていく確率分布の中でも、二項分布とともに重要度が高いものです。
また、ポアソン分布は離散型の分布でしたが、連続バージョンと言える『指数分布』も存在します。
関連記事と次回へ
>>「統計学・データの分析の解説記事まとめ」<<
次回予定:「(作成中):ガウス積分」
・ご依頼等のご連絡は『スマナビング!【運営元ページ】』よりお待ちしております。