ポアソン分布とは

「確率分布」の一つである『ポアソン分布』について、その定義や質量関数、期待値・分散をはじめとする性質、モーメント母関数などを総まとめしました。

ポアソン分布とは?

ここでは、数ある確率分布の中でも、離散型でありベルヌーイ分布の応用版?とも言える”ポアソン(poisson)分布”を見ていきましょう。

定義とイメージ(ポアソン分布を使う場面)

二項分布の時と比べて、nが大きくp(=ベルヌーイ試行の確率)が非常に小さい(たまーにしか起こらないような現象)を考える場合、ポアソン分布を用いることを考えます。

たとえば、ペットボトル飲料を販売している会社には、一週間に平均して5回品質についての相談の電話がかかって来る;このとき、1週間に”ちょうど”7回電話がかかって来るような確率を知りたいとします。

(ここから先の計算式の意味は次の項から詳細に解説しているので、”流れ”だけをザッと見ておいてもらえれば結構です)

X~Po(5):(Po(5)は『λ=5のポアソン分布に従うものとする』という意味)

確率質量関数は次のようになり、

$$P(X=r)=e^{-\lambda}\frac{\lambda^{r}}{r!}$$

\(r=7,\lambda=5 \)より、

$$P(X=7)=e^{-5}\frac{5^{7}}{7!}=\frac{5^{6}}{1008e^{5}}≒ 0.1044$$

よって、およそ10.44%の確率であることが分かります。

ポアソン分布の確率質量関数と二項分布からの導出

上の項で使用した、次の式を満たす:$$P(X=r)=\frac{\lambda^{r}\exp(-\lambda)}{r!}\cdots (※)$$

時、”Xはλのポアソン分布に従う”と言います。(※:ポアソン分布は”離散型”なので、「確率”質量”関数」です)

これを実際に導出してみます。

ベルヌーイ試行を繰り返す

なお、”ポアソン分布”といっても、結局は上の例のように品質の相談電話が《かかって来る”or”かかって来ない》の【どちらかしか起こり得ない】ので、『ベルヌーイ試行である』と考えることができます。

二項分布での質量関数とコンビネーション

二項分布の場合:質量関数は次のように表すことができました。

$$\mathrm{P(X=r)=\underbrace{{}_n C_r}_{n回中r回を選ぶ}\underbrace{(\frac{\lambda}{n})^{r}}_{事象が起こる確率}\underbrace{(1-\left(\frac{\lambda}{n}\right))^{n-r}}_{事象が起こらない確率}}\cdots (**)$$

これ(**)をうまく(※)へと変形していきましょう。

\(\mathrm{{}_n C_r =\frac{n!}{r!\times (n-r)!}}\)

コンビネーションの公式の変形は問題ないでしょうか?

基本的な内容ですが、もし忘れてしまったら具体的な数字で考えると↑の変形もカンタンに思い出せます。

$${}_7 C_3=\frac{7・6・5}{3・2・1}=\frac{7\cdot6\cdot5\times(4・3・2・1)}{3・2・1\times(7-3)!}$$で求まることが確認できます。

さて、(**)式に戻ります。

from二項分布toポアソン分布の質量関数への式変形

$$\mathrm{P(X=r)=\frac{n!}{r!(n-r)!}(\frac{\lambda}{n})^{r}(1-\left(\frac{\lambda}{n}\right))^{n-r}}\cdots (**)$$

$$\mathrm{=\frac{n(n-1)\cdots (n-r+1)}{r!}(\frac{\lambda}{n})^{r}(1-\frac{\lambda}{n})^{n-r}}\cdots (3)$$

(3)式中の”nCr”を変形した部分の分子に注目すると、

nを含む項が【\({n-(n-r+1)+1}=r個\)分】だけ掛け合わされている

(+1しているのは植木算の要領です)ことより、

\(n^{r}\)と、

さらに、後ろの\((\lambda/n)^{r}(1-\lambda/n)^{n-r}\)部分の\((\lambda/n)^{r}\)を括り出すと、

$$(\frac{\lambda}{n})^{n}\{(1-\frac{λ}{n})^{n}(1-\frac{λ}{n})^{-r}\}$$

↓式を{}・(1-)〜の部分で途中で分けていますが、続いています。

$$(**)=n^{r}(\frac{\lambda}{n})^{r}\cdot\frac{1}{r!}\cdot\{1\cdot(1-\frac{1}{n})\cdots(1-\frac{r-1}{n})\}\cdot$$

$$\cdot(1-\frac{\lambda}{n})^{n}(1-\frac{\lambda}{n})^{-r}$$

ネイピア数の定義式の利用

ここで、下段の式を「ネイピア数とは?」で紹介している様なeの定義式となる様に変形し

$$(1-\frac{\lambda}{n})^{n}を(1+\frac{1}{\frac{-n}{λ}})^{n}$$

さらに、$$\mathrm{\lim_{n→∞}[\{1+\frac{1}{\left(\frac{-n}{λ}\right)}\}^{\frac{n}{λ}}]^{-λ}=e^{-λ}}$$

下段のもう一項は\(\lim_{n→∞}(1-λ/n)^{-r}=1\)

n→∞より、

上段の\(\{1\cdot(1-\frac{1}{n})\cdots(1-\frac{r-1}{n})\}\)の部分はそれぞれ\(1・1・1・・・1=1\)

各々の変形をまとめる→ポアソン分布の質量関数へ

これらを全てあわせると

$$(**)=λ^{r}\times\frac{1}{r!}\times 1\times e^{-λ}\times 1$$

$$(∴):(**)=\frac{λ^{r}}{r!}e^{-λ}$$

となって確かにポアソン分布の初めに紹介した”確率質量関数”が上の式で表せることが確認出来ました。

ポアソン分布の特徴

ここからはポアソン分布の母関数、期待値など特徴的部分を見ていきます。

積率母関数

下に、ポアソン分布の”モーメント(積率)母関数”を掲載しておきます。

(詳しくは「モーメント母関数の意味と求め方」を参照ください。)

$$\mathrm{M(\theta)=E[e^{X\theta}]}= e^{-λ}e^{λe^{\theta}}$$

期待値=分散を母関数から導く!

期待値・分散を上の項で示した”積率母関数”から求めます。

まずは、上のモーメント母関数を”一回微分”、”二階微分”した導関数を計算します。

\(\mathrm{M'(\theta)=(e^{-\lambda}\cdot e^{\lambda e^{\theta}})'=e^{-\lambda}\cdot \lambda e^{\theta}\cdot e^{\lambda e^{\theta}}}\)

ゆえに、

\(M'(\theta)=\lambda e^{-\lambda}\cdot e^{\theta+\lambda e^{\theta}}\)

\(\mathrm{M''(\theta)=\lambda e^{-\lambda}\cdot(1+\lambda e^{\theta})\cdot e^{(\theta +\lambda e^{\theta})}}\)

ここで、期待値はM(θ)を一回微分した式に、θ=0を代入したものだったので、

\(\mathrm{E[X]=M'(0)=\lambda\cdot e^{\lambda}\cdot e^{-\lambda}=\lambda}\)

分散は\(\mathrm{M''(X)\theta}\)(二階微分)に、\(\theta=0\)

を代入して求まる

\(\mathrm{M"(0)=\lambda e^{0}+\lambda^{2}e^{0}=\lambda+\lambda^{2}}\)

以下のような"分散と積率母関数の関係"より実際に計算していくと、

\(\mathrm{V[X]=\{E[X^{2}]-\{E[X]\}^{2}\}}=\lambda+\lambda^{2}-\lambda^{2}=\lambda\)

ゆえに、\(\mathrm{E[X]=V[X]=\lambda}\)となる=『(期待値=分散)非常に興味深い性質がある』事がわかります。

ポアソン分布まとめ(確率分布シリーズ)

ポアソン分布は、ベルヌーイ分布を起点として広がっていく確率分布の中でも、二項分布とともに重要度が高いものです。

また、ポアソン分布は離散型の分布でしたが、連続バージョンと言える『指数分布』も存在します。

関連記事と次回へ

>>「統計学・データの分析の解説記事まとめ」<<

次回予定:「(作成中):ガウス積分」

・ご依頼等のご連絡は『スマナビング!【運営元ページ】』よりお待ちしております。

Twitterでフォローしよう