このページには広告が含まれています。

執筆者・編集者プロフィール
安田周平
個別指導塾YES/YESオンラインスクール塾長・船場物産株式会社代表取締役社長。
理数・情報系記事とデータサイエンスの為の基本レベルの線形代数等の解説記事を執筆しています。

ポアソン分布とは

「確率分布」の一つである『ポアソン分布』について、その定義や質量関数、期待値・分散をはじめとする性質、モーメント母関数などを総まとめしました。

ポアソン分布とは?

ここでは、数ある確率分布の中でも、離散型でありベルヌーイ分布の応用版?とも言える”ポアソン(poisson)分布”を見ていきましょう。

定義とイメージ(ポアソン分布を使う場面)

二項分布の時と比べて、nが大きくp(=ベルヌーイ試行の確率)が非常に小さい(たまーにしか起こらないような現象)を考える場合、ポアソン分布を用いることを考えます。

たとえば、ペットボトル飲料を販売している会社には、一週間に平均して5回品質についての相談の電話がかかって来る;このとき、1週間に”ちょうど”7回電話がかかって来るような確率を知りたいとします。

(ここから先の計算式の意味は次の項から詳細に解説しているので、”流れ”だけをザッと見ておいてもらえれば結構です)

X~Po(5):(Po(5)は『λ=5のポアソン分布に従うものとする』という意味)

確率質量関数は次のようになり、

$$P(X=r)=e^{-\lambda}\frac{\lambda^{r}}{r!}$$

\(r=7,\lambda=5 \)より、

$$P(X=7)=e^{-5}\frac{5^{7}}{7!}=\frac{5^{6}}{1008e^{5}}≒ 0.1044$$

よって、およそ10.44%の確率であることが分かります。

ポアソン分布の確率質量関数と二項分布からの導出

上の項で使用した、次の式を満たす:$$P(X=r)=\frac{\lambda^{r}\exp(-\lambda)}{r!}\cdots (※)$$

時、”Xはλのポアソン分布に従う”と言います。(※:ポアソン分布は”離散型”なので、「確率”質量”関数」です)

これを実際に導出してみます。

ベルヌーイ試行を繰り返す

なお、”ポアソン分布”といっても、結局は上の例のように品質の相談電話が《かかって来る”or”かかって来ない》の【どちらかしか起こり得ない】ので、『ベルヌーイ試行である』と考えることができます。

二項分布での質量関数とコンビネーション

二項分布の場合:質量関数は次のように表すことができました。

$$\mathrm{P(X=r)=\underbrace{{}_n C_r}_{n回中r回を選ぶ}\underbrace{(\frac{\lambda}{n})^{r}}_{事象が起こる確率}\underbrace{(1-\left(\frac{\lambda}{n}\right))^{n-r}}_{事象が起こらない確率}}\cdots (**)$$

これ(**)をうまく(※)へと変形していきましょう。

\(\mathrm{{}_n C_r =\frac{n!}{r!\times (n-r)!}}\)

コンビネーションの公式の変形は問題ないでしょうか?

基本的な内容ですが、もし忘れてしまったら具体的な数字で考えると↑の変形もカンタンに思い出せます。

$${}_7 C_3=\frac{7・6・5}{3・2・1}=\frac{7\cdot6\cdot5\times(4・3・2・1)}{3・2・1\times(7-3)!}$$で求まることが確認できます。

さて、(**)式に戻ります。

from二項分布toポアソン分布の質量関数への式変形

$$\mathrm{P(X=r)=\frac{n!}{r!(n-r)!}(\frac{\lambda}{n})^{r}(1-\left(\frac{\lambda}{n}\right))^{n-r}}\cdots (**)$$

$$\mathrm{=\frac{n(n-1)\cdots (n-r+1)}{r!}(\frac{\lambda}{n})^{r}(1-\frac{\lambda}{n})^{n-r}}\cdots (3)$$

(3)式中の”nCr”を変形した部分の分子に注目すると、

nを含む項が【\({n-(n-r+1)+1}=r個\)分】だけ掛け合わされている

(+1しているのは植木算の要領です)ことより、

\(n^{r}\)と、

さらに、後ろの\((\lambda/n)^{r}(1-\lambda/n)^{n-r}\)部分の\((\lambda/n)^{r}\)を括り出すと、

$$(\frac{\lambda}{n})^{n}\{(1-\frac{λ}{n})^{n}(1-\frac{λ}{n})^{-r}\}$$

↓式を{}・(1-)〜の部分で途中で分けていますが、続いています。

$$(**)=n^{r}(\frac{\lambda}{n})^{r}\cdot\frac{1}{r!}\cdot\{1\cdot(1-\frac{1}{n})\cdots(1-\frac{r-1}{n})\}\cdot$$

$$\cdot(1-\frac{\lambda}{n})^{n}(1-\frac{\lambda}{n})^{-r}$$

ネイピア数の定義式の利用

ここで、下段の式を「ネイピア数とは?」で紹介している様なeの定義式となる様に変形し

$$(1-\frac{\lambda}{n})^{n}を(1+\frac{1}{\frac{-n}{λ}})^{n}$$

さらに、$$\mathrm{\lim_{n→∞}[\{1+\frac{1}{\left(\frac{-n}{λ}\right)}\}^{\frac{n}{λ}}]^{-λ}=e^{-λ}}$$

下段のもう一項は\(\lim_{n→∞}(1-λ/n)^{-r}=1\)

n→∞より、

上段の\(\{1\cdot(1-\frac{1}{n})\cdots(1-\frac{r-1}{n})\}\)の部分はそれぞれ\(1・1・1・・・1=1\)

各々の変形をまとめる→ポアソン分布の質量関数へ

これらを全てあわせると

$$(**)=λ^{r}\times\frac{1}{r!}\times 1\times e^{-λ}\times 1$$

$$(∴):(**)=\frac{λ^{r}}{r!}e^{-λ}$$

となって確かにポアソン分布の初めに紹介した”確率質量関数”が上の式で表せることが確認出来ました。

ポアソン分布の特徴

ここからはポアソン分布の母関数、期待値など特徴的部分を見ていきます。

積率母関数

下に、ポアソン分布の”モーメント(積率)母関数”を掲載しておきます。

(詳しくは「モーメント母関数の意味と求め方」を参照ください。)

$$\mathrm{M(\theta)=E[e^{X\theta}]}= e^{-λ}e^{λe^{\theta}}$$

期待値=分散を母関数から導く!

期待値・分散を上の項で示した”積率母関数”から求めます。

まずは、上のモーメント母関数を”一回微分”、”二階微分”した導関数を計算します。

\(\mathrm{M'(\theta)=(e^{-\lambda}\cdot e^{\lambda e^{\theta}})'=e^{-\lambda}\cdot \lambda e^{\theta}\cdot e^{\lambda e^{\theta}}}\)

ゆえに、

\(M'(\theta)=\lambda e^{-\lambda}\cdot e^{\theta+\lambda e^{\theta}}\)

\(\mathrm{M''(\theta)=\lambda e^{-\lambda}\cdot(1+\lambda e^{\theta})\cdot e^{(\theta +\lambda e^{\theta})}}\)

ここで、期待値はM(θ)を一回微分した式に、θ=0を代入したものだったので、

\(\mathrm{E[X]=M'(0)=\lambda\cdot e^{\lambda}\cdot e^{-\lambda}=\lambda}\)

分散は\(\mathrm{M''(X)\theta}\)(二階微分)に、\(\theta=0\)

を代入して求まる

\(\mathrm{M"(0)=\lambda e^{0}+\lambda^{2}e^{0}=\lambda+\lambda^{2}}\)

以下のような"分散と積率母関数の関係"より実際に計算していくと、

\(\mathrm{V[X]=\{E[X^{2}]-\{E[X]\}^{2}\}}=\lambda+\lambda^{2}-\lambda^{2}=\lambda\)

ゆえに、\(\mathrm{E[X]=V[X]=\lambda}\)となる=『(期待値=分散)非常に興味深い性質がある』事がわかります。

ポアソン分布まとめ(確率分布シリーズ)

ポアソン分布は、ベルヌーイ分布を起点として広がっていく確率分布の中でも、二項分布とともに重要度が高いものです。

また、ポアソン分布は離散型の分布でしたが、連続バージョンと言える『指数分布』も存在します。

関連記事と次回へ

>>「統計学・データの分析の解説記事まとめ」<<

次回予定:「(作成中):ガウス積分」

・ご依頼等のご連絡は『スマナビング!【運営元ページ】』よりお待ちしております。

Twitterでフォローしよう