حساب کاربری
​
زمان تقریبی مطالعه: 6 دقیقه
لینک کوتاه

توزیع چندجمله‌ای

توزیع چندجمله‌ای (به انگلیسی: multinomial distribution) در نظریه احتمالات، تعمیم توزیع دوجمله‌ای است. در واقع در این توزیع به ازای n آزمایش تصادفی و مستقل، k نتیجه هرکدام با احتمال بروز مشخص ثابت بروز می‌کنند. در واقع توزیع چندجمله‌ای احتمال بروز هرگونه ترکیبی از n برآمد تصادفی مستقل (که هرکدام می‌توانند از میان یکی از k برآمد ممکن باشند) را بدست می‌دهد.

توزیع چندجمله‌ای
پارامترها n > 0 {\displaystyle n>0}
تعداد تکرارها (عدد صحیح)
p 1 , … , p k {\displaystyle p_{1},\ldots ,p_{k}}
احتمال رخداد ( Σ p i = 1 {\displaystyle \Sigma p_{i}=1}
)
تکیه‌گاه X i ∈ { 0 , … , n } {\displaystyle X_{i}\in \{0,\dots ,n\}}

Σ X i = n {\displaystyle \Sigma X_{i}=n\!}
تابع جرم احتمال n ! x 1 ! ⋯ x k ! p 1 x 1 ⋯ p k x k {\displaystyle {\frac {n!}{x_{1}!\cdots x_{k}!}}p_{1}^{x_{1}}\cdots p_{k}^{x_{k}}}
میانگین E { X i } = n p i {\displaystyle E\{X_{i}\}=np_{i}}
واریانس V a r ( X i ) = n p i ( 1 − p i ) {\displaystyle \textstyle {\mathrm {Var} }(X_{i})=np_{i}(1-p_{i})}

C o v ( X i , X j ) = − n p i p j     ( i ≠ j ) {\displaystyle \textstyle {\mathrm {Cov} }(X_{i},X_{j})=-np_{i}p_{j}~~(i\neq j)}
تابع مولد گشتاور ( ∑ i = 1 k p i e t i ) n {\displaystyle {\biggl (}\sum _{i=1}^{k}p_{i}e^{t_{i}}{\biggr )}^{n}}
تابع مشخصه ( ∑ j = 1 k p j e i t j ) n {\displaystyle \left(\sum _{j=1}^{k}p_{j}e^{it_{j}}\right)^{n}}
که در آن i 2 = − 1 {\displaystyle i^{2}=-1}
تابع مولد احتمال ( ∑ i = 1 k p i z i ) n  for  ( z 1 , … , z k ) ∈ C k {\displaystyle {\biggl (}\sum _{i=1}^{k}p_{i}z_{i}{\biggr )}^{n}{\text{ for }}(z_{1},\ldots ,z_{k})\in \mathbb {C} ^{k}}

زمانی که مقدار k برابر 2 و مقدار n برابر 1 است توزیع چند جمله ای همان توزیع برنولی است، موقعی که k از 2 بزرگتر و n مساوی 1 است همان توزیع قطعی است.

توزیع برنولی پیشامد یک آزمایش برنولی را مدل می‌کند.به عبارت دیگر، یک سکه انداختن (با سکه ای که احتمال شیر و خط بودن آن برابر است) یا با موفقیت (شیر) یا با شکست (خط) رو به رو می‌شویم.توزیع دو جمله‌ای حالت عمومی‌تر این توزیع است که احتمال تعداد مشخصی شیر در n پرتاب را مشخص می‌کند. در توزیع چند جمله‌ای به عنوان مثال تعداد n پرتاب یک تاس دارای k وجه را بررسی می‌کنیم.

فهرست

  • ۱ مثال
  • ۲ مشخصات
    • ۲.۱ توزیع جرم احتمال
  • ۳ تجسم
    • ۳.۱ به عنوان بخشی‌هایی از مثلث خیام-پاسکال
  • ۴ ویژگی‌ها
  • ۵ نمونه گیری از توزیع چندجمله‌ای
  • ۶ رابطه بین توزیع چندجمله‌ای و پواسون
  • ۷ توزیع‌های مربوط
  • ۸ جستارهای وابسته
  • ۹ منابع

مثال

توزیع دو جمله‌ای به ما کمک می‌کند که احتمال هر یک از پیشامد‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌‌های دودویی را بدست بیاوریم.به عنوان مثال با استفاده از آن می‌توانیم احتمال گرفتن 6 شیر از بین 10 پرتاب را می‌دهد. سکه انداختن یک پیشامد باینری است چون که تنها 2 تا پیشامد ممکن دارد: شیر یا خط. توزیع چند جمله‌ای در شرایطی به ما کمک می‌کند که بیش از دو پیشامد داشته باشیم. به عنوان مثال فرض کنید دو شطرنج باز تعداد دفعات متعددی با هم بازی کرده باشند و مشخص شده باشد که احتمال برد نفر اول 0.4، احتمال برد نفر دوم 0.35 و احتمال تساوی 0.25 باشد. توزیع چند جمله ای به ما کمک می‌کند که به سؤال "اگر این دو نفر 12 دور با هم بازی کنند احتمال 7 برد نفر اول، 2 برد نفر دوم و 3 تساوی چقدر است".

مشخصات

توزیع جرم احتمال

فرض کنیم می‌خواهیم چنین آزمایشی را انجام دهیم که می‌خواهیم n توپ (با جایگذاری) از داخل کیسه‌ای شامل k رنگ توپ خارج کنیم. تفاوتی بین توپ‌های هم رنگ وجود ندارد. فرض کنیم Xi متغیر تصادفی باشند که تعداد توپ‌های خارج شده دارای رنگ i را نشان می‌دهد. احتمال خارج شدن توپ با رنگ i ام را با p i نشان می‌دهیم. روی این مسئله می‌توان توزیع چندجمله‌ای را به صورت زیر نشان داد:

f ( x 1 , … , x k ; n , p 1 , … , p k ) = Pr ( X 1 = x 1  and  …  and  X k = x k ) = { n ! x 1 ! ⋯ x k ! p 1 x 1 ⋯ p k x k , when  ∑ i = 1 k x i = n 0 otherwise, {\displaystyle {\begin{aligned}f(x_{1},\ldots ,x_{k};n,p_{1},\ldots ,p_{k})&{}=\Pr(X_{1}=x_{1}{\mbox{ and }}\dots {\mbox{ and }}X_{k}=x_{k})\\\\&{}={\begin{cases}{\displaystyle {n! \over x_{1}!\cdots x_{k}!}p_{1}^{x_{1}}\cdots p_{k}^{x_{k}}},\quad &{\mbox{when }}\sum _{i=1}^{k}x_{i}=n\\\\0&{\mbox{otherwise,}}\end{cases}}\end{aligned}}}

که در آن x1,... , xk مقادیر غیرمنفی هستند.

تجسم

به عنوان بخشی‌هایی از مثلث خیام-پاسکال

همانطور که می‌توان توزیع دو جمله‌ای را با برش‌های یک بعدی مثلث خیام-پاسکال مدل کرد، توزیع چند جمله‌ای را می‌توان با برش‌های دو بعدی از مثلث خیام-پاسکال مدل کرد.

ویژگی‌ها

امید ریاضی تعداد دفعاتی که پی آمد i ام طی n آزمایش دیده شود عبارت است از:

E ⁡ ( X i ) = n p i . {\displaystyle \operatorname {E} (X_{i})=np_{i}.\,}

واریانس هر پیامد برابر است با:

var ⁡ ( X i ) = n p i ( 1 − p i ) . {\displaystyle \operatorname {var} (X_{i})=np_{i}(1-p_{i}).\,}

عوامل غیر قطری ماتریس کوواریانس یا کواریانس پیامدها را می‌توان به اینصورت محاسبه کرد:

cov ⁡ ( X i , X j ) = − n p i p j {\displaystyle \operatorname {cov} (X_{i},X_{j})=-np_{i}p_{j}\,}

تکیه‌گاه (ریاضی) پی آمدهای توزیع چندجمله‌ای برابر است با:

{ ( n 1 , … , n k ) ∈ N k | n 1 + ⋯ + n k = n } . {\displaystyle \{(n_{1},\dots ,n_{k})\in \mathbb {N} ^{k}|n_{1}+\cdots +n_{k}=n\}.\,}

که تعداد اعضای آن برابر است با:

( n + k − 1 k − 1 ) . {\displaystyle {n+k-1 \choose k-1}.}

نمونه گیری از توزیع چندجمله‌ای

ابتدا احتمال رخدادها یعنی p 1 , … p k {\displaystyle p_{1},\ldots p_{k}}

را به صورت کاهشی مرتب کنید. این کار تنها برای افزایش سرعت محاسبات است. سپس در هر تکرار برای متغیر تصادفی X عددی تصادفی از توزیع یکنواخت در (۰، 1) انتخاب کنید. در هر مرحله برآمد توسط رابطهٔ زیر مشخص می‌شود.

j = arg ⁡ min j ′ = 1 k ( ∑ i = 1 j ′ p i − X ) . {\displaystyle j=\arg \min _{j'=1}^{k}\left(\sum _{i=1}^{j'}p_{i}-X\right).}

این یک نمونه‌گیری از توزیع چندجمله‌ای به ازای n=1 است. در صورتی که این آزمایش را n بار تکرار کنیم، یک نمونه‌گیری از توزیع چند جمله به ازای n تکرار داریم.

رابطه بین توزیع چندجمله‌ای و پواسون

فرض کنید X1,X2,...,Xk متغیرهای پواسونی جداگانه و تصادفی باشند.

(X1 ~ P(λ1

(X2 ~ P(λ2

(Xk ~ P(λk

که مقدار λ‌ها لزوما برابر نیستند.توزیع شرطی نمودار

X = ( X 1 , X 2 , . . . , X n ) {\displaystyle X=(X1,X2,...,Xn)}

با داشتن

n = X 1 + X 2 + . . . + X n {\displaystyle n=X1+X2+...+Xn}

برابر است با (Mult(n, π

(π=(π1,π2,…,πk

π j = λ j λ 1 + λ 2 + . . . + λ k {\displaystyle \pi j={\frac {\lambda j}{\lambda 1+\lambda 2+...+\lambda k}}}

توزیع‌های مربوط

  • زمانی که k=2 باشد، توزیع چندجمله‌ای برابر با توزیع توزیع دوجمله‌ای است.
  • معادل پیوستهٔ این توزیع، توزیع گوسی چند متغیره است.
  • معادل توزیع رسته‌ای در هر بار تکرار.
  • توزیع دیریکله توزیع مزدوج پیشین توزیع چندجمله‌ای است.
  • توزیع دیریکله-چندجمله‌ای
  • مدل بتا-دو جمله‌ای

جستارهای وابسته

  • توزیع چندجمله‌ای منفی

منابع

  1. ↑ «توزیع چندجمله‌ای» [آمار] هم‌ارزِ «multinomial distribution»؛ منبع: گروه واژه‌گزینی. جواد میرشکاری، ویراستار. دفتر دوازدهم. فرهنگ واژه‌های مصوب فرهنگستان. تهران: انتشارات فرهنگستان زبان و ادب فارسی. شابک ۹۷۸-۶۰۰-۶۱۴۳-۶۶-۸ (ذیل سرواژهٔ توزیع چندجمله‌ای)
  2. ↑ «Free Statistics Book». onlinestatbook.com. دریافت‌شده در ۲۰۱۸-۱۱-۱۰.
  3. ↑ «online courses».
  • Evans، Merran؛ Hastings، Nicholas؛ Peacock، Brian (۲۰۰۰). Statistical Distributions. New York: Wiley. صص. ۱۳۴–۱۳۶. شابک ۰-۴۷۱-۳۷۱۲۴-۶. 3rd ed.
آخرین نظرات
کلیه حقوق این تارنما متعلق به فرا دانشنامه ویکی بین است.