توزیع دیریکله—چندجملهای
توزیع دیریکله-چندجملهای یک توزیع گسسته چندجملهای است. این توزیع نام های دیگری نیز دارد؛ از جمله Dirichlet compound multinomial distribution (DCM) یا multivariate Pólya distribution(که پس از جورج پولیا نامگذاری شده است.) در این توزیع بردار p از یک توزیع دیریکله با پارامترهای
تابع جرم احتمال
فرض کنیم N نمونه برداری تصادفی مستقل از یک توزیع دسته ای با K دسته انجام می دهیم. فرض کنیم مقادیر تصادفی را با
- مجموعه ای از N متغیر با توزیع دسته ای.
- بردار توزیع شده با توجه به توزیع چندجملهای.
اکنون می توان روی این پارامتر این توزیع ها، یعنی p، توزیعی دیکله تجسم کرد و با انتگرال گیری نسبت به آن، توزیع پسین را بدست آورد. اگرچه دو دید فوق معادل هستند، اما با در نظر گرفتن هر کدام می توان توزیع پسین متفاوتی بدست آورد.
مجموعه ای از مشاهدات
توزیع مشترک
به ازای متغیر دسته ای
که منجر به فرمول زیر می شود:
که در آن
توزیع های مرتبط
توزیع معادل یک بعدی این توزیع توزیع بتا-دو جمله ای نام دارد.
کاربردها
جستارهای وابسته
منابع
- Elkan, C. (2006) Clustering documents with an exponential-family approximation of the Dirichlet compound multinomial distribution. ICML, 289-296
- Kvam, P. and Day, D. (2001) The multivariate Polya distribution in combat modeling. Naval Research Logistics, 48, 1-17
- Madsen, RE., Kauchak, D. and Elkan, C. (2005) Modeling Word Burstiness Using the Dirichlet Distribution. ICML, 545-552
- Minka, T. (2003) Estimating a Dirichlet distribution. Technical report Microsoft Research. Includes Matlab code for fitting distributions to data.
- Wagner, U. and Taudes, A. (1986) A Multivariate Polya Model of Brand Choice and Purchase Incidence. Marketing Science, 5(3), 219-244.