توزیع دیریکله-چندجملهای یک توزیع گسسته چندجملهای است. این توزیع نامهای دیگری نیز دارد؛ از جمله Dirichlet compound multinomial distribution (DCM) یا multivariate Pólya distribution(که پس از جورج پولیا نامگذاری شده است) در این توزیع بردار p از یک توزیع دیریکله با پارامترهای نمونه برداری شده است. مجموعه مقادیر گسسته از توزیع دستهای با بردار احتمالات p بهدست میآیند.
تابع جرم احتمال
فرض کنیم N نمونه برداری تصادفی مستقل از یک توزیع دسته ای با K دسته انجام میدهیم. فرض کنیم مقادیر تصادفی را با به ازای مقادیر نشان دهیم. فرض بخواهیم تعداد دفعاتی که کلاس (به ازای )دیده شده است را با نشان دهیم. میدانیم . به این مسئله میتوان به دو شیوهٔ معادل نگاه کرد:
- مجموعه ای از N متغیر با توزیع دسته ای.
- بردار توزیع شده با توجه به توزیع چندجملهای.
اکنون میتوان روی این پارامتر این توزیعها، یعنی p، توزیعی دیکله تجسم کرد و با انتگرالگیری نسبت به آن، توزیع پسین را بهدست آورد. اگرچه دو دید فوق معادل هستند، اما با در نظر گرفتن هر کدام میتوان توزیع پسین متفاوتی بهدست آورد.
مجموعه ای از مشاهدات
توزیع مشترک
به ازای متغیر دسته ای توزیع احتمال مشترک حاشیه ای عبارت است از:
که منجر به فرمول زیر میشود:
که در آن تابع گاما است.
توزیعهای مرتبط
توزیع معادل یک بعدی این توزیع توزیع بتا-دو جمله ای نام دارد.
کاربردها
جستارهای وابسته
منابع
- Elkan, C. (2006) Clustering documents with an exponential-family approximation of the Dirichlet compound multinomial distribution. ICML, 289-296
- Kvam, P. and Day, D. (2001) The multivariate Polya distribution in combat modeling. Naval Research Logistics, 48, 1-17
- Madsen, RE. , Kauchak, D. and Elkan, C. (2005) Modeling Word Burstiness Using the Dirichlet Distribution. ICML, 545-552
- Minka, T. (2003) Estimating a Dirichlet distribution. Technical report Microsoft Research. Includes Matlab code for fitting distributions to data.
- Wagner, U. and Taudes, A. (1986) A Multivariate Polya Model of Brand Choice and Purchase Incidence. Marketing Science, 5(3), 219-244.