توزیع نرمال چند متغیره
در نظریه احتمال و آمار، توزیع نرمال چند متغیره، توزیع گاوسی چند متغیره، یا توزیع نرمال توأم یک تعمیم از توزیع نرمال یک بعدی (تک متغیره) به ابعاد بالاتر است. یک تعریف این است که اگر هر ترکیب خطی از k عضو یک بردار، توزیع نرمال تک متغیره داشته باشد، به یک بردار تصادفی k متغیره گفته میشود که بهطور نرمال توزیع شدهاست. اهمیت آن عمدتاً از قضیه حد مرکزی چند متغیره ناشی میشود. برای توصیف هر مجموعه ای از متغیرهای تصادفی با ارزش حقیقی که احتمالاً همبسته اند و هر کدام حول مقداری متوسط جمع میشوند، اغلب از توزیع نرمال چندمتغییره استفاده میشود.
تعاریف
علامت گذاری و پارامترسازی
توزیع نرمال چند متغیره یک بردار تصادفی k بعدی به صورت
یا برای اینکه با صراحت نشان دهیم X از بعد k است،
با بردار میانگین k بعدی
به طوری که
بردار تصادفی نرمال استاندارد
یک بردار تصادفی حقیقی به صورت
بردار تصادفی نرمال متمرکز
یک بردار تصادفی حقیقی به صورت
بردار تصادفی نرمال
یک بردار تصادفی حقیقی به صورت
به نمادگذاری ریاضی:
در اینجا
در حالت انحطاط که در آن ماتریس کوواریانس منفرد است، توزیع مربوطه فاقد چگالی است. برای جزئیات بیشتر به بخش زیر مراجعه کنید. این مورد مکرراً در آمار به وجود میآید. برای مثال، در توزیع بردار باقیمانده در رگرسیون حداقل مربعات معمولی.
تعاریف معادل
تعاریف زیر معادل تعریف فوق میباشد. یک بردار تصادفی به فرم
- هر ترکیب خطی به فرم از اعضای آن به طور نرمال توزیع شده باشد. یعنی برای هر بردار ثابت، متغیر تصادفیدارای یک توزیع نرمال تک متغیره باشد، که در آن توزیع نرمال تک متغیره با واریانس صفر جرم نقطه ای بر میانگین آن است.
- یک بردار با k بعد و یک ماتریس مثبت نیمه معین و متقارنبا ابعادوجود دارد، به طوری که تابع مشخصه ازبه صورت زیر میباشد.
توزیع نرمال کروی را میتوان به عنوان توزیع منحصربفردی توصیف کرد که در آن اجزا در هر سیستم مختصات متعامد مستقل هستند.
تابع چگالی
مورد غیر منحط
هنگامی که ماتریس کوواریانس متقارن
جایی که
نسخه متقارن دایره ای توزیع نرمال مختلط شکی با کمی تفاوت دارد.
در هر مکان هندسی، مکان نقاط در فضای k -بعدی که هر کدام مقدار خاصی از چگالی را میدهند، یک بیضی یا تعمیم ابعاد بالاتر آن را میدهد. از این رو نرمال چند متغیره یک مورد خاص از توزیعهای بیضوی است.
کمیت
مورد دو متغیره
در حالت غیر منفرد ۲ بعدی (
به طوریکه که
در حالت دو متغیره، اولین شرط معادل برای بازسازی چند متغیره نرمال بودن را میتوان کمتر محدود کرد، زیرا نشان دادن اینکه تعداد شمارایی از ترکیبات خطی متمایز
جایگاههای دو متغیره ایزو چگالی رسم شده در
هر چه قدر مطلق پارامتر همبستگی
این به این دلیل است که این عبارت، با
مورد منحط
اگر ماتریس کوواریانس
برای صحبت معنادار در مورد چگالیها در موارد منفرد، باید یک معیار پایه متفاوت را انتخاب کنیم. با استفاده از قضیه فروپاشی میتوانیم محدودیتی از اندازهگیری Lebesgue را به مقداری تعریف کنیم که زیرفضای متناظر با
به طوریکه که
تابع توزیع تجمعی
مفهوم تابع توزیع تجمعی در بعد ۱ را میتوان به دو صورت به حالت چند بعدی، بر اساس مناطق مستطیلی و بیضی شکل گسترش داد.
راه اول این است که تابع توزیع تجمیعی
اگرچه هیچ فرم بستهای برای آن وجود ندارد
راه دیگر این است که تابع توزیع تجمیعی
منابع
- ↑ Kac, M. (1939). "On a characterization of the normal distribution". American Journal of Mathematics. 61 (3): 726–728. doi:10.2307/2371328. JSTOR 2371328.
- ↑ Sinz, Fabian; Gerwinn, Sebastian; Bethge, Matthias (2009). "Characterization of the p-generalized normal distribution". Journal of Multivariate Analysis. 100 (5): 817–820. doi:10.1016/j.jmva.2008.07.006.
- ↑ Simon J.D. Prince(June 2012). Computer Vision: Models, Learning, and Inference. Cambridge University Press. 3.7:"Multivariate normal distribution".
- ↑ Botev, Z. I. (2016). "The normal law under linear restrictions: simulation and estimation via minimax tilting". Journal of the Royal Statistical Society, Series B. 79: 125–148. arXiv:1603.04166. Bibcode:2016arXiv160304166B. doi:10.1111/rssb.12162.
- ↑ Bensimhoun Michael, N-Dimensional Cumulative Function, And Other Useful Facts About Gaussians and Normal Densities (2006)