برآوردگر بیشینهگر احتمال پسین
در آمار، برآوردگر بیشینهگر احتمال پسین (به انگلیسی: Maximum a posteriori estimation) یک پارامتر، مد توزیع احتمال پسین آن پارامتر است. به بیان ریاضی، اگر داده
برآوردگر بیشینهگر احتمال پسین ارتباط نزدیکی با برآورد درستنمایی بیشینه دارد، با این تفاوت که برای پارامتر مورد تخمین احتمال پیشین را هم در نظر میگیرد. در نتیجه، میتوان برآوردگر بیشینهگر احتمال پسین را همان برآورد درستنمایی بیشینه دانست به همراه یک تنظیمگر.
توضیحات
فرض کنید میخواهیم پارامتر جمعیت مشاهده نشدهی
و تخمین زیر، برآورد حداکثر درست نمایی است:
حال فرض کنید توزیع پیشین
روش برآوردگر بیشینهگر احتمال پسین به صورت زیر است:
مخرج کسر بالا همواره مثبت است و نیز وابسته به
هر وقت تابع هزینه به شکل زیر باشد:
و
محاسبه
محاسبه:
برآوردگر بیشینهگر احتمال پسین به چندین روش میتواند محاسبه شود:
- تحلیلی، زمانی که مد(های) توزیع پسین به شکل عبارت فرم بسته باشد. این مورد زمانی است که توزیع مزدوج پیشین استفاده میشود.
- به وسیلهی بهینه سازی عددی، مانند روش گرادیان مزدوج یا روش نیوتون. این روش معمولا نیازمند مشتقات اول و دوم است.
- به وسیله تغییر دادن الگوریتم امید ریاضی بیشینه کردن. در این روش نیازی به محاسبه مشتقات چگالی پسین نیست.
- به روش مونتکارلو و با استفاده از الگوریتم تبرید شبیهسازیشده.
محدودیتها
در حالی که فقط شرایط خفیف برای برآوردگر بیشینهگر احتمال پسین نیاز است تا نمونهی حدی یک تخمینگر بیزی باشد(تحت تابع هزینهی 1-0)، ولی عموما نمایانگر روشهای بیزی نیست. آن به این دلیل است که برآوردگرهای بیشینهگر احتمال پسین، تخمینگر نقطه هستند در حالی که روشهای بیزی از توزیعها برای خلاصهسازی داده و نتیجهگیری استفاده میکنند. از این رو روشهای بیزی برای گزارش پسین میانگین یا میانه(در کنار بازههای مورد قبول) معتبر هستند، زیرا این تخمینگرها بهترتیب تحت خطای مربعات و خطای خطی بهینه هستند و همچنین توزیع پسین ممکن است توزیع آنالیزی سادهای نداشته باشد(در چنین شرایطی توزیع با استفاده از زنجیره مارکوف مونتکارلو میتواند شبیهسازی شود در حالی که بهینهسازی برای پیدا کردن مدهایش ممکن است سخت یا ناممکن باشد).
در بسیاری از انواع مدلها همانند مدلهای مخلوط، پسین ممکن است چند-مُدال باشد. در این شرایط توصیه آن است که بیشترین مد انتخاب شود که همواره امکان پذیر نیست و گاهی احتمال دارد ناممکن باشد. علاوهبر اینها بیشترین مد ممکن است بیانگر ویژگیهای اغلب پسینها نباشد.
برخلاف برآوردگرهای درستنمایی بیشینه، برآوردگرهای بیشینهگر احتمال پسین هنگام دوبارهسازی پارامترها ثابت نیستند. زیرا تغییر از یکی به دیگری ژاکوبین جدیدی را ایجاد میکند که روی مکان بیشینه اثر میگذارد.
فرض کنید میخواهیم ورودیهای
مثال
فرض کنید
تابعی که میخواهیم بیشینه کنیم به صورت زیر است:
که هم ارز است با کمینه کردن تابع زیر از
در نهایت برآوردگر بیشینهگر احتمال پسین برای
که یک رابطهی خطی وزن دار بین میانگین پیشین و میانگین نمونه است.
وقتی
منابع
Wikipedia contributors, "Maximum a posteriori estimation," Wikipedia, The Free Encyclopedia, (accessed December 21, 2012).