زمان تقریبی مطالعه: 5 دقیقه
در نظریهٔ احتمال، تئوری انحرافات بزرگ (به انگلیسی: Large Deviations Theory) مربوط است به بررسی رفتار حدی دنبالهای از
توزیعهای آماری، در طی مشاهدهٔ دادههای جدید. برخی از ایدههای اساسی تئوری را میتوان به لاپلاس یا کرامر نسبت داد. اگرچه این تئوری به شیوهای که امروزه میشناسیم توسط وارادهان در سال ۱۹۶۶ معرفی شد. این تئوری، مفهوم همگرایی اندازهٔ توزیعهای احتمالی را پایهریزی میکند. اگر بخواهیم این تئوری را کمی غیررسمیتر توصیف کنیم، این قضیه درگیر است با بررسی رفتار حدی توزیعهای آماری، بخصوص رفتار دنبالهای (به انگلیسی: Tail behavior)، در شرایطی که دادههای جدید مشاهده میشود.
مثالهای مقدماتی
یک مثال مقدماتی
مثالی را در نظر بگیرید که در آن یک سکه متقارن(احتمال رو و پشت برابر) را به دفعات پرتاب میکنیم. اجازه دهید که نتیجهٔ پرتاب i-امین سکه را با نشان دهیم. در شرایط که ما رخداد سر را با ۱ و رخداد پشت را با ۰ نشان میدهیم. حال فرض کنیم میانگین بعد از پرتاپ امین سکه را نشان دهد.
می دانیم که مقدار بین ۰ و ۱ قرار دارد. از قضیهٔ اعداد بزرگ (و همچنین از روی تجربه) می دانیم که هر چقدر که مقدار بزرگتر شود، توزیع به (یا مقدار انتظاری در پرتاپ یک سکه) نزدیک تر خواهد شد.
همچنین بر اساس قضیهٔ حد مرکزی می دانیم که دارای توزیع نرمال حول به ازای مقادیر بزرگ است. قضیهٔ حد مرکزی نسبت به قضیهٔ اعداد بزرگ اطلاعات بسیاری را میتواند در مورد رفتار ارائه دهد. مثلاً به آسانی میتوانیم توزیع دنبالهای یا (احتمال اینکه متغیر تصادفی بزرگنر از مقدار ثابت باشد، به ازای مقدار ثابتی از .) هرچند که که این تقریب قضیه حد مرکزی به ازای مقدار خیلی دور از چندان دقیق نیست. در واقع قضیهٔ حد مرکزی هرچند که در مورد نحوهٔ همگرایی توزیع دنبالهای وقتی چیزی بیان نمیکند، اما اطلاعاتی در مورد نحوهٔ توزیع دادهها در نزدیکی نقطهٔ حدی در اختیار می گدارد.
بگذارید کمی دقیق تر در این مورد صحبت کنیم. به ازای مقدار داده شدهٔ بگذارید احتمال دنبالهای را محاسبه کنیم. تعریف میکنیم:
توجه کنید که تابع ، یک تابع محدب است که شبیه به آنترپی برنولی است. سپس با استفاده از نابرابری چرنوف داریم . این کران یک کران تنگ است؛ به این مفهوم که را نمی توان چیزی بزرگتر جایگزین کرد که به ازای تمام مقادیر مثبت نامساوی مذکور برقرار باشد. (هر چند که کران نمایی را میتوان با اضافه کردن یک ضریب از مرتبهٔ همچنان کاهش داد. این نتیجه از اعمال تقریب استرلینگ به ضرایب دو جملهای که در توزیع برنولی بدست آورد.) بنابرین نتایج زیر را بدست میآوریم:
احتمال به صورت احتمالی کاهش مییابد، هرچه به سمت بینهایت میل میکند، با نرخی که تابع است. این فرمول احتمال دنبالهای میانگین نمونهای دادههای i.i.d. را تقریب میزند و همگرایی آنها را هرچه تعداد آنها افزایش مییابد را بدست میدهد.
انحرافات بزرگ برای مجموع متغیرهای مستقل
در مثال فوق فرض کردیم که انداختن سکه در دفعات پی در پی مستقل از همدیگر هستند. در واقع احتمال پشت/رو آمدن در هر دفعه مستقل از نتیجهٔ آزمایش قبل است. فرض کنید متغیرهای تصادفی مستقل با توزیع یکسان (i.i.d.) باشند. حد زیر برقرار است:
تابع تابع نرخ، تابع کرامر یا تابع تابع آنترپی نامیده میشود. حد نوشته شده در قسمت فوق به این معنی است که به ازای مقادیر بزرگ :
که نتیجهٔ قضیهٔ انحرافات بزرگ است.
اگر توزیع را بدانیم، عبارتی صریح میتوان برای تابع نرخ بدست آورد. این عبارت صریح توسط تبدیل لژاندر-فنشل به دست میآید:
که در آن
تابع cumulant generating یا GCF نامیده میشود و امید ریاضی اماری است.
اگر دارای توزیع نرمال باشد، تابع نرخ یک سهمی با مقدار حداکثر در میانگین توزیع نرمال خواهد بود. اگر یک زنجیرهٔ ماکوف باشد، نسخهای از قضیهٔ انحرافات بزرگ برای آن برقرار است.
جستارهای وابستهپانویسمنابع
- Special invited paper: Large deviations by S. R. S. Varadhan The Annals of Probability 2008, Vol. 36, No. 2, 397–419 doi:10.1214/07-AOP348
- Entropy، Large Deviations and Statistical Mechanics by R.S. Ellis، Springer Publication. ISBN 3-540-29059-1
- Large Deviations for Performance Analysis by Alan Weiss and Adam Shwartz. Chapman and Hall ISBN 0-412-06311-5
- Large Deviations Techniques and Applications by Amir Dembo and Ofer Zeitouni. Springer ISBN 0-387-98406-2
- Random Perturbations of Dynamical Systems by M.I. Freidlin and A.D. Wentzell. Springer ISBN 0-387-98362-7