توزیع پارتو
توزیع پارتو (به انگلیسی: Pareto distribution) نوعی توزیع احتمال قانون-توانی است، که در توصیف پدیدههای قابل مشاهده، از نوع اجتماعی، علمی، ژئوفیزیکی، و بیمسنجی و بسیاری موارد دیگر استفاده میشود. این توزیع در اصل برای توصیف توزیع ثروت در یک جامعه استفاده شده بود، و با این گرایش توزیع ثروت که «بخش زیادی از ثروت توسط بخش اندکی از جمعیت نگهداری میشود»، هماهنگ است. به صورت محاورهای به این توزیع «اصل پارتو» یا «قاعده ۸۰–۲۰» هم میگویند، همچنین گاهی به آن «اصل میتو» گفته میشود. این قاعده میگوید: برای مثال، «۸۰ درصد از ثروت یک جامعه توسط ۲۰ درصد از جمعیت آن نگهداری میشود». با این حال، نباید توزیع پارتو را با اصل پارتو یکسان دانست، زیرا توزیع پارتو فقط برای مقدار
تابع چگالی احتمال تابع توزیع احتمالی پارتو برای مقادیر مختلف | |||
تابع توزیع تجمعی تابع توزیع تجمعی پارتو برای مقادیر مختلف | |||
پارامترها |
شکل (حقیقی) | ||
---|---|---|---|
تکیهگاه |
| ||
تابع چگالی احتمال |
| ||
تابع توزیع تجمعی |
| ||
میانگین |
| ||
میانه |
| ||
مُد |
| ||
واریانس |
| ||
چولگی |
| ||
کشیدگی |
| ||
آنتروپی |
| ||
تابع مولد گشتاور | تعریف نشده | ||
تابع مشخصه |
| ||
اطلاع فیشر |
|
توزیع پارتو از نام مهندس عمران، اقتصاددان و جامعهشناس ایتالیایی، ویلفردو پارتو گرفته شدهاست. واژه Pareto در انگلیسی به صورت «پِرِیتو» (US: /pəˈreɪtoʊ/ pə-RAY-toh) تلفظ میشود.
تاریخچه
در سال ۱۸۹۷، اقتصاددان ایتالیایی ویلفردوپارتو (۱۹۲۳–۱۸۴۸) که شاگرد لئون والراس بود و پس از او به احراز کرسی اقتصاد سیاسی دانشگاه لوزان دست یافت، باعث ایجاد نظم خاصی در توزیع درآمدها در کشورهای سرمایهداری و نیز کشورهایی که در شرایط فئودالی و سرمایهداری اولیه بودند شد. پارتو قصد داشت براساس این قانون نتایجی با ماهیت اقتصادی و اجتماعی بهدستآورد.
پارتو دومین نفر از مکتب لوزان است؛ مکتب لوزان توسط لئون والراس (۱۸۳۴–۱۹۱۰) پایهگذاری شد؛ این مکتب علاوه بر بحث دربارهٔ مقوله مطلوبیت، به هزینه و عرضه نیز پرداختهاست؛ با این بیان که اگر قیمت، بالاتر از هزینه تولید قرار گیرد، عرضه افزایش پیدا میکند تا قیمت را پایین آورد و بالعکس؛ اگر هزینه از قیمت پیشی گیرد، عرضه کاهش پیدا کرده و قیمتها بالا میروند. پارتو یکی از بنیانگذاران اقتصاد ریاضی نیز شناخته شدهاست. دیدگاه او در مقوله تعادل عمومی در اقتصاد رفاه، جایگاه اساسی دارد.
پارتو بر مبنای آمارهای کشورهای مختلف، توزیعهای فراوانی بدست آورد که معرف تعداد افرادی بودند که درآمدشان برابر مقداری معین یا بیشبر از آن بود. آنگاه نمودارهای این توزیعهای فراوانی را رسم کرد. محور افقی این نمودارها معرف درآمد و محور عمودی، تعداد افراد با درآمد x یا بیشتر را نشان میداد.
پارتو دریافت که دراغلب حالات مورد بررسی، منحنیهای نشان دهندهٔ این نوع توزیعهای درآمد شکلی مشابه دارند؛ یعنی منحنیهایی هستند که معادله آنها با فرمول زیر مشخص میشود:
که در آنها b کمترین حد درآمدی است که منحنی از آن شروع میشود، درحالی که A, پارامترهای معین مثبت هستند. نمودار این منحنی، منحنی پارتو نام دارد.
تعریف
تابع چگالی احتمال
تابع چگالی احتمال یک توزیع پارتو چنین است.
ویژگیها
تابع توزیع تجمعی
تابع توزیع تجمعی در توزیع پارتو برابر است با:
و همچنین معکوس آن برابر است با:
میانه
میانه در توزیع پارتو برابر است با:
مد
مد در توزیع پارتو برابر است با:
امید ریاضی
امید ریاضی یک توزیع پارتو برابر است با:
واریانس
واریانس یک توزیع پارتو برابر است با:
برای
انحراف معیار
انحراف معیار یک توزیع پارتو برابر است با:
توزیع پارتو تعمیمیافته
۵ نوع توزیع تعمیم یافته وجود دارد که توزیع پارتو را تعمیم میدهد.
شرایط | |||||||
---|---|---|---|---|---|---|---|
نوع ۱ | |||||||
نوع ۲ | |||||||
نوع Lomax | |||||||
نوع ۳ | |||||||
نوع ۴ |
کاربردها
اصل پارتو
- پارتو در ابتدا از این توزیع برای توصیف تخصیص ثروت در میان افراد استفاده میکرد، زیرا به نظر میرسید که بخش بزرگی از ثروت هر جامعه متعلق به درصد کمتر از مردم در آن جامعه است. او همچنین برای توصیف توزیع درآمد از آن استفاده کرد. این ایده گاهی به سادگی به عنوان اصل پارتو یا "حکم ۸۰–۲۰" بیان میشود که میگوید ۲۰ درصد از جمعیت ۸۰ درصد ثروت را کنترل میکنند. با این وجود، قواعد ۸۰–۲۰ به ارزش خاص مربوط میشود و در واقع، اطلاعات پارتو دربارهٔ مالیات بر درآمد بریتانیا در سیاستهای اقتصادی خود نشان میدهد که حدود ۳۰ درصد از جمعیت حدود ۷۰ درصد درآمد داشتهاست. نمودار تابع چگالی احتمال (PDF) نشان میدهد که احتمال یا کسری از جمعیت که دارای مقدار کمی ثروت در هر فرد است نسبتاً بالا است و پس از آن بهطور ثابتی به عنوان افزایش ثروت کاهش مییابد. (توجه داشته باشید که توزیع پارتو برای ثروت برای انتهای پایین واقعگرایانه نیست. در حقیقت، ارزش خالص ممکن است حتی منفی باشد).
- «انجام هر کدام از کارهای موجود در لیست شما ممکن است به یک اندازه وقت شما را بگیرد ولی انجام یک یا دو تای آنها چند برابر هر یک از سایر موارد برای شما سودمند خواهد بود. گاهی پیش میآید که ارزش یکی از ده کار یا فعالیتی که شما در لیست خود دارید به تنهایی میتواند بیش از مجموع سایر فعالیتها در موفقیت شما ارزشمند باشد. این کار بی تردید همان قورباغه ای است که باید اول از همه قورت بدهید. میتوانید حدس بزنید که یک فرد معمولی احتمالاً در انجام چه کارهایی بیشتر تنبلی میکند؟ واقعیت تاسف بار این است که اکثر مردم در مورد انجام همان ده یا بیست درصد از فعالیتهایی که در صدر قرار دارند و بیشترین ارزش و اهمیت را دارند تنبلی میکنند یعنی در مورد همان اقلیت بسیار مهم. در عوض وقت خود را صرف هشتاد درصد فعالیتهایی میکنند که در موفقیت آنها اهمیت بسیار کمی دارد و تأثیر ناچیزی در دست یابی به نتایج ارزشمند میگذارد؛ یعنی همان اکثریت کماهمیت.»
دیگر کاربردهای آن
- بسیاری از پدیدههای اجتماعی، علمی و ژئوفیزیکی توسط توزیع پارتو توصیف میشوند. این توزیع در مباحث طول عمر و قابلیت اعتماد دارای اهمیت فراوان است.
- از دیگر کاربردهای آن میتوان به موارد زیر اشاره کرد:
- اندازه شهرکهای انسانی (چند شهر بزرگ دربرابر بسیاری از شهرهای کوچک و روستاها)
- توزیع حجم فایل ترافیک اینترنتی که از پروتکل TCP استفاده میکند (چند عدد بزرگ دربرابر بسیاری از عددهای کوچک)
- نرخ خطا در هارد دیسک
- خوشههای معادله بوز-اینشتین نزدیک صفر مطلق
- ارزش ذخایر نفت در میدانهای نفتی (چند میدان بزرگ دربرابر بسیاری از میدانهای کوچک)
- توزیع طولی در مشاغل سوپر کامپیوترها (چند عدد بزرگ دربرابر بسیاری از عددهای کوچک)
- قیمت استاندارد شده بر روی سهام فردی
- اندازه ذرات شن و ماسه
- اندازه شهاب سنگها
- بارندگی سالانه حداکثر یک روزه و تخلیه رودخانه
نمونهای از توزیع پارتو
درآمد یک جمعیت خاص
فرض کنید که درآمد یک جمعیت خاص دارای توزیع پارتو با
حال میخواهیم نسبت جمعیت افراد با درآمد ۲۰۰۰ تا ۴۰۰۰ را بدست آوریم.
حال میخواهیم درآمد آنها را بدست آوریم.
درآمد کل نیز برابر است با:
بنابراین ۱۰٫۹۳۷۵ درصد افراد دارای درآمدی بین ۲۰۰۰ تا ۴۰۰۰ هستند که ۱۸٫۷۵ درصد درآمد کل را دارند.
کد در زبان R
library("EnvStats") # Package for Environmental Statistics
pareto <- rpareto(n = 10000000, location = 1000, shape = 3) # Get 10000000 numbers of Pareto distribution
pareto <- pareto[pareto > 1000] # Get numbers greater than 1000
number <- 0 # Number of people with income from 2000 to 4000
for (i in pareto) {
if (i <= 4000 && i >= 2000) {
number = number + 1
}
}
cat("proportion of people with income from 2000 to 4000:", number / length(pareto))
paretoPlot <- pareto[pareto < 5000] # Get numbers less than 5,000 to draw charts
hist(paretoPlot, breaks = 150) # Draw charts
منابع
- ↑ Pareto, Vilfredo (1898). "Cours d'economie politique". Journal of Political Economy. 6.
- ↑ VAN MONTFORT, M.A.J. (1986). "The Generalized Pareto distribution applied to rainfall depths". Hydrological Sciences Journal. 31 (2): 151–162. doi:10.1080/02626668609491037.
- ↑ Oancea, Bogdan (2017). "Income inequality in Romania: The exponential-Pareto distribution". Physica A: Statistical Mechanics and Its Applications. 469: 486–498. Bibcode:2017PhyA..469..486O. doi:10.1016/j.physa.2016.11.094.
- ↑ «پایاننامه تحصیلی دورهٔ کارشناسی ارشد». رضا پورطاهری. شهریور 70.
- ↑ B.، Douglas, J. (۱۹۸۰). Analysis with standard contagious distributions. Fairland, Md.: International Co-operative Pub. House. OCLC 7792137. شابک ۰۸۹۹۷۴۰۱۲X.
- ↑ Kotz، Samuel, ویراستار (۲۰۰۴-۰۷-۱۵). Encyclopedia of Statistical Sciences. Hoboken, NJ, USA: John Wiley & Sons, Inc. شابک ۰۴۷۱۶۶۷۱۹۶.
- ↑ Pareto، Vilfredo (۱۹۶۴). Cours d'économie politique. Librairie Droz. شابک ۹۷۸۲۶۰۰۰۴۰۱۴۳.
- ↑ Notestein, Frank W. (1974-01). "The World Population Year". Population Index. 40 (1): 18. doi:10.2307/2733536. ISSN 0032-4701.
- ↑ Sardana, G.D. (2007-07). "Eat That Frog! Brian Tracy". Paradigm. 11 (2): 83–84. doi:10.1177/0971890720070213. ISSN 0971-8907.
- ↑ Reed, William J.; Jorgensen, Murray (2004-12-31). "The Double Pareto-Lognormal Distribution—A New Parametric Model for Size Distributions". Communications in Statistics - Theory and Methods (به انگلیسی). 33 (8): 1733–1753. doi:10.1081/sta-120037438. ISSN 0361-0926.
- ↑ Schroeder, Bianca; Damouras, Sotirios; Gill, Phillipa (2010-09-01). "Understanding latent sector errors and how to protect against them". ACM Transactions on Storage. 6 (3): 1–23. doi:10.1145/1837915.1837917. ISSN 1553-3077.
- ↑ Random Variables and Cumulative Distribution. 1000 20th Street, Bellingham, WA 98227-0010 USA: SPIE. صص. ۳–۳. شابک ۹۷۸۰۸۱۹۴۸۷۰۱۸.
- ↑ "AP Statistics Curriculum 2007 Pareto - Socr". wiki.stat.ucla.edu (به انگلیسی). Retrieved 2018-10-29.