بافتنگاشت
نمودار ستونی، بافتنگاشت یا هیستوگرام نمایشی از توزیع دادههای کمی پیوستهاست که میتواند تخمینی از توزیع احتمال باشد و نخستین بار توسط کارل پیرسون به کار گرفته شد.بافتنگاشت یکی از ۷ ابزار کنترل کیفیت است. تفاوت بافتنگاشت (نمودار ستونی) با نمودار میلهای در آن است که نمودار میلهای مربوط به توزیع دو متغیر تصادفی است ولی بافتنگاشت مربوط به یک متغیر است.
برای رسم بافتنگاشت ابتدا باید دادهها را به بازههای کوچک افراز (معمولاً طول بازهها برابر در نظر گرفتهمیشود)، سپس تعداد دادههای هر بازه را محاسبه کرد.
پس از آن اگر طول بازهها برابر بود، روی هر بازه یک مستطیل با ارتفاع متناسب فراوانی آن بازه کشیده میشود.
اگر طول بازهها برابر نبود، روی هر بازه یک مستطیل با مساحت متناسب فراوانی آن بازه کشیده میشود. در این حالت محور عمودی دیگر نشاندهنده فراوانی نیست، بلکه نشاندهنده چگالی فراوانی - تعداد پیشامدها بر واحد متغیر تصادفی روی محور افقی - است.
تعریف ریاضیاتی بافتنگاشت
بافت نگاشت مجموعهای از توابع
بافتنگاشت تجمعی
بافت نگاشت تجمعی مجموعهای از توابع
تعداد و طول بازهها
حالتهای مختلفی برای تعیین بازهها وجود دارد که هرکدام ویژگیهای مختلفی از داده را آشکار میکنند لذا برهم برتری ندارند. هرچه طول بازهها بیشتر باشد، تراکم نقاط کمتر میشود و نویز ناشی از نمونهگیری تصادفی را کاهش میدهد. از طرف دیگر هرچه طول بازهها کمتر باشد، تخمین بهتری از توزیع میتوان پیدا کرد. بعضی تلاش کردهاند تا مقداری بهینه برای تعداد بازهها بیابند، ولی این روشها معمولاً شامل فرضی قوی روی توزیعاند. با توجه به توزیع واقعی دادهها و اهداف تحلیل آنها، مقدار متفاوتی برای طول بازهها مناسب خواهدبود.
مجذور
فرمول استرجس
برای استفاده از فرمول استرجس دادهها باید توزیع تقریباً نرمال داشته باشند. معمولاً این فرمول در حالتی که
قانون رایس
فرمول دوآن
فرمول دوآن بهبودیافتهٔ فرمول استرجس است که کابرد فرمول استرجس را برای دادههای غیرنرمال افزایش دادهاست.
که
قانون اسکات
که
قانون فریدمن - دیاکونیس
که IQR، دامنه بین چارکی دادههاست.
قانون شیمازاکی و شینوموتو
این قانون براساس کمینه کردن تخمین
و
منابع
- ↑ در متون علمی از histo ستون و diagram نمودار
- ↑ واژههای مصوب فرهنگستان - Histogram https://wiki.apll.ir/word/index.php/Histogram
- ↑ Pearson, K. (۱۸۹۵). «Contributions to the Mathematical Theory of Evolution. II. Skew Variation in Homogeneous Material». royalsocietypublishing.org. doi:10.1098/rsta.1895.0010. دریافتشده در ۲۰۱۸-۱۲-۲۷.
- ↑ Dennis.، Howitt, (۲۰۰۸). Introduction to statistics in psychology (ویراست ۴th ed). Harlow: Financial Times Prentice Hall. OCLC 231881314. شابک ۹۷۸۰۱۳۲۰۵۱۶۱۳.
- ↑ N.)، Venables, W. N. (William. Modern applied statistics with S (ویراست ۴th ed). New York. OCLC 49312402. شابک ۰۳۸۷۹۵۴۵۷۰.
- ↑ «EXCEL Univariate: Histogram». cameron.econ.ucdavis.edu. دریافتشده در ۲۰۱۸-۱۲-۲۷.
- ↑ Sturges, H. A. (۱۹۲۶). «The choice of a class interval». Journal of the American Statistical Association. صص. ۶۵–۶۶. doi:10.1080/01621459.1926.10502161. دریافتشده در ۲۰۱۸-۱۲-۲۷.
- ↑ «Online Statistics Education: A Multimedia Course of Study». onlinestatbook.com. دریافتشده در ۲۰۱۸-۱۲-۲۷.
- ↑ Doane DP (۱۹۷۶). «Aesthetic frequency classification». American Statistician (۳۰): ۱۸۱ - ۱۸۳.
- ↑ Scott، David. W. (۱۹۹۲). Multivariate Density Estimation: Theory, Practice, and Visualization.
- ↑ Scott, David W. (1979-12-01). "On optimal and data-based histograms". Biometrika (به انگلیسی). 66 (3): 605–610. doi:10.1093/biomet/66.3.605. ISSN 0006-3444.
- ↑ Diaconis, Persi; Freedman, David (1981-12-01). "On the histogram as a density estimator:L2 theory". Zeitschrift für Wahrscheinlichkeitstheorie und Verwandte Gebiete (به انگلیسی). 57 (4): 453–476. doi:10.1007/BF01025868. ISSN 1432-2064.