شاخص‌های شکل در آمار

در آمار شاخص‌های شکل (Shape Measures) بازتاب‌دهنده طرح کلی توزیع داده‌ها است. شاخص‌های شکل به‌ویژه برای متغیرهای پیوسته بکار می‌رود. دو شاخص مهم شکل، چولگی (Skewness) و کشیدگی (Kurtosis) هستند.

چولگی

چولگی میزان متقارن بودن توزیع را می‌سنجد. یک توزیع متقارن مانند توزیع نرمال (Normal Distribution) دارای چولگی صفر است. توزیعی که یک دنباله بلند در سمت راست آن دارد، دارای چولگی مثبت است. در مقابل، چولگی توزیعی که یک دم بلند در سمت چپ دارد، منفی است (شکل-۱).

شکل-۱

 

برای محاسبه چولگی، گشتاور دوم و سوم توزیع بکار می‌رود. گشتاور r ام یک توزیع، میانگین انحراف توزیع نسبت به میانگین (\mu ) به توان r ام را می‌سنجد. گشتاور r ام یک توزیع از رابطه زیر به دست می‌آید:

m_{r} = \frac{\sum {(x - \mu)}^{r}}{n}

چولگی جامعه نسبت گشتاور سوم به واریانس به توان ۱٫۵ است و از رابطه زیر محاسبه می‌گردد:

skewness = \frac{m_{3}}{m_{2}^{3/2}}

در رابطه بالا، m_{2} و m_{3} به ترتیب گشتاور دوم و سوم توزیع هستند. توجه کنید گشتاور دوم، همان واریانس توزیع است. چولگی توزیع نرمال صفر است. برای چنین توزیع متقارنی، میانگین، میانه و مد داده‌ها با یکدیگر برابر است. درحالی‌که برای داده‌های دارای چولگی، چنین نیست. برای نمونه، در یک توزیع با چولگی مثبت ازآنجاکه میانگین بیشترین تأثیر را از داده‌های پرت (داده‌های واقع در انتهای دنباله سمت راست) می‌گیرد، بیشتر از میانه و مد به سمت راست متمایل می‌شود (شکل-۲).

شکل-۲

 

کشیدگی

کشیدگی میزان قله‌گی (Peakedness) نسبی توزیع را سنجش می‌کند. به‌عنوان یک ملاک مقایسه، توزیع نرمال دارای کشیدگی متوسط (Mesokurtic) است. توزیع‌ متقارنی که قله منحنی آن بالاتر از منحنی نرمال است و دنباله‌های پهن‌تری از توزیع نرمال دارد، در اصطلاح  کشیده (Leptokurtic) نامیده می‌شود. در مقابل، توزیع‌ متقارن که قله منحنی آن بالاتر از منحنی نرمال است و دنباله‌های نازک‌تری از توزیع نرمال دارد، در اصطلاح  پخ (Platykurtic) نامیده می‌شود (شکل-۳).

شکل-۳

 

کشیدگی جامعه از نسبت گشتاور چهارم به واریانس به توان ۲ است و از رابطه زیر محاسبه می‌گردد:

kurtosis = \frac{m_{4}}{m_{2}^{2}}

در رابطه بالا، m_{2} و m_{4} به ترتیب گشتاور دوم و چهارم توزیع هستند. توجه کنید کشیدگی توزیع نرمال ۳ است.

 

محاسبه چولگی و کشیدگی در R

در این مثال من برداری مانند  x  با ۲۰۰ درایه ایجاد کردم که درایه‌های آن به‌صورت تصادفی از توزیع ویبول (Weibull) با پارامترهای shape = 1.5   و  scale = 3 به‌دست‌آمده‌اند. توجه کنید x می‌تواند هر نمونه داده‌ای باشد. هیستوگرام داده‌ها در شکل-۴ آمده است. برای محاسبه چولگی و کشیدگی در نرم افزار R، یک تابع به اسم moments_func نوشتم، تا بتوانم گشتاور r ام را محاسبه کنم و سپس از آن برمبنای روابط بالا، برای محاسبه شاخص‌های شکل استفاده کردم.

شکل-۴

 

راه حل دیگر، استفاده از کتابخانه moments است. توابع skewness  و kurtosis برای محاسبه چولگی و کشیدگی بکار می روند.

 

محاسبه چولگی و کشیدگی در پایتون

در پایتون من آرایه‌ای مانند x با ۲۰۰ درایه ایجاد کردم که درایه‌های آن به‌صورت تصادفی از توزیع ویبول (Weibull) با پارامترهای shape = 1.5  و scale = 3 به‌دست‌آمده‌اند. توجه کنید x می‌تواند هر نمونه داده‌ای باشد. برای محاسبه چولگی و کشیدگی در نرم افزار پایتون، یک تابع به اسم moments_func نوشتم، تا بتوانم گشتاور r ام را محاسبه کنم و سپس از روابط بالا، برای محاسبه شاخص‌های شکل استفاده کردم.

 

راه حل دیگر، استفاده از کتابخانه scipy در پایتون است. در این کتابخانه، ماژول stats حاوی توابع skew  و kurtosis است که برای محاسبه چولگی و کشیدگی بکار می روند.

 

منابع:

Levine, D. M., Berenson, M. L., & Stephan, D. (1999). “Statistics for Managers Using Microsoft Excel”, Upper Saddle River, NJ: Prentice Hall

Weiers, R. M. (2010). “Introduction to Business Statistics”, Cengage Learning

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *