بررسی نرمال بودن داده‌ها

بررسی نرمال بودن داده‌ها

می‌توان گفت توزیع نرمال (Normal Distribution) یکی از پرکاربردترین توزیع‌های احتمالی در آمار و یادگیری ماشین است. علاوه بر این توزیع نرمال در توصیف خروجی بسیاری از فرآیندهای تصادفی در دنیای واقعی هم بسیار مفید است. در این مقاله بحث می‌کنم چگونه تشخیص دهید یک نمونه داده از جمعیتی با توزیع نرمال آمده است و […]

مقیاس‌های اندازه‌گیری و انواع داده‌

مقیاس‌های اندازه‌گیری و انواع داده‌

یکی از مفاهیم پایه‌ای که نیاز است کسانی که با داده کار می‌کنند با آن آشنا باشند مفهوم مقیاس‌های اندازه‌گیری (Measurement Scales) و انواع داده است. علت اهمیت این موضوع در این است که نوع داده به نحوه تحلیل آن جهت‌گیری می‌دهد. لزوماً نمی‌توان هر روش تحلیل داده‌ای را برای هر نوع داده‌ای بکار برد. […]

آمار درباره چیست و چرا اهمیت دارد؟

آمار درباره چیست و چرا اهمیت دارد؟

آمار هنر و دانش بررسی ایده‌ها، استنتاج کردن و پاسخ دادن به پرسش‌ها مبتنی بر داده است. امروزه هرچه که جلوتر می‌رویم داده‌های بیشتری در اختیار عموم مردم درباره ابعاد مختلف زندگی مانند اقتصاد، کسب‌وکار، سیاست، سلامت و … قرار می‌گیرد. اینکه افراد بتوانند با یک رویکرد نقادانه این داده‌ها را ارزیابی کنند و برای […]

شاخص‌های شکل در آمار

شاخص‌های شکل در آمار

در آمار شاخص‌های شکل (Shape Measures) بازتاب‌دهنده طرح کلی توزیع داده‌ها است. شاخص‌های شکل به‌ویژه برای متغیرهای پیوسته بکار می‌رود. دو شاخص مهم شکل، چولگی (Skewness) و کشیدگی (Kurtosis) هستند. چولگی چولگی میزان متقارن بودن توزیع را می‌سنجد. یک توزیع متقارن مانند توزیع نرمال (Normal Distribution) دارای چولگی صفر است. توزیعی که یک دنباله بلند […]

نمودار چندک-چندک (Q-Q Plot) چیست و چه کاربردی دارد؟

نمودار چندک-چندک (Q-Q Plot) چیست و چه کاربردی دارد؟

نمودار چندک-چندک (Quantile-Quantile Plot) یک ابزار توصیفی است که کمک می‌کند بفهمیم یک مجموعه داده از یک توزیع احتمالی مشخص مانند توزیع نرمال (Normal Distribution) یا نمایی (Exponential Distribution) پیروی می‌کند یا خیر. برای مثال فرض نرمال بودن داده‌ها در بسیاری از آزمون‌های آماری وجود دارد. بنابراین قبل از انجام چنین آزمون‌های آماری نیاز است […]

نکاتی پیرامون تحلیل داده‌های مالی و اقتصادی

نکاتی پیرامون تحلیل داده‌های مالی و اقتصادی

در مدیریت کسب‌وکار بسیار پیش می‌آید که مدیران باید اطلاعات و داده‌های مالی و اقتصادی را تحلیل کنند. همین‌طور کسانی که در سطوح کارشناسی بر روی مدل‌سازی‌های ریاضی در حوزه علوم اقتصادی و مدیریت کار می‌کنند، معمولاً با داده‌های مالی و اقتصادی سروکار دارند. من در این مقاله به نکات مهمی اشاره می‌کنم که هنگام […]

معنی‌داری آماری به زبان ساده

معنی‌داری آماری به زبان ساده

معنی‌داری آماری (Statistical Significance) یکی از مفاهیم مهمی است که در تحلیل‌های آماری استفاده می‌شود. با گسترش تصمیم‌گیری داده‌محور در عرصه‌های مختلف، امروزه چه محققان و چه مدیران بیشتر و بیشتر از مفهوم معنی‌داری آماری در تصمیم‌گیری استفاده می‌کنند. برای مثال شرکت دارویی که می‌خواهد بر مبنای نتایج آزمایش کنترل‌شده تصادفی (Randomized Controlled Experiment) تصمیم […]

رگرسیون به زبان ساده برای مدیران

رگرسیون به زبان ساده برای مدیران

یکی از مهم‌ترین روش‌های تحلیل داده در کسب‌وکار تحلیل رگرسیون (Regression Analysis) است. اگرچه در بیشتر موارد مدیران خود چنین تحلیل‌هایی را انجام نمی‌دهند، برای تصمیم‌گیری بر مبنای خروجی‌های تحلیل رگرسیون نیاز است تا با مفاهیم آن آشنا باشند. من در این مقاله به معرفی تحلیل رگرسیون می‌پردازم. تحلیل رگرسیون چیست؟ فرض کنید شما مدیر بازاریابی […]

شاخص‌های پراکندگی در آمار

شاخص‌های پراکندگی در آمار

اگرچه میانگین و سایر شاخص‌های مرکزی کمک می‌کنند تا مرکز داده‌ها را در جامعه یا نمونه آماری تشخیص دهیم، تنها اکتفا کردن به این شاخص‌ها می‌تواند تصویر نادرستی از مسئله پیش روی ما بگذارد. در بسیاری موارد فهمیدن این‌که داده‌ها چگونه حول میانگین پراکنده شده‌اند اهمیت پیدا می‌کند. اگر می‌خواهید بدانید در چه زمانی نباید […]

شاخص‌های مرکزی در آمار

شاخص‌های مرکزی در آمار

در این مقاله توضیح می‌دهم که اگر بخواهیم داده‌های موجود در جامعه آماری و یا نمونه را تنها با یک عدد نشان دهیم از چه شاخص‌هایی می‌توانیم استفاده کنیم. هدف استفاده از چنین شاخص‌هایی این است که اطلاعاتی را که در مجموعه داده‌ها وجود دارد در یک مقدار عددی خلاصه کند. شاخص‌هایی مانند میانگین (Mean)، […]

ضریب همبستگی چیست و چه کاربردی دارد؟

ضریب همبستگی چیست و چه کاربردی دارد؟

در دنیای کسب‌وکار پیش می‌آید که تصمیم‌گیر به رابطه بین دو متغیر علاقه‌مند است. در آمار، از کوواریانس (Covariance) و همبستگی (Correlation) برای کمّی کردن رابطه بین متغیرها بهره می‌برند. در این مقاله به تعاریف ریاضی این مفاهیم می‌پردازم. علاوه بر این با یک مثال در حوزه مدیریت کیفیت و اجرای آن در نرم‌افزار R، […]