آموزش نرم‌افزار R برای علوم داده: مباحث مقدماتی

آموزش نرم‌افزار R برای علوم داده: مباحث مقدماتی

در این مقاله به موضوعات مقدماتی شامل نحوه تخصیص یک متغیر، کار با بردارها، ماتریس‌ها و قالب‌های داده و همچنین توابع پایه‌ای و پرکاربرد ریاضی و آماری بحث می‌پردازم. رویکرد من در آموزش برنامه‌نویسی R بیشتر مبتنی بر استفاده از مثال است تا خواننده با اجرای کدها بتواند این زبان را یاد بگیرد. اگر R […]

آشنایی با نرم‌افزار R

آشنایی با نرم‌افزار R

R (به فارسی “آر” تلفظ می‌شود) یک زبان برنامه‌نویسی و محیط نرم‌افزاری رایگان است که برای محاسبات آماری و نمایش گرافیکی داده‌ها از آن استفاده می‌شود. کسانی که در حوزه داده‌کاوی (Data Mining)، ماشین‌های یادگیرنده (Machine Learning) و روش‌های تحلیلی کسب‌وکار (Business Analytics) فعال هستند از این نرم‌افزار برای تحلیل‌ داده بهره می‌برند. زبان R برای […]

شاخص‌های پراکندگی در آمار

شاخص‌های پراکندگی در آمار

اگرچه میانگین و سایر شاخص‌های مرکزی کمک می‌کنند تا مرکز داده‌ها را در جامعه یا نمونه آماری تشخیص دهیم، تنها اکتفا کردن به این شاخص‌ها می‌تواند تصویر نادرستی از مسئله پیش روی ما بگذارد. در بسیاری موارد فهمیدن این‌که داده‌ها چگونه حول میانگین پراکنده شده‌اند اهمیت پیدا می‌کند. اگر می‌خواهید بدانید در چه زمانی نباید […]

شاخص‌های مرکزی در آمار

شاخص‌های مرکزی در آمار

در این مقاله توضیح می‌دهم که اگر بخواهیم داده‌های موجود در جامعه آماری و یا نمونه را تنها با یک عدد نشان دهیم از چه شاخص‌هایی می‌توانیم استفاده کنیم. هدف استفاده از چنین شاخص‌هایی این است که اطلاعاتی را که در مجموعه داده‌ها وجود دارد در یک مقدار عددی خلاصه کند. شاخص‌هایی مانند میانگین (Mean)، […]

چرا درک واریانس اهمیت دارد؟

چرا درک واریانس اهمیت دارد؟

نیکولو ماکیاولی (Niccolò Machiavelli) سیاستمدار و فیلسوف ایتالیایی دوران رنسانس در کتاب خود شهریار (The Prince) خطاب به شاهزادگان (مدیران دوران رنسانس) توصیه می‌کند وقتی مشکلی در مملکتتان رخ می‌دهد، بخصوص آن‌هایی که ممکن است شما را به‌شدت وحشت‌زده کند، بلافاصله واکنش نشان ندهید، بهترین سیاست این است که در تصمیم‌گیری خود تأخیر بیندازید. او […]

ضریب همبستگی چیست و چه کاربردی دارد؟

ضریب همبستگی چیست و چه کاربردی دارد؟

در دنیای کسب‌وکار پیش می‌آید که تصمیم‌گیر به رابطه بین دو متغیر علاقه‌مند است. در آمار، از کوواریانس (Covariance) و همبستگی (Correlation) برای کمّی کردن رابطه بین متغیرها بهره می‌برند. در این مقاله به تعاریف ریاضی این مفاهیم می‌پردازم. علاوه بر این با یک مثال در حوزه مدیریت کیفیت و اجرای آن در نرم‌افزار R، […]