کدام نمودار برای نمایش داده مناسب است؟

کدام نمودار برای نمایش داده مناسب است؟

نمودارهایی که خوب طراحی شده‌اند به تحلیلگر کمک می‌کنند تا سریع‌تر و بهتر اطلاعات را تحلیل و جمع‌بندی کنند. در سمت دیگر، در مقاله “چگونه ممکن است نمودارها شما را فریب دهند؟” بحث کردم چطور نمودارها ممکن است، موجب خطا در فهم داده‌ها و استنباط از آن شود. یک گام مهم در نمایش داده‌ها آن […]

تحلیل داده‌ها در جدول متقاطع و آزمون کای-دو

تحلیل داده‌ها در جدول متقاطع و آزمون کای-دو

  فرض کنید در یک تحقیق مطالعه بازار علاقه‌مند هستیم بدانیم آیا مشتریان هنگام خرید محصولات مواد غذایی به اطلاعات برچسب سلامت (شکل-۱) روی بسته‌بندی توجه می‌کنند یا خیر. ممکن است یک فرضیه محقق در چنین تحقیقی این باشد که جنسیت روی توجه به اطلاعات برچسب سلامت هنگام خرید اثرگذار است؛ احتمالاً زنان هنگام خرید […]

چندک (Quantile) در R و پایتون چگونه محاسبه می‌گردد؟

چندک (Quantile) در R و پایتون چگونه محاسبه می‌گردد؟

به زبان ساده چندک (Quantile) یعنی وقتی شما داده‌ها را به بخش‌هایی مساوی تقسیم کنید، برش‌هایی از داده که این قسمت‌های مساوی را از هم جدا می‌کند چندک نامیده می‌شود. یکی از معروف‌ترین چندک‌ها میانه (Median) است. میانه یک شاخص مرکزی است. اگر داده‌ها به ترتیب از کوچک‌تر به بزرگ‌تر مرتب شوند، نیمی از آن‌ها […]

آموزش زبان R برای علوم داده: رسم نمودار

آموزش زبان R برای علوم داده: رسم نمودار

یکی از قابلیت‌های برجسته زبان R این است که امکانات متنوعی را برای نمایش داده‌ها داراست. در این مقاله من به روش‌های پایه‌ای برای رسم نمودار اشاره می‌کنم که در دنیای کسب‌وکار بیشتر استفاده می‌شوند. در این مقاله صرفاً به توابع داخلی R برای نمایش داده می‌پردازم. خواننده باید بداند برای رسم نمودارهای پیشرفته‌تر بسته‌هایی […]

آموزش زبان R برای علوم داده: توابع

آموزش زبان R برای علوم داده: توابع

بیشتر کارهایی که در زبان R انجام می‌دهیم، توسط توابع صورت می‌گیرد. تاکنون من از توابعی که به‌صورت پیش‌فرض در R تعریف‌شده‌اند، استفاده کردم. ولی این امکان وجود دارد که شما توابع موردنظرتان را ایجاد کنید. نوشتن توابع آغاز راهی است که شما را از استفاده‌کننده صرف از R به توسعه‌دهنده تبدیل می‌کند. توابع معمولاً […]

آموزش زبان R برای علوم داده: عبارات شرطی و حلقه‌ها

آموزش زبان R برای علوم داده: عبارات شرطی و حلقه‌ها

ساختارهای کنترلی (Control Structures) در زبان R به شما اجازه می‌دهد تا نحوه اجرای عبارات نوشته‌شده را پایش کنید. به‌این‌ترتیب با قرار دادن عبارات منطقی، بسته به این‌که ورودی‌ها چگونه باشد، دستورات متفاوتی اجرا می‌شود. ساختارهای کنترلی عمده در زبان R به شرح زیر است: دستور if  و else: بررسی یک شرط و عمل بر […]

نکاتی پیرامون تحلیل داده‌های مالی و اقتصادی

نکاتی پیرامون تحلیل داده‌های مالی و اقتصادی

  در مدیریت کسب‌وکار بسیار پیش می‌آید که مدیران باید اطلاعات و داده‌های مالی و اقتصادی را تحلیل کنند. همین‌طور کسانی که در سطوح کارشناسی بر روی مدل‌سازی‌های ریاضی در حوزه علوم اقتصادی و مدیریت کار می‌کنند، معمولاً با داده‌های مالی و اقتصادی سروکار دارند. من در این مقاله به نکات مهمی اشاره می‌کنم که […]

چگونه ممکن است نمودارها شما را فریب دهند؟

چگونه ممکن است نمودارها شما را فریب دهند؟

  نمایش گرافیکی داده‌ها در قالب نمودار یکی از ابزارهای مؤثر برای فهم اطلاعات و رسیدن به شهود برای تصمیم‌گیری در فضای کسب‌وکار است. مدیران با نگاه کردن به نمودارها می‌توانند به‌سرعت فهم خوبی از داده‌ها به دست آورند و آن را مبنای تصمیم‌گیری خود قرار دهند. ازاین‌رو نمودارها بسیار موردعلاقه مدیران هستند. ولی نمودارها […]

آموزش زبان R برای علوم داده: خواندن و نوشتن داده‌ها

آموزش زبان R برای علوم داده: خواندن و نوشتن داده‌ها

در این مقاله من عمدتاً به روش‌های مختلف برای خواندن و نوشتن داده‌ها در زبان R می‌پردازم. علاوه بر این در مورد نحوه شناسایی مقادیر گمشده (Missing Values) و همچنین نصب بسته (Package) از کتابخانه R بحث می‌کنم. رویکرد من در آموزش زبان برنامه‌نویسی R بیشتر مبتنی بر استفاده از مثال است تا خواننده با […]

چگونه رابطه علّی را تشخیص دهیم؟

چگونه رابطه علّی را تشخیص دهیم؟

  در تصمیم‌گیری‌های کسب‌وکار بسیار اهمیت دارد که مدیران بتوانند رابطه علّی را درست تشخیص دهند. می‌توان گفت در بیشتر موارد مدیریت یعنی ایجاد تغییر در چیزهایی که تحت کنترل است به‌منظور آن‌که روی چیزهای دیگری که تحت کنترل نیست، اثر گذاشت تا به نتیجه دلخواه رسید. برای مثال یک مدیر بودجه تبلیغات سازمان خود […]

پارادوکس سیمپسون: وقتی واقعیت‌ها، همه واقعیت نیستند

پارادوکس سیمپسون: وقتی واقعیت‌ها، همه واقعیت نیستند

  بر اساس اطلاعاتی که اخیراً مرکز آمار ایران منتشر کرده نرخ بیکاری جوانان (طبق تعریف ۱۵ تا ۲۴ ساله) در سال ۱۳۹۶ برای جمعیت شهری ۳۱٫۹ درصد و برای جمعیت روستایی ۲۰٫۷ درصد بوده است. این در حالی است که نرخ بیکاری جوانان در سال ۱۳۸۱ برای جمعیت شهری ۳۳٫۷ درصد و برای جمعیت […]

آموزش زبان R برای علوم داده: مباحث مقدماتی

آموزش زبان R برای علوم داده: مباحث مقدماتی

در این مقاله به موضوعات مقدماتی شامل نحوه تخصیص یک متغیر، کار با بردارها، ماتریس‌ها و قالب‌های داده و همچنین توابع پایه‌ای و پرکاربرد ریاضی و آماری می‌پردازم. رویکرد من در آموزش زبان برنامه‌نویسی R بیشتر مبتنی بر استفاده از مثال است تا خواننده با اجرای کدها بتواند این زبان را یاد بگیرد. اگر R […]

آشنایی با زبان R

آشنایی با زبان R

R (به فارسی “آر” تلفظ می‌شود) یک زبان برنامه‌نویسی و محیط نرم‌افزاری رایگان است که برای محاسبات آماری و نمایش گرافیکی داده‌ها استفاده می‌شود. کسانی که در حوزه داده‌کاوی (Data Mining)، ماشین‌های یادگیرنده (Machine Learning) و روش‌های تحلیلی کسب‌وکار (Business Analytics) فعال هستند از این نرم‌افزار برای تحلیل‌ داده بهره می‌برند. هرچه می‌گذارد، R بیشتر به […]

معنی‌داری آماری به زبان ساده

معنی‌داری آماری به زبان ساده

  معنی‌داری آماری (Statistical Significance) یکی از مفاهیم مهمی است که در تحلیل‌های آماری استفاده می‌شود. با گسترش تصمیم‌گیری داده‌محور در عرصه‌های مختلف، امروزه چه محققان و چه مدیران بیشتر و بیشتر از مفهوم معنی‌داری آماری در تصمیم‌گیری استفاده می‌کنند. برای مثال شرکت دارویی که می‌خواهد بر مبنای نتایج آزمایش کنترل‌شده تصادفی (Randomized Controlled Experiment) […]

رگرسیون خطی به زبان ساده برای مدیران

رگرسیون خطی به زبان ساده برای مدیران

یکی از مهم‌ترین روش‌های تحلیل داده در کسب‌وکار، رگرسیون خطی (Linear Regression) است. رگرسیون خطی، یکی از مهمترین الگوریتم‌های یادگیری ماشین هم هست. اگرچه در بیشتر موارد مدیران خود چنین تحلیل‌هایی را انجام نمی‌دهند، برای تصمیم‌گیری بر مبنای خروجی‌های تحلیل رگرسیون نیاز است تا با مفاهیم آن آشنا باشند. من در این مقاله به معرفی […]

شاخص‌های پراکندگی در آمار

شاخص‌های پراکندگی در آمار

  اگرچه میانگین و سایر شاخص‌های مرکزی کمک می‌کنند تا مرکز داده‌ها را در جامعه یا نمونه آماری تشخیص دهیم، تنها اکتفا کردن به این شاخص‌ها می‌تواند تصویر نادرستی از مسئله پیش روی ما بگذارد. در بسیاری موارد فهمیدن این‌که داده‌ها چگونه حول میانگین پراکنده شده‌اند اهمیت پیدا می‌کند. اگر می‌خواهید بدانید در چه زمانی […]

شاخص‌های مرکزی در آمار

شاخص‌های مرکزی در آمار

در این مقاله توضیح می‌دهم که اگر بخواهیم داده‌های موجود در جامعه آماری و یا نمونه را تنها با یک عدد نشان دهیم از چه شاخص‌هایی می‌توانیم استفاده کنیم. هدف استفاده از چنین شاخص‌هایی این است که اطلاعاتی را که در مجموعه داده‌ها وجود دارد در یک مقدار عددی خلاصه کند. شاخص‌هایی مانند میانگین (Mean)، […]

مراحل اجرای یک پروژه‌ داده‌کاوی چیست؟

مراحل اجرای یک پروژه‌ داده‌کاوی چیست؟

  ممکن است برخی داده‌کاوی (Data Mining) را مجموعه‌ای از نرم‌افزارهای خودکار یا روش‌های ریاضی و آماری بدانند. درواقع داده‌کاوی یک فرآیند و متدولوژی است که به مدیران کمک می‌کند تا از داده‌های خام به اطلاعات ارزشمندی برسند که به بهبود تصمیم‌گیری‌های آنان منجر شود. یکی از متداول‌ترین فرآیندها برای انجام پروژه‌های داده‌کاوی، CRISP-DM (Cross-Industry […]

چگونه مانند یک دانشمند داده فکر کنید؟ راهنمایی برای مدیران اجرایی

چگونه مانند یک دانشمند داده فکر کنید؟ راهنمایی برای مدیران اجرایی

  امروزه بسیار توصیه می‌شود تا مدیران از داده برای تصمیم‌گیری‌های حوزه‌های کسب‌وکار استفاده کنند. اما ممکن است مدیران در کار با داده، استنتاج و تحلیل بر اساس آن و درنهایت شکل‌گیری تصمیم خود راحت نباشند. خبر خوب این است که لزومی ندارد شما یک متخصص و یا دانشمند داده باشید تا بتوانید تصمیمات داده‌محور […]

ضریب همبستگی چیست و چه کاربردی دارد؟

ضریب همبستگی چیست و چه کاربردی دارد؟

  در دنیای کسب‌وکار پیش می‌آید که تصمیم‌گیر به رابطه بین دو متغیر علاقه‌مند است. در آمار، از کوواریانس (Covariance) و همبستگی (Correlation) برای کمّی کردن رابطه بین متغیرها بهره می‌برند. در این مقاله به تعاریف ریاضی این مفاهیم می‌پردازم. علاوه بر این با یک مثال در حوزه مدیریت کیفیت و اجرای آن در زبان […]