نمودارهایی که خوب طراحی شدهاند به تحلیلگر کمک میکنند تا سریعتر و بهتر اطلاعات را تحلیل و جمعبندی کنند. در سمت دیگر، در مقاله “چگونه ممکن است نمودارها شما را فریب دهند؟” بحث کردم چطور نمودارها ممکن است، موجب خطا در فهم دادهها و استنباط از آن شود. یک گام مهم در نمایش دادهها آن […]
تحلیل داده
تحلیل دادهها در جدول متقاطع و آزمون کای-دو
فرض کنید در یک تحقیق مطالعه بازار علاقهمند هستیم بدانیم آیا مشتریان هنگام خرید محصولات مواد غذایی به اطلاعات برچسب سلامت (شکل-۱) روی بستهبندی توجه میکنند یا خیر. ممکن است یک فرضیه محقق در چنین تحقیقی این باشد که جنسیت روی توجه به اطلاعات برچسب سلامت هنگام خرید اثرگذار است؛ احتمالاً زنان هنگام خرید […]
چندک (Quantile) در R و پایتون چگونه محاسبه میگردد؟
به زبان ساده چندک (Quantile) یعنی وقتی شما دادهها را به بخشهایی مساوی تقسیم کنید، برشهایی از داده که این قسمتهای مساوی را از هم جدا میکند چندک نامیده میشود. یکی از معروفترین چندکها میانه (Median) است. میانه یک شاخص مرکزی است. اگر دادهها به ترتیب از کوچکتر به بزرگتر مرتب شوند، نیمی از آنها […]
آموزش زبان R برای علوم داده: رسم نمودار
یکی از قابلیتهای برجسته زبان R این است که امکانات متنوعی را برای نمایش دادهها داراست. در این مقاله من به روشهای پایهای برای رسم نمودار اشاره میکنم که در دنیای کسبوکار بیشتر استفاده میشوند. در این مقاله صرفاً به توابع داخلی R برای نمایش داده میپردازم. خواننده باید بداند برای رسم نمودارهای پیشرفتهتر بستههایی […]
آموزش زبان R برای علوم داده: توابع
بیشتر کارهایی که در زبان R انجام میدهیم، توسط توابع صورت میگیرد. تاکنون من از توابعی که بهصورت پیشفرض در R تعریفشدهاند، استفاده کردم. ولی این امکان وجود دارد که شما توابع موردنظرتان را ایجاد کنید. نوشتن توابع آغاز راهی است که شما را از استفادهکننده صرف از R به توسعهدهنده تبدیل میکند. توابع معمولاً […]
آموزش زبان R برای علوم داده: عبارات شرطی و حلقهها
ساختارهای کنترلی (Control Structures) در زبان R به شما اجازه میدهد تا نحوه اجرای عبارات نوشتهشده را پایش کنید. بهاینترتیب با قرار دادن عبارات منطقی، بسته به اینکه ورودیها چگونه باشد، دستورات متفاوتی اجرا میشود. ساختارهای کنترلی عمده در زبان R به شرح زیر است: دستور if و else: بررسی یک شرط و عمل بر […]
نکاتی پیرامون تحلیل دادههای مالی و اقتصادی
در مدیریت کسبوکار بسیار پیش میآید که مدیران باید اطلاعات و دادههای مالی و اقتصادی را تحلیل کنند. همینطور کسانی که در سطوح کارشناسی بر روی مدلسازیهای ریاضی در حوزه علوم اقتصادی و مدیریت کار میکنند، معمولاً با دادههای مالی و اقتصادی سروکار دارند. من در این مقاله به نکات مهمی اشاره میکنم که […]
چگونه ممکن است نمودارها شما را فریب دهند؟
نمایش گرافیکی دادهها در قالب نمودار یکی از ابزارهای مؤثر برای فهم اطلاعات و رسیدن به شهود برای تصمیمگیری در فضای کسبوکار است. مدیران با نگاه کردن به نمودارها میتوانند بهسرعت فهم خوبی از دادهها به دست آورند و آن را مبنای تصمیمگیری خود قرار دهند. ازاینرو نمودارها بسیار موردعلاقه مدیران هستند. ولی نمودارها […]
آموزش زبان R برای علوم داده: خواندن و نوشتن دادهها
در این مقاله من عمدتاً به روشهای مختلف برای خواندن و نوشتن دادهها در زبان R میپردازم. علاوه بر این در مورد نحوه شناسایی مقادیر گمشده (Missing Values) و همچنین نصب بسته (Package) از کتابخانه R بحث میکنم. رویکرد من در آموزش زبان برنامهنویسی R بیشتر مبتنی بر استفاده از مثال است تا خواننده با […]
چگونه رابطه علّی را تشخیص دهیم؟
در تصمیمگیریهای کسبوکار بسیار اهمیت دارد که مدیران بتوانند رابطه علّی را درست تشخیص دهند. میتوان گفت در بیشتر موارد مدیریت یعنی ایجاد تغییر در چیزهایی که تحت کنترل است بهمنظور آنکه روی چیزهای دیگری که تحت کنترل نیست، اثر گذاشت تا به نتیجه دلخواه رسید. برای مثال یک مدیر بودجه تبلیغات سازمان خود […]
پارادوکس سیمپسون: وقتی واقعیتها، همه واقعیت نیستند
بر اساس اطلاعاتی که اخیراً مرکز آمار ایران منتشر کرده نرخ بیکاری جوانان (طبق تعریف ۱۵ تا ۲۴ ساله) در سال ۱۳۹۶ برای جمعیت شهری ۳۱٫۹ درصد و برای جمعیت روستایی ۲۰٫۷ درصد بوده است. این در حالی است که نرخ بیکاری جوانان در سال ۱۳۸۱ برای جمعیت شهری ۳۳٫۷ درصد و برای جمعیت […]
آموزش زبان R برای علوم داده: مباحث مقدماتی
در این مقاله به موضوعات مقدماتی شامل نحوه تخصیص یک متغیر، کار با بردارها، ماتریسها و قالبهای داده و همچنین توابع پایهای و پرکاربرد ریاضی و آماری میپردازم. رویکرد من در آموزش زبان برنامهنویسی R بیشتر مبتنی بر استفاده از مثال است تا خواننده با اجرای کدها بتواند این زبان را یاد بگیرد. اگر R […]
آشنایی با زبان R
R (به فارسی “آر” تلفظ میشود) یک زبان برنامهنویسی و محیط نرمافزاری رایگان است که برای محاسبات آماری و نمایش گرافیکی دادهها استفاده میشود. کسانی که در حوزه دادهکاوی (Data Mining)، ماشینهای یادگیرنده (Machine Learning) و روشهای تحلیلی کسبوکار (Business Analytics) فعال هستند از این نرمافزار برای تحلیل داده بهره میبرند. هرچه میگذارد، R بیشتر به […]
معنیداری آماری به زبان ساده
معنیداری آماری (Statistical Significance) یکی از مفاهیم مهمی است که در تحلیلهای آماری استفاده میشود. با گسترش تصمیمگیری دادهمحور در عرصههای مختلف، امروزه چه محققان و چه مدیران بیشتر و بیشتر از مفهوم معنیداری آماری در تصمیمگیری استفاده میکنند. برای مثال شرکت دارویی که میخواهد بر مبنای نتایج آزمایش کنترلشده تصادفی (Randomized Controlled Experiment) […]
رگرسیون خطی به زبان ساده برای مدیران
یکی از مهمترین روشهای تحلیل داده در کسبوکار، رگرسیون خطی (Linear Regression) است. رگرسیون خطی، یکی از مهمترین الگوریتمهای یادگیری ماشین هم هست. اگرچه در بیشتر موارد مدیران خود چنین تحلیلهایی را انجام نمیدهند، برای تصمیمگیری بر مبنای خروجیهای تحلیل رگرسیون نیاز است تا با مفاهیم آن آشنا باشند. من در این مقاله به معرفی […]
شاخصهای پراکندگی در آمار
اگرچه میانگین و سایر شاخصهای مرکزی کمک میکنند تا مرکز دادهها را در جامعه یا نمونه آماری تشخیص دهیم، تنها اکتفا کردن به این شاخصها میتواند تصویر نادرستی از مسئله پیش روی ما بگذارد. در بسیاری موارد فهمیدن اینکه دادهها چگونه حول میانگین پراکنده شدهاند اهمیت پیدا میکند. اگر میخواهید بدانید در چه زمانی […]
شاخصهای مرکزی در آمار
در این مقاله توضیح میدهم که اگر بخواهیم دادههای موجود در جامعه آماری و یا نمونه را تنها با یک عدد نشان دهیم از چه شاخصهایی میتوانیم استفاده کنیم. هدف استفاده از چنین شاخصهایی این است که اطلاعاتی را که در مجموعه دادهها وجود دارد در یک مقدار عددی خلاصه کند. شاخصهایی مانند میانگین (Mean)، […]
مراحل اجرای یک پروژه دادهکاوی چیست؟
ممکن است برخی دادهکاوی (Data Mining) را مجموعهای از نرمافزارهای خودکار یا روشهای ریاضی و آماری بدانند. درواقع دادهکاوی یک فرآیند و متدولوژی است که به مدیران کمک میکند تا از دادههای خام به اطلاعات ارزشمندی برسند که به بهبود تصمیمگیریهای آنان منجر شود. یکی از متداولترین فرآیندها برای انجام پروژههای دادهکاوی، CRISP-DM (Cross-Industry […]
چگونه مانند یک دانشمند داده فکر کنید؟ راهنمایی برای مدیران اجرایی
امروزه بسیار توصیه میشود تا مدیران از داده برای تصمیمگیریهای حوزههای کسبوکار استفاده کنند. اما ممکن است مدیران در کار با داده، استنتاج و تحلیل بر اساس آن و درنهایت شکلگیری تصمیم خود راحت نباشند. خبر خوب این است که لزومی ندارد شما یک متخصص و یا دانشمند داده باشید تا بتوانید تصمیمات دادهمحور […]
ضریب همبستگی چیست و چه کاربردی دارد؟
در دنیای کسبوکار پیش میآید که تصمیمگیر به رابطه بین دو متغیر علاقهمند است. در آمار، از کوواریانس (Covariance) و همبستگی (Correlation) برای کمّی کردن رابطه بین متغیرها بهره میبرند. در این مقاله به تعاریف ریاضی این مفاهیم میپردازم. علاوه بر این با یک مثال در حوزه مدیریت کیفیت و اجرای آن در زبان […]