
آمار هنر و دانش بررسی ایدهها، استنتاج کردن و پاسخ دادن به پرسشها مبتنی بر داده است. امروزه هرچه که جلوتر میرویم دادههای بیشتری در اختیار عموم مردم درباره ابعاد مختلف زندگی مانند اقتصاد، کسبوکار، سیاست، سلامت و … قرار میگیرد. اینکه افراد بتوانند با یک رویکرد نقادانه این دادهها را ارزیابی کنند و برای مسئلهای که پیش رویشان است بر مبنای داده استدلال و تحلیل کنند، اهمیت دوچندان یافته است.
به همین خاطر است که توانایی کار با داده و استدلال کردن بر مبنای آن، که اصطلاحاً توانایی تفکر تحلیلی (Analytical Thinking) نامیده میشود در بیشتر گزارشهای اخیر بازار کار جزء مهارتهای مهم ارزیابی شده است. برای نمونه شکل-۱، بخشی از گزارش چشمانداز بازار کار مجمع اقتصاد جهانی (World Economic Forum) است که در آن مهارتهای مهم موردنیاز بازار کار در سال ۲۰۲۵ به ترتیب اولویت آمده است.

برای من که بیشتر در حوزه کسبوکار از رویکردهای دادهمحور استفاده میکنم، اهمیت آمار در کمک به تصمیمگیری است. شاید بتوان گفت مهمترین وجه تمایز مدیران با کارمندان در تصمیمگیری است. هرچه سطح یک مدیر در سلسلهمراتب سازمانی بالاتر باشد با تصمیمات پیچیده و دشوارتری مواجه است. اما مدیران برای ایفا کردن این نقش خود از چه روشهایی استفاده میکنند؟ آیا روشهای آنها از دقت کافی برخوردار است؟ آیا آنها میتوانند در فضای پیچیده کنونی کسبوکار تصمیمات مؤثری بگیرند؟
رویکردهای مختلفی به تصمیمگیری وجود دارد. یکی از این روشها اتکا به سنت گذشته است. این روش معمولاً با این جمله همراه است که “ما درگذشته هم در برخورد با چنین مسئلهای همین کار را میکردیم.”
رویکرد دیگر بر مبنای شهود است. این رویکرد بیشتر از احساسات و تا حدی از تجربیات گذشته ناشی میشود. اغلب فرد از بیان دلایل صریح و مشخص برای تصمیم خود عاجز است و با جملاتی مانند “حس من میگوید باید این انتخاب را کنم” همراه است.
رویکرد دیگر بهرهگیری از قوانین سرانگشتی است. مبتنی بر تجربیات گذشتهاش، فرد به قوانین سادهای رسیده که مبنای تصمیم اوست. برای مثال صاحب یک رستوران بر اساس تجربه گذشته خود میداند که در روزهای تعطیل تعداد مشتریان او افزایش مییابد و برای پاسخگویی به حجم تقاضا باید تعداد خدمتکاران و آشپزها را دو برابر کند.
اینها روشهایی هستند که در مواردی که ما با تصمیمات نسبتاً سادهای مواجه هستیم، اتفاقاً خیلی خوب کار میکنند. اما خیلی از تصمیمات در حوزه کسبوکار پیچیده هستند و چنین رویکردهایی در تصمیمگیری با خطاهای جدی همراه هستند. در حوزه روانشناسی تصمیم و اقتصاد رفتاری (Behavioral Economics) مطالعات زیادی نیز صورت گرفته که خطاهای انسان در تصمیمات و قضاوتهایش را در روشهای شهودی بهخوبی مستند کرده است. نمونههایی از این یافتهها را قبلاً در آنالیکا در مقالات “نقاط کور و تصاویر خودساخته ذهن” و “سوگیریهای رفتاری در تصمیمگیری” و “نردبان استنتاج: چرا ما بهسرعت نتیجهگیری میکنیم؟” منعکس کردهام.
آمار، تصمیمگیری و عدم قطعیت
به این موارد توجه کنید:
یک شرکت دارویی میخواهد بر مبنای نتایج آزمایشگاهی، تصمیم بگیرد داروی جدیدی که روی آن تحقیق کرده، بر روی بیماران مؤثر است یا خیر.
تیم بازاریابی یک شرکت، دو تبلیغ طراحی کرده است. برخی در شرکت اعتقاد دارند تبلیغ اول در جذب مشتریان و افزایش فروش مؤثرتر است و برخی دیگر اعتقاد دارند تبلیغ دوم موفقیت بیشتری به ارمغان خواهد آورد.
یک پزشک تغذیه، رژیم غذایی جدیدی را پیش نهاد میدهد و ادعا میکند این رژیم جدید موجب میشود شما زندگی سالمتری داشته باشید. چگونه درباره ادعای او تصمیم بگیریم؟
یک شرکت تولید مواد غذایی کنسروی به دنبال بستن قرارداد جدید با یک تأمینکننده قوطیهای کنسروی است. این تأمینکننده ادعا میکند تنها ۱ درصد قوطیهای تولیدی دارای نقص هستند. چگونه ادعای او را ارزیابی کنیم؟
یک گروه محیطزیستی ادعا میکند افزایش آلودگی دریاچه موجب کاهش آبزیان دریاچه شده است و باید کارخانه مجاور آن سیاستهای جدیتری در پالایش آب خروجی از کارخانه اتخاذ کند. چطور بفهمیم ادعای مذکور مبنی بر کاهش جمعیت آبزیان دریاچه صحیح است؟
مشاور مالی شما ادعا میکند حتماً سهام شرکت الف را بخرید چراکه در دو سال گذشته عملکرد بهتری نسبت به متوسط عملکرد شرکتهای حاضر در بازار اوراق بهادار داشته است.
در همه این مثالها دو مسئله پررنگ است. اول، شما در معرض تصمیمگیری هستید و نتایج انتخاب هر تصمیم میتواند عواقب جدی برای تصمیمگیر و ذینفعان مسئله داشته باشد. دوم، بحث ریسک و عدم قطعیت در تصمیمگیری است. در همه موارد بالا فضای تصمیمگیری دارای ابهام است. عدم قطعیت جزء ذات بسیاری از مسائل دنیای واقعی است. در مقاله “عدم قطعیت در تصمیمگیری واقعاً چه معنا میدهد؟” مفصل دراینباره صحبت کردم.
از دید من یکی از بحثهای محوری در آمار، کمّی کردن عدم قطعیت است. برای نمونه، در بحث تبلیغات، تحلیل آماری میتواند به شما بگوید نرخ تبدیل انتظاری یک تبلیغ ۴ درصد و با احتمال ۹۵ درصد، بین ۳ تا ۵ درصد است (نرخ تبدیل در این مثال میتواند نسبت خرید محصول به تعداد بازدید از آن تبلیغ تعریف شود). پس شما میتوانید انتظار داشته باشید نرخ تبدیل در بدترین حالت ۳ درصد و در بهترین حالت ۵ درصد باشد. این به تصمیمگیر، امکان سناریو پردازی در مسائل دنیای واقعی میدهد. بهاینترتیب شما میتوانید برای بهترین، محتملترین و بدترین حالت برنامهریزی کنید.
آمار چگونه به مسائل نگاه میکند؟
فرآیند تحلیل آماری در شکل-۲ آمده است.

پرسش تحقیق
تحلیل آماری همیشه با یک پرسش شروع میشود. شما ممکن است درباره یک پدیده پرسشهایی داشته باشید. برای مثال، آیا یک تبلیغ، بهاندازه کافی جذاب است تا مشتریان بالقوه را ترغیب به خرید از محصولات شرکت کند؟
این بسیار اهمیت دارد که شما نگاه پرسشگرانه داشته باشید. یک تفاوت مهم بین تفکر تحلیلی و رویکردهای شهودی این است که ما در رویکردهای شهودی با استفاده از میانبرها سریع به پاسخ میرسیم و بلافاصله به دنبال شواهدی میگردیم که آن پاسخ را تائید کند. درحالیکه جواب اولیه ممکن است کاملاً غلط باشد.
در این بخش، ممکن است آنقدر فضای تصمیم، مبهم باشد که پرسشهای واضحی درباره مسئله وجود نداشته باشد. اینجا مهم است تحلیلگر با جستجو در شواهد و دادههای اولیه به پرسشهایی درباره مسئله برسد. برای مثال بر مبنای مشاهدات و بررسی نتایج کمپینهای قبلی، شما به این یافته میرسید که تبلیغات مختلف شرکت، نتایج یکسانی نداشته و در ذهن شما بهتدریج این پرسش شکل میگیرد چه عواملی باعث میشود که یک تبلیغ برای مشتری جذاب شود.
ساخت تئوری (Theory)
بر اساس مشاهداتی که کردید متوجه شدید که به نظر میرسد ارائه تخفیف در یک تبلیغ روی موفقیتآمیز بودن آن مؤثر است. این رابطه علت و معلولی که شما برای موفقیتآمیز بودن تبلیغات در ذهن خودتان ساختید، یک تئوری است. یک تئوری دیگر ممکن است این باشد تأکید بر روی کیفیت محصول در یک تبلیغ روی موفقیتآمیز بودن آن مؤثر است.
ساخت فرضیه (Hypothesis)
پیشبینی که به دنبال هر تئوری میآید، فرضیه نام دارد. برای مثال شما پیشبینی میکنید اگر در یک تبلیغ تخفیف ارائه شود، موفقیت آن بیشتر میگردد. باید توجه کنید فرضیه گزارهای است که قابلنقض شدن (Falsifiable) است. یعنی این امکان وجود دارد با بررسی مجموعه شواهد آن را رد کنید. اگر تعداد زیادی تبلیغ آزمایش شود که حاوی تخفیف هستند و عملکرد آنها در جذب مشتری مشابه تبلیغاتی که فاقد تخفیف هستند باشد، فرضیه شما رد میشود.
اگر گزاره شما اینطور باشد که وجود برخی تخفیفهای خاص، در برخی تبلیغات روی بعضی از مشتریان در برخی مواقع اثرات مثبت میگذارد، گزارهای بیان کردید که قابلنقض شدن نیست. چون هر شواهدی آورده شود ممکن است در دایره آن برخی تخفیفها، برخی تبلیغات، برخی مشتریان و برخی مواقع نگنجد. عملاً هیچوقت نمیتوان مثالی پیدا کرد که این گزاره نقض شود.
در رویکردهای دادهمحور، بسیار مهم است هرچه جلوتر میروید به تعریف روشنتری از مسئله برسید و از جملات مبهم در بیان مسئله کمتر استفاده کنید. یکی از تفاوتهای مهم رویکردهای شهودی و دادهمحور در همین ضرورت است. در رویکردهای شهودی بیان مسئله و حتی پاسخی که برای آن داریم، به شکل مبهم در ذهنمان جای گرفته است.
در همین راستا، ساخت فرضیه نیازمند تعریف متغیرها است. متغیر چیزی است که باید آن را اندازهگیری کنید. در مثال خودمان، شما چطور میخواهید میزان موفقیت یک تبلیغ را اندازهگیری کنید؟ در این مورد میتوان از نرخ تبدیل (Conversion Rate) استفاده کرد. حضور یا عدم حضور تخفیف در تبلیغ یک متغیر دیگر است. در اینجا نرخ تبدیل یک متغیر وابسته است و میخواهید اثر حضور یا عدم حضور تخفیف را روی آن بسنجید. متغیر حضور یا عدم حضور تخفیف یک متغیر مستقل (Independent Variable) است که میخواهد نرخ تبدیل را پیشبینی کند.
اندازهگیری مسئله بسیار مهمی در رویکردهای دادهمحور است. جمله معروفی در مدیریت وجود دارد که میگوید تنها چیزهایی را که میتوانید اندازهگیری کنید، قابل مدیریت هستند. گرچه این جمله جذابی است ولی پیادهسازی آن در عمل میتواند بسیار چالشبرانگیز باشد. به دنیای کسبوکار نگاه کنید، پر است از مفاهیمی که به نظر غیرقابلاندازهگیری میآیند:
پیشبینی درآمد یک محصول جدید،
انعطافپذیری یک تیم کاری،
ارزش اطلاعات،
ریسک ورشکستگی،
وجهه عمومی یک برند،
کارایی یک مدیر،
ریسک شکست یک پروژه فنّاوری اطلاعات،
هزینه ناشی از ترک خدمت نیروی انسانی
در هر شکل من به این جمله باور دارم که اگر نتوانید شاخصها را در یک پدیده اندازهگیری کنید، نمیتوانید ادعا کنید در حال مدیریت آن پدیده هستید. در طول سالیان گذشته، تلاشهای چشمگیری در علم مدیریت شده است تا مفاهیم مختلف قابلاندازهگیری شوند. برای نمونه اگر کنجکاو هستید بدانید چطور در یک شرکت میتوان هزینه ناشی از ترک خدمت نیروی انسانی را محاسبه کرد، این مقاله من را مطالعه کنید.
جمعآوری داده و آزمون تئوری
در این مرحله نوبت به فرآیند جمعآوری داده است. معمولاً در این قسمت شما باید یک تحقیق طراحی کنید تا دادههای مرتبط با مسئله را جمعآوری کنید. تحقیق میتواند حالتهای مختلف داشته باشد. حالت ایدئال آن تحقیق تجربی (Experimental Research) است. هدف اصلی تحقیق تجربی، برقراری رابطه علت و معلولی است.
در تحقیق تجربی متغیر مستقل را دستکاری میکنیم تا اثر آن را روی متغیر وابسته ارزیابی کنیم. برای مثال خودمان، شما به دنبال این هستید تا اثر حضور یا عدم حضور تخفیف در تبلیغات را روی نرخ تبدیل آنها سنجش کنید. پس در یک گروه ۱۰ تبلیغ مختلف را که حاوی تخفیف هستند طراحی میکنید. سپس برخی از مشتریان بالقوه را بهصورت کاملاً تصادفی انتخاب میکنید و آنها را در معرض تبلیغات قرار میدهید و نرخ تبدیل این گروه را سنجش میکنید. در گروه دیگر ۱۰ تبلیغ را که حاوی تخفیف نیستند در معرض مشتریان بالقوه که بهصورت کاملاً تصادفی انتخاب شدهاند قرار میدهید و نرخ تبدیل را برای این گروه هم میسنجید. سپس نتایج بین دو گروه را باهم مقایسه میکنید. اگر واقعاً حضور یا عدم حضور تخفیف در تبلیغات بر روی نرخ تبدیل اثرگذار باشد، باید تفاوت معنیداری بین نرخ تبدیل این دو گروه وجود داشته باشد.
برای آشنایی بیشتر با تحقیق تجربی، توصیه میکنم مقاله “آزمایش کنترلشده تصادفی چیست و چه کاربردهایی دارد؟” را مطالعه کنید.
در مطالعات تجربی شما کنترل کامل روی سایر متغیرهایی که ممکن است در مطالعه اثر بگذارند، دارید و میتوانید تنها اثر متغیر مستقل را روی متغیر وابسته سنجش کنید. برای مثال ممکن است جنسیت و سن مشتریان، نوع رنگ بکار رفته در تبلیغ، اندازه حروف، کانالی که تبلیغات در آن پخش میشود (وب/شبکه اجتماعی) و … هم روی نتیجه اثرگذار باشد. متغیر کنترل، متغیری است که گرچه در فرضیه شما وجود ندارد ولی ممکن است بر روی پدیده مورد بحث اثرگذار باشد.
ما تنها در حالتی میتوانیم نتایج را بهخوبی باهم مقایسه کنیم، که تبلیغات از منظرهای اثرگذار دیگر، شبیه هم باشند و تنها از منظر متغیر وابسته (در اینجا حضور یا عدم حضور تخفیف) باهم متفاوت باشند. برای مثال، نمونهای از اجرای کنترل این است، که مشتریان بالقوه را بر اساس جنسیت جدا کرده و روی گروه مردان و گروه زنان جداگانه آزمایش را انجام دهید. بهاینترتیب چهار گروه وجود خواهند داشت: گروه مردان که تبلیغاتی که به آنان عرضه میشود حاوی تخفیف هستند، گروه مردان که تبلیغاتی که به آنان عرضه میشود حاوی تخفیف نیستند، گروه زنان که تبلیغاتی که به آنان عرضه میشود حاوی تخفیف هستند و گروه زنان که تبلیغاتی که به آنان عرضه میشود حاوی تخفیف نیستند. در این صورت اگر واقعاً جنسیت در این پدیده نقش داشته باشد، قابلمشاهده است.
در رشتههایی مثل فیزیک، شیمی و یا علوم مهندسی انجام تحقیقات تجربی سادهتر از انجام آن در علوم انسانی مانند مدیریت، روانشناسی و علوم اجتماعی است. چراکه یکی از چالشهای اصلی ما در علوم انسانی، کنترل سایر متغیرهای حاکم بر مسئله است. در علوم فنی و مهندسی خیلی راحتتر میتوان سایر متغیرهای اثرگذار را در شرایط آزمایشگاهی کنترل کرد.
به همین خاطر در علوم انسانی مطالعات غیرتجربی (Non-Experimental Research) هم متداول است. در این نوع مطالعات گرچه داده جمعآوری میشود ولی دستکاری متغیر مستقل امکانپذیر نیست و کنترل سایر متغیرها هم دشوارتر است. حتی ممکن است نمونهگیری تصادفی هم صورت نگیرد. نظرسنجیها نمونهای از مطالعات غیرتجربی هستند. برای مثال در تحقیقات بازار، از نظرسنجی برای درک دیدگاه مشتریان نسبت به موضوعات موردعلاقه تحقیق استفاده میگردد.
تحلیل داده (Data Analysis)
خروجی تحقیق، دادههای خام است. این دادهها برای پاسخ به سؤال تحقیق باید تحلیل و بررسی شوند. معمولاً در مراحل اولیه، رویکردهای توصیفی برای درک بهتر دادهها استفاده میشوند. این بخش از آمار، آمار توصیفی (Descriptive Statistics) نامیده میشود. در آمار توصیفی به دنبال خلاصه کردن داده در قالب شاخصهای مرکزی مانند میانگین و میانه، شاخصهای پراکندگی مانند واریانس و چارک، و شاخصهای شکل مانند چولگی و کشیدگی هستیم. همچنین رسم نمودارهایی مانند هیستوگرام، نمودار میلهای و … کمک میکند تا توزیع دادهها را بهتر درک کنیم.
شاخه دیگر آمار، آمار استنباطی (Inferential Statistics) است. در آمار استنباطی به دنبال آن هستیم تا از نمونه جمعآوریشده به درک یا استنباطی از رابطه موجود در جامعه برسیم. در بسیاری از مطالعات ما دسترسی به جامعه تحقیق نداریم. در مثال خودمان، شما به دنبال ارزیابی رابطه بین حضور یا عدم حضور تخفیف در تبلیغات و اثربخشی آن هستید. طبیعی است که نمیتوانید تمامی تبلیغات ممکن را بر روی تمامی مشتریان در همه زمانها بررسی کنید. بنابراین ناچار به نمونهگیری هستید. تئوری نمونهگیری آماری (Statistical Sampling Theory) توضیح میدهد اگر نمونه جمعآوریشده دارای ویژگیهای مطلوب که در آمار بحث میشود باشد ، میتوان آنچه را در نمونه میبینید، به جامعه تعمیم دهید.
برای مثال به این فکر کنید که اگر شما تحقیقتان را در شرایطی انجام داده باشید که رکود اقتصادی بر جامعه حاکم است (و احتمالاً مشتریان تخفیف برایشان جذابتر است)، میتوانید نتایج تحقیقتان را به زمانی تعمیم دهید که اقتصاد در دوران شکوفایی است؟
بحث درباره تعمیمپذیری (Generalizability) از نمونه به جامعه یکی از بحثهای کلیدی در آمار است. من در مقالات “سوگیری خودانتخابی چیست؟” و “چگونه بازماندگان شما را فریب میدهند؟” به مثالهایی پرداختم که عدم توجه به ویژگیهای نمونهگیری مطلوب، تعمیمپذیری آنچه در نمونه دیده شده به جامعه تحقیق را مخدوش کرده است.
آزمون فرضیه (Hypothesis Testing)
بسیاری از تحلیلهای آماری در آمار استنباطی در قالب آزمون فرضیه فرمولبندی میشود. در آزمون فرض یک فرضیه صفر (Null Hypothesis – H0) وجود دارد. در آزمون فرضیه، فرض H0 معمولاً از این جنس است: “تفاوتی ندارد”، “ارتباطی وجود ندارد”، “مداخله مؤثر نبوده” و مانند اینها. به همین خاطر فرض H0 همیشه شامل مساوی است. فرضیه رقیب (Alternative Hypothesis – H1) گزارهای است که اگر بتوانیم H0 را رد کنیم، آن را میپذیریم.
در مثال خودمان فرضیه صفر به شکل زیر نوشته میشود:
فرضیه صفر: نرخ تبدیل برای تبلیغات حاوی تخفیف = نرخ تبدیل برای تبلیغات بدون تخفیف
فرضیه رقیب: نرخ تبدیل برای تبلیغات حاوی تخفیف > نرخ تبدیل برای تبلیغات بدون تخفیف
همیشه فرض میشود که H0 درست است مگر آنکه شواهدی بر مبنای دادهها به دست آید که آن را نقض کند یعنی مشخص شود تفاوتها به خاطر تصادف نیست بلکه متغیر مستقل، اثر معنیداری گذاشته است. در مثال خودمان، اگر در واقعیت نرخ تبدیل هیچ ربطی به وجود یا عدم وجود تخفیف در تبلیغ نداشته باشد، انتظار داریم نرخ تبدیل دو گروه (گروه تبلیغات حاوی تخفیف و گروه تبلیغات بدون تخفیف) کمابیش نزدیک به هم باشد. بههرحال چون نمونهها تصادفی بهدستآمدهاند، انتظار نداریم این دو عدد دقیقاً یکسان باشند. اما اگر واقعاً متغیر مستقل بر روی متغیر وابسته تأثیری بگذارد، باید نرخ تبدیل دو گروه باهم تفاوت معنیداری کند. اگر با مفهوم معنیداری آماری آشنا نیستید، توصیه میکنم این مقاله من را مطالعه کنید.
توجه کنید آزمون فرضیه مبتنی بر رد کردن ایده است و نه اثبات ایدهای. چون با یک نمونه محدود شما نمیتوانید چیزی را اثبات کنید ولی اگر در آن نمونه شواهدی وجود داشته باشد که فرض H0 غلط است آنگاه میتوان آن را رد کرد. بنابراین فرض H0 را یا رد میکنیم یا قادر به رد کردن آن نیستیم پس تا نبود شواهد جدید با H0 میمانیم گرچه این به معنی درست بودن H0 نیست.
جمعبندی
نکته پایانی آنکه برخی از افراد در یادگیری مفاهیم آماری، بیشتر تمرکزشان روی یادگیری انواع روشهای آماری و فرمولهای ریاضی است. گرچه این جنبه مهم است، از دیدگاه من، اهمیت آمار در روشمندی آن برای حل مسئله است. چنین روش حل مسئلهای بوده است که در طول ۱۰۰ سال اخیر، تحول شگرفی در پیشرفت علم و فناوری ایجاد کرده است.
قدرت علم به درست بودن آن نیست، بلکه برعکس قدرتش به ابطالپذیری آن است. اینکه شما میتوانید صرفنظر از آنکه چه کسی چه ادعایی مطرح میکند، آن را بر اساس شواهد دادهمحور، رد کنید. و تا وقتی آن ادعا رد نشود، آن را بپذیرید. چرخه روشهای آماری با یک تحقیق به پایان نمیرسد بلکه دائماً تکرار میشود و با هر تکرار ما به درک جدیدی از مسئله میرسیم ضمن آنکه پرسشهای جدیدی هم مطرح میشود.
حفظ روحیه پرسشگری، نپذیرفتن سریع پاسخها، استدلال مبتنی بر شواهد و تکرار چرخه سعی و خطا برای درک پدیدهها در مرکز رویکرد آماری قرار دارد. من در مقاله “چگونه مانند یک دانشمند داده فکر کنید؟” در قالب یک مثال ساده از زندگی روزمره نشان دادم، چطور میتوانید رویکرد آماری را برای حل یک مسئله بکار ببرید.
منابع:
Field, A., Miles, J., & Field, Z. (2012). “Discovering Statistics Using R”. SAGE Publications Ltd
World Economic Forum (2020), “The Future of Jobs Report”, http://www3.weforum.org/docs/WEF_Future_of_Jobs_2020.pdf
مطلب بسیار مفیدی بود. ممنون از زحماتتون
سلام. بسیار عالی و مفید بود. ممنونم.
نکته مثبت مختصر و مفید بودن بود ، ممنون
بسیار عالی