آزمایش کنترل‌شده تصادفی چیست و چه کاربردهایی دارد؟

برای آنکه مدیران بتوانند تصمیمات هوشمندانه‌تری بگیرند نیاز دارند تا داده داشته باشند. روش‌های مختلفی برای جمع‌آوری داده وجود دارد. یکی از این روش‌ها آزمایش کردن است. انواع مختلفی از آزمایش‌ها وجود دارد که مدیران می‌توانند انجام دهند. از آزمایش‌های غیررسمی گرفته تا آزمایش‌های میدانی، مطالعات موردی و آزمایش در لابراتوار نمونه‌هایی از آزمایش کردن هستند. در مقاله “با آزمایش کردن در کسب‌وکار، هوشمندانه ریسک کنید” مثال‌هایی را از دنیای واقعی شرح دادم.

یکی از ساختاریافته‌ترین روش‌ها، آزمایش کنترل‌شده تصادفی (Randomized Controlled Experiment) نام دارد. من در این مقاله به توضیح این روش و کاربردهای آن در حوزه مدیریت می‌پردازم.

آزمایش کنترل‌شده تصادفی چگونه توسعه یافت؟

یکی از اولین افرادی که در توسعه مفهوم آزمایش کنترل‌شده پیشگام بود، پزشک انگلیسی جیمز لیند (James Lind) بود. او مشاهده‌گر دقیقی بود و می‌توانست خود را از پیش‌فرض‌های ذهنی‌اش فاصله دهد و بر اساس منطق تحلیل و نتیجه‌گیری کند. یکی از بیماری‌هایی که لیند به مطالعه آن پرداخت بیماری اسکوربوت (Scurvy) بود. اسکوربوت بیماری است که براثر کمبود ویتامین ث ایجاد می‌شود. این بیماری می‌تواند موجب فلج شدن بیمار و یا حتی مرگ او شود.

این بیماری از دوران کهن شناخته شده بود. جان وودال در سال ۱۶۱۴ میلادی مصرف میوه‌های تازه را برای درمان این بیماری توصیه کرده بود؛ اما لیند در سال ۱۷۴۷ میلادی تصمیم گرفت آزمایشی ترتیب دهد تا این توصیه را اثبات کند. او ۱۲ بیمار را انتخاب کرد که همگی از نظر شدت بیماری در یک سطح قرار داشتند. آنان را در یک مکان بستری کرد و همه آن‌ها را تحت رژیم غذایی یکسانی قرار داد. این ۱۲ نفر به شش گروه دونفره تقسیم شدند. تنها تفاوت این شش گروه در مصرف مقدار مشخصی از یک نوع ماده غذایی بود. این مواد غذایی شامل مواردی مانند آب سیب، سرکه، پرتقال و لیمو و مانند آن بود. به یک گروه نیز هیچ‌کدام از این موارد داده نمی‌شد.

آزمایش‌های او نشان داد گروهی که به‌صورت روزانه پرتقال و لیمو مصرف می‌کرده است در پایان آزمایش سریع‌ترین بهبود را تجربه کردند. بعد از پرتقال و لیمو، آب سیب مؤثرتر از بقیه عمل کرد. به‌این‌ترتیب او به‌طور عملی نشان داد که اسکوربوت با مصرف مرکبات در رژیم غذایی درمان می‌شود.

اما این رونالد فیشر (Ronald Fisher) آماردان انگلیسی بود که در ابتدای قرن بیستم با مطالعاتی که در حوزه کشاورزی کرد، آزمایش کنترل‌شده تصادفی را به شکل یک روش علمی درآورد و آن را توسعه داد.

فرض کنید شما مدیر یک شرکت تولیدکننده محصولات کشاورزی هستید و می‌خواهید بهره‌وری تولید خود را افزایش دهید. دو ماده مغذی در بازار وجود دارد که ادعا می‌کنند می‌توانند رشد گیاهان را تسریع کنند. شما در مورد کارایی این دو محصول شک دارید؛ بنابراین تصمیم می‌گیرید یک آزمایش کنترل‌شده تصادفی طراحی کنید تا ادعای آن‌ها را بسنجید. تعدادی گیاه یکسان انتخاب می‌کنید و آن‌ها را در سه گروه تقسیم می‌کنید. در طول مدت‌زمان آزمایش، گیاهان گروه A از ماده مغذی اول و گیاهان گروه B از ماده مغذی دوم تغذیه می‌شوند. هر یک از این دو گروه، گروه آزمایشی (Experimental Group) نامیده می‌شوند. گیاهان در گروه C به‌مانند گیاهان عادی تنها با آب تغذیه می‌شوند (شکل-۱). این گروه، گروه کنترل (Control Group) نامیده می‌شود.

شکل-۱

هر سه گروه در همه‌چیز یکسان هستند به‌جز ماده مغذی که دریافت می‌کنند. متغیرهایی مانند سایز گلدان، نوع خاک، میزان نور دریافتی و یا دمای نگهداری که ممکن است روی رشد گیاه تاثیر بگذارند، در هر سه گروه یکسان نگه می‌دارید. این متغیرها، متغیرهای کنترل نامیده می‌شوند. در اینجا شما مایل هستید اثر ماده مغذی (متغیر مستقل) را بر روی رشد گیاه و سلامتی عمومی آن (متغیر وابسته) اندازه‌گیری کنید. در پایان دوره آزمایش، در صورت تائید آزمون‌های آماری می‌توان گفت گروهی که در آن میانگین رشد گیاهان بالاتر بوده، ماده مغذی کارآمدتری دریافت کرده است.

علت این‌که به این آزمایش‌ها کنترل‌شده گفته می‌شود به دو مورد برمی‌گردد. یکی اینکه با محدودیت‌هایی که در انجام آزمایش اعمال می‌شود، نمی‌گذاریم هم‌زمان با متغیر مستقل، متغیر دیگری بر روی نمونه‌ها اثر بگذارد. درواقع با ایزوله کردن سایر متغیرها ما قادر هستیم اثر خالص متغیر مستقل را اندازه‌گیری کنیم. برای مثال اگر هم‌زمان بااینکه گیاهان در هر گروه ماده مغذی متفاوتی دریافت می‌کنند، میزان نور خورشید متفاوتی هم دریافت کنند دیگر نمی‌توان مشخص کرد رشد گیاهان تحت تأثیر کدام عامل بوده است.

مورد دوم به وجود گروه کنترل برمی‌گردد. ما در این نوع آزمایش‌ها همواره مقایسه می‌کنیم. سؤال اینجاست که مقایسه نسبت به چه چیزی صورت می‌گیرد؟ مقایسه معمولاً نسبت به وضع موجود انجام می‌شود. شما در حالت فعلی گیاهان را با آب تغذیه می‌کنید. این، گروه کنترل را مشخص می‌کند. نتیجه آزمایش به شما نشان خواهد داد که آیا استفاده از مواد مغذی جدید نسبت به وضع موجود کارایی بیشتری دارد یا خیر.

اما در عمل نمی‌توان همه متغیرها را کنترل کرد. برخی از متغیرهای اثرگذار در مسئله ممکن است قابل‌شناسایی و کنترل باشند؛ اما ممکن است آزمایشگر همه متغیرهای اثرگذار بر مسئله را نتواند تشخیص دهد. اینجاست که مفهوم تصادفی بودن اهمیت پیدا می‌کند. ایده فیشر این بود که آزمایشگر باید متغیرهایی را که نسبت به آن شناخت دارد و می‌داند بر روی متغیر وابسته اثر می‌گذارند، کنترل کند. او پیشنهاد داد آزمایشگر برای از بین بردن اثر سایر متغیرهایی که ممکن است به آن آشنا نباشد از تخصیص تصادفی نمونه‌ها به گروه‌های آزمایش بهره ببرد. برای مثال ممکن است برخی از گیاهان به لحاظ ژنتیکی از بقیه بهتر باشند و این روی سرعت رشد آن‌ها اثر بگذارد. شما نمی‌توانید این عامل را کنترل کنید؛ بنابراین با توزیع کردن گیاهان به شکل تصادفی در سه گروه آزمایش سعی می‌کنید تا حد امکان اثر ژنتیک را خنثی کنید.

با روش علمی که فیشر پیشنهاد داد ما می‌توانیم مطمئن باشیم که نتایج آزمایش تنها محدود به نمونه‌های آزمایش‌شده نیستند و قابل‌تعمیم به‌کل جامعه موردبحث هستند.

تعریف آزمایش کنترل‌شده تصادفی

آزمایش کنترل‌شده تصادفی یک روش علمی است که با استفاده از آن می‌توانید اثر یک عامل یا مداخله (Intervention) را بر روی جامعه موردمطالعه بسنجید. در این روش نمونه‌ها به شکل تصادفی از جامعه آماری انتخاب و به شکل تصادفی به گروه کنترل و آزمایش تخصیص داده می‌شوند. تنها تفاوت بین گروه کنترل و آزمایش در دریافت آن عامل یا مداخله است. به‌این‌ترتیب اثر آن عامل یا مداخله بر روی متغیرهای خروجی سنجیده می‌شود.

مراحل آزمایش کنترل‌شده تصادفی

توصیه می‌شود مدیران با مراحل آزمایش کنترل‌شده تصادفی آشنا باشند و در جریان طراحی آزمایش با تحلیل‌گر مشارکت کنند. به‌این‌ترتیب مدیران می‌توانند دانش و تجربه عملی خود را از کسب‌وکار با روش علمی در هم بیامیزند و در مراحل جمع‌آوری داده و تحلیل آن مشارکت کنند. برای این منظور اهمیت دارد که مدیران مراحل انجام آزمایش کنترل‌شده تصادفی را خوب بفهمند.

این مراحل به شرح زیر است:

تصمیم بگیرید متغیرهای وابسته موردعلاقه شما کدام هستند. در مثال گفته‌شده رشد گیاه و سلامتی عمومی آن متغیرهای وابسته هستند. در این مرحله باید مشخص کنید این متغیرها را چگونه می‌خواهید سنجش کنید. برای مثال رشد گیاه را با اندازه‌گیری ارتفاع آن می‌سنجید.

مشخص کنید آزمایش را روی چه جامعه‌ای می‌خواهید انجام دهید. آیا می‌خواهید اثر مواد مغذی را روی یک گیاه خاص بسنجید یا چندین نوع گیاه موردنظر هستند؟

از خود سؤال کنید با انجام این آزمایش به دنبال چه هستید. می‌خواهید چه فرضیه‌ای را آزمایش کنید؟ فرضیه صفر (Null Hypothesis) شما کدام است؟ (فرضیه صفر فرضیه‌ای که شما سعی دارید آن را رد کنید) فرضیه مقابل آن کدام است؟ در مثال گفته‌شده یک فرضیه صفر می‌تواند این باشد که ” ماده مغذی اول هیچ اثری بر روی رشد گیاه ندارد” و فرضیه مقابل آن “ماده مغذی اول رشد گیاه را سریع‌تر می‌کند”.

به همه عواملی که ممکن است روی نتیجه آزمایش اثر بگذارد فکر کنید. مواردی مانند سایز گلدان، نوع خاک، میزان نور دریافتی و یا دمای نگهداری می‌توانند نتایج آزمایش را تحت تأثیر قرار دهند.

پروتکل انجام آزمایش را یادداشت کنید. چه مراحلی را برای انجام آزمایش باید طی کرد؟ چگونه متغیرهای دیگر را می‌خواهید کنترل کنید؟ اندازه نمونه (Sample Size) چقدر باید باشد؟ چگونه نمونه‌ها را انتخاب می‌کنید؟ چگونه فرآیند تخصیص نمونه‌ها به گروه‌ها را تصادفی می‌کنید؟ چگونه می‌خواهید داده‌های آزمایش را جمع‌آوری کنید؟

قبل از آنکه آزمایش را به‌طور کامل انجام دهید، بهتر است روی یک گروه کوچک‌تر مراحل آزمایش را جلو ببرید و مطمئن شوید همه‌چیز آن‌طور که برنامه‌ریزی کردید انجام می‌شود (Pilot Test).

بر اساس بازخوردهایی که از انجام آزمایش در مقیاس کوچک‌تر دریافت کردید، پروتکل انجام آن را اصلاح کنید.

آزمایش را به‌طور دقیق مطابق پروتکل طراحی‌شده اجرا کنید.

نتایج را بر اساس روش‌های آماری تحلیل و نتایج را گزارش کنید.

چه اشتباهاتی ممکن است در آزمایش کنترل‌شده تصادفی انجام دهید؟

مهم‌ترین نکته‌ای که مدیران باید بدانند این است که در دنیای واقعی تنها با یک آزمایش نمی‌توان به نتیجه رسید. در عمل باید آزمایش‌های مختلفی انجام داد. پیش‌فرض‌های ذهنی مختلف را سنجید. حتی مدیرانی که با این روش آشنا هستند و علاقه دارند از آن استفاده کنند، ممکن است پاسخ بعضی از سؤالات را دانسته تصور کنند. من در مقاله “با آزمایش کردن در کسب‌وکار، هوشمندانه ریسک کنید” به چند مثال پرداخته‌ام که چطور نتایج آزمایش‌ها، افراد را غافلگیر کرده است.

اشتباه دیگر این است که مدیران بخواهند آزمایش را سریع‌تر انجام دهند و مراحل ذکرشده در بالا را به‌درستی اجرا نکنند. برای مثال بر اساس تجربه شخصی می‌دانم بسیاری روی مرحله انتخاب نمونه تصادفی مناسب وقت کافی نمی‌گذارند و ترجیح می‌دهند روی نمونه‌هایی که به‌راحتی در دسترس هستند آزمایش کنند. فرض کنید جامعه آماری مورد مطالعه مشتریان سازمان هستند. در این حالت ممکن است به علت سهولت کار، تنها به نمونه‌گیری از مشتریان جوان‌تر که ممکن است وقت کافی برای شرکت در آزمایش دارند و به حضور در این‌گونه تجربه‌ها علاقه‌مندتر هستند، اکتفا کنیم. در این صورت نمونه ما نسبت به افراد با سن پایین‌تر سوگیری پیدا می‌کند و نتایج قابل‌اتکا نیست.

نکته دیگر در همین راستا عدم تلاش کافی در کنترل کردن متغیرهایی است که ممکن است بر روی نتایج اثر بگذارند. انجام درست این نوع آزمایش‌ها نیازمند آن است که افرادی که به طراحی آزمایش‌های تجربی مسلط هستند در تیم شما حضور داشته باشند. اگر شما نتوانید متغیرهای اثرگذار دیگر را ایزوله کنید ممکن است نتایج را به دلایلی ربط دهید که نادرست باشند. همچنین تحلیل‌گر داده نیز باید در هنگام طراحی آزمایش در تیم حضور داشته باشد و همفکری کند. تحلیل داده فرآیندی نیست که بعد از انجام آزمایش شروع شود. از همان ابتدا باید در مورد آن فکر کنید و برنامه داشته باشید.

کاربردهای آزمایش کنترل‌شده تصادفی در مدیریت کسب‌وکار

امروزه کسب‌وکارهای آنلاین پیشرو در دنیا به‌طور پیوسته از آزمایش تصادفی برای بهبود وب‌سایت خود و افزایش فروش استفاده می‌کنند. آنان هزاران آزمایش انجام می‌دهند تا جزئیات مختلف وب‌سایت خود را بازطراحی کنند. برای مثال شکل-۲ یک تبلیغ ترویجی آنلاین را نشان می‌دهد که در آن دو تبلیغ تنها در یک کلمه باهم تفاوت دارند. در یکی از آن‌ها اشاره شده است شما می‌توانید برای یک دوره آزمایشی ۷ روزه خدمات شرکت را رایگان تجربه کنید. در دیگری دوره آزمایشی، برای ۳۰ روز تعیین شده است. بااینکه ممکن است عجیب به نظر برسد ولی همین تفاوت کوچک تفاوت زیادی در رفتار مشتریان بالقوه ایجاد می‌کند.

شکل-۲

کسب‌وکارهای آنلاین با توجه به آنکه هرروزه مخاطبان زیادی به آن‌ها مراجعه می‌کنند، می‌توانند با هزینه‌های بسیار پایینی آزمایش انجام دهند. این نوع از آزمایش‌ها که به آزمون A/B یا معادل انگلیسی آن A/B Testing معروف شده، شکل ساده‌تری از آزمایش کنترل‌شده تصادفی است که برای مقایسه عملکرد دو حالت بکار می‌روند. این آزمایش‌ها ممکن است از ایدئال گفته‌شده در این مقاله فاصله داشته باشند ولی در حوزه‌های متعددی ازجمله طراحی صفحات وب‌سایت، تبلیغات بنری، بازاریابی ایمیلی (Email Marketing) و قیمت‌گذاری بکار می‌روند.

در مقاله “آشنایی با آزمون A/B: آنچه مدیران باید بدانند” به این روش و کاربردهای آن اشاره کردم.

در حوزه مدیریت بازاریابی سال‌هاست که از آزمایش میدانی (Field Experiment) برای بررسی اثرات استراتژی‌های مختلف بازاریابی مانند قیمت‌گذاری، بسته‌بندی محصولات، طراحی محصول و تبلیغات بر روی نحوه رفتار مصرف‌کننده بهره می‌گیرند. چون در بسیاری از موارد نمی‌توان این آزمایش‌ها را در محیط آزمایشگاهی که کاملاً کنترل شده است، انجام داد از آزمایش‌های میدانی استفاده می‌کنند.

برای مثال در یک آزمایش که در بین ۸۶ شعبه یک خرده‌فروشی زنجیره‌ای در آمریکا صورت گرفت، مشخص شد وقتی به افراد کوپن تخفیف داده می‌شود، فروش ۳۵ درصد بیشتر از حالتی است که همان مقدار تخفیف روی برچسب قیمت کالا در قفسه فروشگاه داده می‌شود.

یک رستوران آلمانی در یک آزمایش میدانی، روش قیمت‌گذاری عجیبی را امتحان کرد. مشتریان خودشان تصمیم می‌گرفتند آنچه خورده بودند چه قیمتی باید داشته باشد و همان مقدار را پرداخت می‌کردند (Pay-What-You-Want Pricing Scheme). نتایج جالب بود. مشتریان برای یک نوشیدنی گرم به‌طور متوسط ۱٫۹۴$ قیمت‌گذاری می‌کردند، درحالی‌که قیمت‌گذاری شرکت ۱٫۵۷$ بود. برای استفاده از بوفه غذا مشتریان به‌طور متوسط ۶٫۴۴ $ پرداخت می‌کردند. ولی قیمت‌گذاری رستوران ۷٫۹۹$ بود؛ اما نکته جالب این بود که این روش قیمت‌گذاری آن‌قدر برای مشتریان جذاب بود که درآمد ناشی از افزایش تقاضای مشتریان بسیار بیشتر از حالت عادی بود.

آزمایش دیگری در کافه یک دانشگاه که نان حلقوی را همراه با پنیر خامه‌ای سرو می‌کرد، روی نحوه ارائه محصول انجام شد. پنیرهای خامه‌ای با سایز یکسان و شباهت کامل در دو نوع بسته گِرد یا مستطیلی قابل‌عرضه بودند. مطالعات نشان داد در روزهایی که پنیر خامه‌ای تنها در بسته‌بندی‌های گِرد عرضه می‌شد، با احتمال بیشتری مشتریان ۲ بسته پنیر را سفارش می‌دادند.

مثال‌های مختلفی از آزمایش‌های میدانی وجود دارد که نتایج جالب و برخلاف انتظاری نشان دادند. همه این‌ها نشان می‌دهد هر پیش‌فرضی که در مورد کسب‌وکار خود دارید حتی بدیهی‌ترین آن‌ها، ممکن است درست نباشد. آزمایش کردن فرصت‌های زیادی را برای بهبود کسب‌وکار شما می‌تواند فراهم کند.

کاربردهای آزمایش کنترل‌شده تصادفی در سیاست‌گذاری

آزمایش کنترل‌شده تصادفی را می‌توان در سیاست‌گذاری‌های کلان نیز بکار برد. امروزه در بسیاری از کشورها قبل از آنکه سیاست‌گذار طرحی را به‌طور کامل در سطح کلان اجرا کند، آن را به شکل آزمایشی و محدود اجرا کرده و اثرات آن را می‌سنجد. سپس تصمیم گرفته می‌شود آیا آن طرح اجرا شود و یا نیاز به بهبود دارد.

 برای نمونه در کشور پاکستان با حمایت یونیسف (UNICEF) برنامه‌هایی برای بهبود سلامتی کودکان در سنین ابتدایی زندگی طراحی شد. از آزمایش کنترل‌شده تصادفی استفاده گردید تا مشخص شود آیا چنین طرحی در عمل مؤثر است و می‌تواند نتایج مطلوب را به بار آورد.

هدف ارزیابی سه برنامه طراحی‌شده بود. برای این منظور چهار گروه تعریف شد. گروه اول برنامه تغذیه بهبودیافته (Enhanced Nutrition) را که شامل مشاوره تغذیه و مکمل‌های غذایی بود در طول ۶ تا ۲۴ ماهگی کودک دریافت می‌کرد. گروه دوم برنامه پرورش زودهنگام کودکی (Early Childhood Development) را دریافت می‌کرد که شامل آموزش والدین در نگهداری و مراقبت نوزادان به همراه بازدید ماهیانه از نوزاد توسط پزشک بود. گروه سوم برنامه مراقبت سوم (Third Treatment Arm) را دریافت می‌کرد که ترکیب دو سیاست گفته‌شده بود. گروه کنترل (Control Group) مداخله جدیدی دریافت نمی‌کرد و روش‌های مرسوم فعلی در مورد آن بکار گرفته می‌شد (شکل-۳). نمونه‌ها به‌صورت تصادفی از خانواده‌هایی بودند که کودکان زیر ۲۴ ماه داشتند.

شکل-۳

خروجی برنامه بر اساس چندین شاخص در مورد کودکان و خانواده‌های آن‌ها در زمان‌های مختلف تا رسیدن به ۲۴ ماهگی جمع‌آوری شد. گروه جمع‌آوری داده از گروه اجراکننده برنامه‌های مراقبتی جدا بود و اطلاعی از نوع مداخلات نداشتند. این مسئله سوگیری در ارزیابی برنامه‌ها را کمینه می‌کرد.

مطالعات نشان داد تا رسیدن به ۱۲ ماهگی، کودکان در سه گروهی که مداخله را دریافت می‌کردند به‌طور معناداری در شاخص‌های شناختی، زبان و معیارهای احساسی-اجتماعی از گروه کنترل بهتر بودند. همین‌طور گروه سوم که مداخله ترکیبی را دریافت می‌کرد در شاخص‌های شناختی و زبان به‌طور معناداری بهتر از گروه پرورش زودهنگام کودکی بود. در پایان ۲۴ ماهگی نیز سه گروهی که مداخله دریافت کرده بود به‌طور معناداری در همه شاخص‌ها بهتر از گروه کنترل بود، اما دو گروهی که مداخله پرورش زودهنگام کودکی را دریافت کرده بودند شاخص‌های بهتری از گروهی که تنها در معرض مداخله تغذیه بهبود یافته بودند، کسب کردند (شکل-۴). نتایج این تحقیقات به سیاست‌گذاران سلامت در پاکستان نشان داد که کدام مداخله می‌تواند مؤثرتر عمل کند.

شکل-۴

منابع:

Conniffe, D. (1991). “RA Fisher and the Development of Statistics-A View in His Centerary Year”, Journal of the Statistical and Social Inquiry Society of Ireland, 26(3), 55-108

Dunn, P. M. (1997). “James Lind (1716-94) of Edinburgh and the Treatment of Scurvy”, Archives of Disease in Childhood-Fetal and Neonatal Edition, 76(1), F64-F65

Gallo, A. (2016). “A Refresher on Randomized Controlled Experiments”, Harvard Business Review, https://hbr.org/2016/03/a-refresher-on-randomized-controlled-experiments

Simester, D. (2017). “Field Experiments in Marketing”, Handbook of Economic Field Experiments, 1, 465-497

White, H., Sabarwal S. & T. de Hoop, (2014). “Randomized Controlled Trials (RCTs)”, Methodological Briefs: Impact Evaluation 7, UNICEF Office of Research, Florence

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *