
بهعنوان کسی که در حوزه استفاده از داده برای کاربردهای کسبوکار (Business Analytics) فعال هستم، با لایههای مختلف مفهوم حاکمیت داده در کارم مواجه هستم. البته به خوانندگان باید یادآوری کنم که تخصص من حوزه حاکمیت داده نیست و این مقاله را صرفاً از منظر یک استفادهکننده از داده نوشتم تا افرادی که در لایه کاربردی با داده سروکار دارند با این حوزه مهم و زیرساختی در زنجیره ارزش داده (Data Value Chain) آشنا شوند.
حاکمیت داده مجموعهای از مفاهیم، اصول و قواعد، فرآیندها و ابزارهایی است که به دنبال اطمینان از کیفیت، سازگاری، امنیت و قابلاستفاده بودن دادههایی است که توسط سازمان جمعآوری میگردد. مباحث حاکمیت داده در تمام چرخه عمر داده از زمانی که ایجاد یا جمعآوری میگردد تا زمانی که نابود یا آرشیو میشود، موضوعیت دارند.
در طول چرخه عمر داده، وظیفه حاکمیت داده آن است که دادههای باکیفیت بالا و سازگار با یکدیگر را بهراحتی در دسترس همه ذینفعان قرار دهد تا منجر به خروجیهای مطلوب کسبوکار شود. علاوه بر این باید اطمینان یابد که داده به نحوی استفاده میشود که منطبق بر قوانین و چارچوبهای اخلاقی رایج در آن سازمان، صنعت و کشور است. ضمن آنکه مباحث مربوط به امنیت داده شامل تعریف دسترسیها متناسب با نقش افراد، نظارت بر دسترسی و اطمینان از هماهنگی با مقررات در نظر گرفته شود.
یکی از مواردی که در پروژههای داده زیاد با آن مواجه شدهام، عدم اطمینان از صحت دادههاست. در شرایطی که لایههای مختلف سازمان به دادهها اطمینان ندارند، عملاً فضایی شکل میگیرد که پیشبرد پروژههای داده بهسختی ممکن است. هدف اصلی حاکمیت داده ایجاد این اطمینان است که دادهها بتوانند مبنای تصمیمگیری باشند، برای ارزیابی عملکرد فرآیندها و افراد بکار بروند و منجر به ایجاد شهودی شوند که برای کسبوکار خلق ارزش کند.
اصول حاکمیت داده صرفنظر از حجم داده یکسان است، گرچه حجم داده ممکن است ابزارهای متفاوتی را برای مدیریت داده طلب کند. بنابراین مقوله حاکمیت داده صرفاً برای شرکتهای بزرگ با حجم بالا و منابع متنوع داده مطرح نیست و برای شرکتهای کوچک و متوسط هم موضوعیت دارد.
چرا حاکمیت داده اهمیت روزافزون پیدا کرده است؟
تحولات فنآوری چند دهه گذشته، استفاده از رویکردهای دادهمحور را برای سازمانهای ایرانی جذاب کرده است. سه عامل اصلی در این تحول نقش بازی کردهاند. اول، پیشرفت فنّاوری باعث شده حجم انبوهی از داده تولید شود. گسترش استفاده از دستگاههای کارتخوان الکترونیکی در فروشگاهها، تجارت و تبلیغات در فضای اینترنت، عضویت در شبکههای اجتماعی و بهرهگیری از انواع دستگاههای الکترونیکی شخصی مانند گوشیهای هوشمند، دستگاههای بارکد خوان، پرداخت الکترونیک، دوربینهای مداربسته و مانند آن حجم انبوهی از داده را تولید کرده است. دوم، افزایش توان سختافزاری برای ذخیرهسازی این حجم از دادهها با قیمتهای نسبتاً پایین ممکن شده است. سوم، توسعه و پیشرفت روشهای محاسباتی و الگوریتمها برای تجزیهوتحلیل دادههای با حجم بالاست.
گرچه پرداختن به جنبههای مثبت این تحولات اهمیت دارد و من در مقالات متعددی در آنالیکا، فواید رویکردهای دادهمحور را شرح میدهم، جنبههای نگرانکننده این تحولات هم اهمیت دارد.
برای نمونه در مقاله دیگری در آنالیکا تحت عنوان “اعتماد مشتریان قابل خریدن نیست: نگاهی به امنیت اطلاعات در فضای مجازی”، به اتفاق تیرماه سال ۱۳۹۵ که در آن انتشار اطلاعات خصوصی مشترکان یکی از اپراتورهای کشور خبرساز شد، پرداختم. البته مسئله امنیت اطلاعات و چالشهای آن تنها محدود به ایران نیست. برای مثال، مقالهای در مجله کسبوکار هاروارد (Harvard Business Review) در سال ۲۰۱۷، اشاره کرده است ۷۰ درصد کارکنان سازمانها به دادههایی دسترسی دارند که نباید داشته باشند.
از سمت دیگر، با ترویج رویکردهای تصمیمگیری دادهمحور در شرکتها، عده بیشتری تقاضای دسترسی به داده دارند که بر پیچیدگی ساماندهی نحوه دسترسی افراد به دادهها افزوده است.
مسئله دیگر آن است که امروزه سازمانها پیچیدهتر شدهاند. اغلب، واحدهای مختلف کسبوکار در داخل یک شرکت به وجود میآیند که ممکن است دادههای مازاد و ناهماهنگ باهم تولید کنند. مثالی از چنین حالتی را ممکن است تجربه کرده باشید. بهعنوان مشتری یک شرکت از یک خدمت آن استفاده میکنید ولی درعینحال پیامکهای تبلیغاتی برای فروش آن خدمت دریافت میکنید. نمونهای که برای من چندین بار پیش آمده است که بهعنوان استاد یک دوره آموزشی از سمت موسسه برگزارکننده دعوت به ثبتنام در کلاسها شدم. علت وقوع چنین امری هماهنگ نبودن دادههای تیم بازاریابی با تیم عملیاتی شرکت است. وقتی این دو گروه از کار یکدیگر خبر نداشته باشند، منجر به چنین اتفاقی میشود.
یکی دیگر از مصداقهای پیچیده شدن سازمانها ادغام و خرید (Mergers and Acquisitions) شرکتها است که در هلدینگها و شرکتهای بزرگ دشواری زیادی در مدیریت داده ایجاد میکند. معمولاً در چنین حالتهایی هر شرکت، با نگرش خود موجودیتهای اساسی کسبوکار (Business Entities) نظیر مشتری، محصول، مکان و کارکنان را تعریف و کدگذاری میکند. بهاینترتیب در عمل، با شرایطی مواجه هستیم که در آن سیستمها و فرآیندهای هر شرکت با تعریف مختص به خود و نه یک تعریف فرابخشی در سطح هلدینگ، موجودیتها را مدیریت مینمایند. چنین رویکردی سازمانهای بزرگ را با چالشهای جدی در اشتراکگذاری و یکپارچهسازی داده مواجه میکند که منجر به افزایش ریسک و هزینههای عملیاتی و ارائه گزارشهای متناقض و غیرقابلاعتماد از کسبوکار میکند.
در سمت دیگر، مسئله آمادهسازی دادهها (Data Preparation) در سطحی است که برای پردازش و تحلیل نهایی آمده شوند. در پروژههای داده این مسئله میتواند تا ۸۰ درصد زمان پروژه را به خود تخصیص دهد. یکی از گلوگاههای بسیاری از پروژههای داده اطمینان از کیفیت، سازگاری و قابلاعتماد بودن دادهها است.
اینها نمونههایی است که نشان میدهد مدیران ارشد سازمانها ضمن تلاش در جهت استفاده از دادهها برای خلق ارزش در کسبوکار باید به ایجاد زیرساختهای حاکمیت داده توجه کنند.
نگاه یکپارچه به حاکمیت داده چیست؟
سیاستهای حاکمیت داده را میتوان در دو سر طیف دانست:
استراتژی تدافعی (Defensive Strategy) که هدف اصلی آن بیشینه کردن امنیت داده و اتخاذ قوانین سختگیرانه در استفاده از آن است.
استراتژی تهاجمی (Offensive Strategy) که هدف اصلی آن ایجاد مزیت رقابتی (Competitive Advantage) از طریق رویکردهای دادهمحور و انعطافپذیری در استفاده از داده است. در این سمت طیف، سازمان حتی ممکن است برخی از دادههای خود را بهصورت رایگان در اختیار همه قرار دهد تا بتوانند آن را بهگونهای که میخواهند استفاده، باز استفاده و منتشر کنند (رویکرد دادههای باز).
برحسب تجربهای که در سازمانهای ایرانی دارم، در بیشتر موارد سازمانها در سمتی هستند که رویکردی کاملاً تدافعی و محافظهکارانه نسبت به حاکمیت داده دارند؛ گرچه حتی در پیادهسازی آنهم چندان موفق نیستند.
چالش اصلی در حاکمیت داده این است که چگونه با توجه به اقتضائات سازمان و صنعت، سیاست متناسبی را بین این دو رویکرد اتخاذ کرد تا ضمن مدیریت ریسکها بتوان از دادهها برای خلق ارزش و مزیت رقابتی در کسبوکار بهره برد.
بهصورت سنتی برخی از وظایف حاکمیت داده توسط دپارتمان فنآوری اطلاعات (Information Technology – IT) در شرکتها پیادهسازی و اجرا میشود. چنین رویکردی معمولاً همه اهداف حاکمیت داده را محقق نمیکند، منجر به ایجاد جزیرههای داده میشود که باهم در تناقض هستند و درنهایت نمیتواند از همه ظرفیتهای دادهای سازمان برای خلق مزیت رقابتی استفاده کند.
رویکرد یکپارچه به حاکمیت داده، میتواند به ارائه یک سیاست متناسب در این حوزه کمک کند. نگاه یکپارچه به حاکمیت داده از سه رکن اصلی تشکیل میشود:
قابلیت اکتشاف (Discoverability)،
امنیت (Security)، و
پاسخگویی (Accountability).
شکل-۱ ارکان حاکمیت داده را نشان میدهد.

ارکان رویکرد یکپارچه به حاکمیت داده
قابلیت اکتشاف
مدیریت فراداده (Meta Data Management)
یکی از اجزای قابلیت اکتشاف، مدیریت فراداده (Meta Data Management) است. فراداده هر دادهای درباره دادهها است. مواردی مانند اسامی فیلدها، نوع داده، ساختار و چیدمان پایگاه داده، زمان بهروزرسانی داده و … نمونههایی از فراداده هستند. نیاز است فرآیندهایی تعریف شود تا اطمینان حاصل شود که فرادادهها مستند، بهروزرسانی و به اشتراک گذاشته میشوند.
اطلاعات مربوط به اصل و نصب داده (Lineage Information) از موارد مطرح دیگر است. این اطلاعات مشخص میکند داده چه مسیری را در فرآیند ETL (Extract-Transform-Load) طی میکند. این اطلاعات کمک میکند به پرسشهایی نظیر “چرا این داده وجود دارد؟” یا “داده از کجا میآید؟” پاسخ داده شود.
از منظر تحلیل داده چرا چنین پرسشهایی مهم هستند؟ چون همه دادهها به یک اندازه برای ما اعتبار ندارند. برای مثال اگر منبع یک داده، ورودیهایی است که توسط اپراتور انسانی به سامانه وارد میشود، احتمال بروز خطا در چنین دادههایی بسیار بالاتر است. بهعبارتدیگر منابع مختلف داده، کیفیت متفاوتی دارند. میزان حساسیت دادهها از منظر امنیتی جنبه دیگر ماجراست. نحوه مدیریت دادهای که از منابع عمومی که بهراحتی در دسترس همه است، بهدست آمده در مقابل دادههای حساس کاربران که طی فرآیندی با شرط محرمانگی بالا جمعآوری شده، متفاوت است.
دنبال کردن اصل و نصب داده در طول چرخه عمر آن، کمک میکند تا تصمیمگیری درباره نحوه ترکیب دادهها با کیفیت و سطوح حساسیت مختلف بهتر صورت گیرد.
یکی دیگر از موارد مهمی که در مدیریت فراداده مطرح است تهیه واژهنامه کسبوکار (Business Glossary) است. واژهنامه کسبوکار فهرستی از اصطلاحات کسبوکار به همراه تعاریف آنان است تا هنگام تحلیل داده در سراسر سازمان همگی یک برداشت از مفاهیم داشته باشند.
بارها در جلسات مدیران شرکتها حضور داشتم که در آن مدیر هر بخشی عددی را برای یک شاخص اعلام کرده است که با عدد دیگری که مدیر بخش دیگری اعلام کرده در تناقض بوده است. برای مثال یکی از سادهترین و کلیدیترین شاخصها، فروش شرکت است. اما باید مشخص شود وقتی صحبت از فروش میشود، منظور کدام فروش است؛ فروش ناخالص، فروش با در نظر گرفتن برگشت از فروش، فروش پس از کسر هزینههای بازاریابی، فروش پس از کسر مالیات، فروش پس از کسر مالیات و هزینههای عملیاتی.
دنیای کسبوکار پر است از مفاهیمی که مبهم هستند و هنگام تحلیل باید تعریف آنها روشن و شفاف شود. هدف واژهنامه کسبوکار ایجاد شفافیت در مفاهیم و شاخصهاست.
واژه دیگری که در حوزه مدیریت فراداده زیاد مطرح میشود، کاتالوگ داده (Data Catalog) است. کاتالوگ داده ابزاری برای مدیریت فراداده است. این ابزار کمک میکند بهسرعت و با کارآمدی بالا بتوان داراییهای دادهای سازمان را ارزیابی کرد، سطوح دسترسی افراد مختلف به دادهها را بررسی کرد، و به اطلاعات فرادادهها دسترسی داشت و در بین آنها جستجو کرد.
کیفیت داده (Data Quality)
پایه دیگر قابلیت اکتشاف، کیفیت داده است. محققان دانشگاه ام.آی.تی (MIT) آمریکا در یک مطالعه هزینه دادههای بیکیفیت را بین ۱۵ تا ۲۵ درصد درآمد شرکتها تخمین زدهاند. من بر اساس مرور ادبیات این هزینهها را در سه دسته تقسیمبندی میکنم:
هزینههای ناشی از خطا در عملیات: اینها مواردی هستند که کیفیت پایین دادهها موجب بروز خطا در فرآیندهای روزانه عملیاتی شرکت میشود.
دوبارهکاری در مدیریت دادهها: اینها مواردی هستند که کیفیت پایین دادهها موجب دوبارهکاری در فرآیند مدیریت دادهها مانند بازبینی دادهها، ورود مجدد دادهها، تمیز کردن و اعتبارسنجی مجدد دادهها میشود.
هزینه فرصت: این به مواردی اشاره دارد که عدم تحقق ابعاد کیفیت داده، منجر به محقق نشدن سودهای بالقوه و یا کاهش هزینههای بالقوه میگردد.
وقتی بحث از کیفیت داده میآید، ممکن است اولین چیزی که به ذهن برسد این باشد که داده ثبتشده بیانگر واقعیت است یا خیر. برای مثال اگر نام یک مشتری در پایگاه داده “آرش” ثبت شده، نام واقعی او نیز آرش باشد. این بعد مربوط به دقت داده (Accuracy) است. اما ابعاد کیفیت داده وسیعتر است و موارد زیر را شامل میشود:
دقت (Accuracy): دادههای ثبتشده، منعکسکننده مقادیر واقعی آن است.
تمامیت (Completeness): همه اجزاء در دسترس داده که باید ثبت شوند، ثبت شدهاند.
سازگاری (Consistency): بخشهای مختلف پایگاه داده باهم تناقض و مغایرتی ندارند.
امکان ممیزی (Auditability): تغییرات در پایگاه داده ثبت میشود.
نظم و ترتیب (Orderliness): دادهها با یک ساختار مشخص ذخیره میشوند.
یکتایی (Uniqueness): یک رکورد با جزئیات مشخص، تنها یکبار در پایگاه داده ثبت شده است.
بهموقع بودن (Timeliness): دادهها در یک بازه زمانی قابلقبول یا طبق استاندارد شرکت، بهروز میشوند.
برای آشنایی بیشتر با ابعاد کیفیت داده، توصیه میکنم مقاله من را با عنوان “مقدمهای بر مفاهیم کیفیت داده” مطالعه کنید.
مدیریت دادههای کلیدی (Master Data Management)
همانطور که بحث کردم امروزه شرکتها با موجودیتهای اساسی کسبوکار مختلف و متنوعی شامل افراد و شرکتها (مشتریان، شرکای تجاری، تأمینکنندگان و کارکنان)، مکانها (انبارها، مراکز فروش و شعبات) و سایر چیزها (محصولات و داراییها) مواجه هستند. در ادبیات حاکمیت داده، این موارد به دادههای کلیدی شناخته میشوند.
ازآنجاکه این نوع دادهها معمولاً در فرآیندهای کسبوکار و سامانههای فناوری اطلاعات متعددی استفاده میشود، استانداردسازی و همسانسازی آنها ضروری است. برای نمونه انتظار این است که یک محصول در همه فرآیندهای تولید، فروش و حسابداری یکسان شناسایی شود. یا در مثالی که در ابتدای مقاله زدم، انتظار این است مشتری که در حال استفاده از یک خدمت شرکت است، بهعنوان مشتری بالقوه همان خدمت شناسایی نشود. بهعبارتدیگر، دادههای تیم بازاریابی با تیم عملیاتی شرکت هماهنگ باشد.
امنیت (Security)
یک جنبه کلیدی حاکمیت داده، محافظت از آن است. هدف از امنیت داده آن است تا جلوی نشت اطلاعات حساس به افراد یا کاربردهایی که اجازه داده نشده، گرفته شود.
رویکردهایی مانند رمزنگاری، حفاظت فیزیکی از مراکز داده (Data Centers)، سرورها و دستگاهها، مدیریت و کنترل دسترسیها، تهیه و نگهداری از نسخههای پشتیبان (Backups)، تأمین امنیت شبکه و آموزش نیروی انسانی در حوزه امنیت استراتژیهایی هستند که در لایههای مختلف به امنیت داده در یک شرکت کمک میکنند.
دستهبندی و نظارت بر دسترسی (Classification and Access Control)
ارزیابی و دستهبندی دادهها از منظر اهمیت و حساسیت و همچنین کنترل دسترسی افراد بر دادهها همیشه یکی از اجزاء متداول حاکمیت داده در سازمانها است.
برای نمونه تصور کنید دادههای کارکنان شامل چندین جزء است: نام هر فرد، تاریخ استخدام، تاریخ پرداختهای گذشته، شمارهحساب بانکی و سطح دستمزد فعلی. هرکدام از این دادهها بسته به آنکه در چه سطحی از حساسیت دستهبندی شدهاند، باید محافظت شوند.
یک ساختار متداول دستهبندی اطلاعات شامل سه سطح است: دادههای عمومی (قابلدسترسی برای افرادی که به شرکت مربوط نیستند)، خارجی (قابلدسترسی به شرکا و تأمینکنندگانی که به سامانههای داخلی شرکت دسترسی قانونمند دارند)، داخلی (قابلدسترسی برای کارکنان سازمان) و محدود.
سیاست کنترل دسترسی تعیین میکند چه کسی در چه زمانی به چه دادههایی دسترسی خواهد داشت و با آن چه میتواند بکند؛ بخواند، ایجاد کند، پاک و یا بهروزرسانی کند.
در این مثال، دسترسی به اطلاعات شمارهحساب و سطح دستمزد فعلی کارکنان میتواند فقط محدود به افرادی باشد که در فرآیند پرداخت دستمزدها درگیر هستند. این افراد دسترسی خواندن اطلاعات و تغییر آن را دارند. همچنین اطلاعات سطح دستمزد فعلی برای مدیر مستقیم کارمند، در دسترس است و میتواند آن را بخواند یا تغییری در آن ایجاد کند. ممکن است اسم فرد و تاریخ استخدام او جزء اطلاعات داخلی محسوب شود که همه کارکنان شرکت میتوانند از آن مطلع باشند.
پاسخگویی (Accountability)
گرچه فناوری نقش مؤثری در مدیریت داده بازی میکند و ابزارهای خوبی برای مدیریت داده توسط شرکتهایی نظیر مایکروسافت (Microsoft)، اوراکل (Oracle) و آی بی ام (IBM) توسعه یافته است، باید توجه داشت نقش افراد در زیرساخت حاکمیت داده کلیدی است. پاسخگویی به این جنبه از حاکمیت داده برمیگردد که نقش افراد در ایجاد زیرساخت حاکمیت داده چیست.
در ادبیات حاکمیت داده نقشهای گوناگونی با وظایف متفاوت تعریف شده است. سیاستهای حاکمیت داده معمولاً توسط افرادی که درباره آن داده پاسخگو هستند (در مثال قبل، دپارتمان مدیریت منابع انسانی) تعیین میشود. این افراد مالک داده (Data Owner) نامیده میشوند. این سیاست معمولاً توسط تیمی که پایگاه داده یا سامانهها را مدیریت و نگهداری میکند اجرا میشود. در مثال قبل ممکن است دپارتمان IT شرکت مسئول پیادهسازی سیاست باشد. این تیم نقش سرپرست داده (Data Steward) را بازی میکند. آنان که تحت تأثیر سیاستهای حاکمیت داده توانمند میشوند و یا دسترسیشان به داده محدود میگردد، کاربر (User) نامیده میشوند.
اینکه صحبتهای کلی درباره مسئول بودن همه در قبال حاکمیت داده شود، بیشتر بدان معنی است که هیچکس نقش مشخصی در این خصوص بازی نمیکند. خیلی خوب است که افراد برای نحوه استفاده و مسائل امنیت داده آموزش ببینید ولی برای مثال اگر یک تحلیلگر داده بهعمد یا غیرعمد استفاده نامناسبی از داده کرد، باید مشخص شود که چه کسی پاسخگو است.
این کلیدی است که هر یک از افراد به وظایف نقشی که دارند آگاه و پاسخگو باشند، برای اجرای نقش خود بهاندازه کافی آموزش دیده باشند و همچنین مشخص باشد که در صورت عدم اجرای صحیح وظایف، چه عواقبی در انتظارشان است.
معمولاً بسته به اندازه، فرهنگ، ساختار و بلوغ سازمان نهادهایی مانند کمیته عالی راهبری، شورای مشورتی و کمیته اجرایی حاکمیت داده ایجاد میشوند تا وظایفی مانند سیاستگذاری، تدوین راهبردها و پیادهسازی را به عهده گیرند.
مزایای استقرار حاکمیت داده یکپارچه در کسبوکار
مطالعات مختلف، مزایای گوناگونی برای استقرار حاکمیت داده یکپارچه در شرکتها برشمردند که من به خلاصه به آنها اشاره میکنم.
یکی از مهمترین موارد هماهنگی با قوانین و مقررات وضعشده در سطح صنعت و یا کشور است. بهخصوص در کشورهایی مانند آمریکا و اتحادیه اروپا که معمولاً قوانین سختگیرانهای در بهکارگیری داده وجود دارد و حریم شخصی اهمیت بالایی برای قانونگذار دارد، وجود مکانیزمی برای اطمینان یافتن از تبعیت از قوانین بالادستی ضروری است.
مطالعات نشان داده است که مشتریان نسبت به درز اطلاعات شخصی خود بسیار حساس هستند. در مقاله “اعتماد مشتریان قابل خریدن نیست: نگاهی به امنیت اطلاعات در فضای مجازی” به اهمیت امنیت اطلاعات از منظر مشتریان پرداختم. یکی از کارکردهای حاکمیت داده، مدیریت حسن شهرت است. اتفاقات مختلفی در گوشه و کنار دنیا از نقض شدن حریم خصوصی مشتریان و یا درز اطلاعات رخ داده که منجر به آسیب به برند سازمان و کاهش اطمینان مشتریان به آن شده است. وجود یک ساختار حاکمیت داده یکپارچه، کمک میکند سازمان بداند چه دادههایی را دارد و چگونه و برای چه آن را استفاده میکند. دانستن پاسخ این پرسشها کمک میکند تا سازمان امنیت داده و کنترل دسترسی را بهبود بخشد و بتواند روی مدیریت موارد با ریسک بالا تمرکز کند.
با گسترش رویکردهای دادهمحور، بسیاری از سازمانها به دنبال بهره بردن از ارزش خلقشده چنین رویکردهایی در کسبوکارشان هستند. ولی کیفیت پایین داده، اثرات عمیقی بر روی فعالیتهای بالادستی در حوزه تحلیل داده میگذارد. در زبان انگلیسی جمله معروفی وجود دارد:
garbage in, garbage out
چنین مسئلهای در پروژههای داده و یادگیری ماشین کاملاً قابلمشاهده است. بسیاری از مدلهای یادگیری ماشین دادهها را دریافت میکنند و معمولاً اگر خطای بارزی در کدنویسی یا ساخت مدل نداشته باشید، حتماً به شما خروجی میدهند. ولی اینکه این خروجی چقدر بهدردبخور است، مسئله دیگری است. دادههای بیکیفیت وقتی وارد یک مدل یادگیری ماشین میشوند، خروجی بیکیفیت هم تولید میکنند. رویکرد یکپارچه حاکمیت داده، اثر مثبت و ملموسی روی کیفیت داده و آزاد کردن ظرفیتهای تحلیلی در زنجیره ارزش داده میگذارد.
حاکمیت داده میتواند روی تغییر مدل کسبوکار و نحوه درآمدزایی شرکت تأثیر مستقیم بگذارد. برای نمونه شرکتی را میشناختم که در حوزه تأمین زیرساختهای سختافزاری و نرمافزاری صندوقهای فروشگاهی خردهفروشها در سراسر کشور فعال است. این شرکت به دنبال تغییر مدل کسبوکار خود به سمت استفاده از داده برای درآمدزایی بود. هدف آنها تحلیل دادههای صندوقهای فروشگاهی و پیشبینی و کشف الگوی رفتار مصرف مشتریان در محصولات، زمان و مناطق جغرافیایی مختلف بود. این اطلاعات برای تولیدکنندگان و توزیعکنندگان کالا بسیار جذاب است و میتواند به تصمیمگیری دادهمحور آنان کمک کند. اما این شرکت در تغییر مدل کسبوکاری خود با چالشهای متعددی از جمله ابهام در مالکیت داده، ضعف در یکپارچگی دادههای فروش خردهفروشیها، عدم ثبت همه اطلاعات لازم برای کالاها، بهروز نبودن اطلاعات موجودی انبار و … مواجه شد. چنین چالشهایی جلوی رفتن به سمت مدلهای کسبوکار دادهمحور را میگیرد.
مثالی که در ابتدای مقاله درباره رفتار ناسازگار سازمان با مشتریان زدم، نشان میدهد که چگونه نداشتن یک دید یکپارچه نسبت به مشتری، میتواند رضایت او را کاهش دهد. در مقابل داشتن یک دید یکپارچه به مشتری، کمک میکند تا سازمان سریع مشکلات او را پاسخ دهد و یا متناسب با سلیقه و مشخصات جمیعت شناختیش پیشنهادهای محصول یا خدمت ارائه کند. از این منظر حاکمیت داده میتواند اثر مثبت مستقیمی روی درآمدزایی سازمان داشته باشد.
اجرای سیاستهای حاکمیت داده میتواند منجر به بهبود عملیات شود. یکی از روشهای بهبود عملیات و کاهش هزینه خودکارسازی فرآیندها است. در حالتی که دادههای عملیاتی ناسازگار هستند، اشتباه دارند، بهدرستی ثبت نمیشوند و مانند این، امکان خودکارسازی فرآیند کاهش مییابد. برای نمونه در یکی از تجربیات کاریم، برای خودکارسازی فرآیند صدور برگ خرید به چالشهایی از جنس مدیریت داده برخورد کردم. بهعنوان یک نمونه در انبار شرکت، انبارداران از روشهایی استفاده میکردند تا کار خود را راه بیندازند. درحالیکه در سامانه اتوماسیون انبارداری شرکت این روشها تعریف نشده بود. پس در سیستم انبارداری فعلی، طوری دادهها را وارد میکردند که کار خودشان راه بیفتند، درحالیکه در سمت تیم تحلیل داده موجب بروز نتایج غلط میشد. یا برخی موارد بهصورت دستی در جایی بهجز سامانه ثبت میشد. همه این موارد خودکارسازی کامل و بینقص فرآیند صدور برگ خرید را با دشواری همراه میکرد.
یکی دیگر از مصداقهای کمک حاکمیت داده در بهبود عملیات، تسهیل برونسپاری (Outsourcing) و همکاری با شرکای تجاری است. برونسپاری به سازمان کمک میکند تا تمرکز خود را بر روی حوزههای کلیدی عملکردی بگذارد و حوزههای غیرکلیدی را به دیگران بسپارد. برونسپاری نیازمند تعامل کارآمد سازمانها با یکدیگر است. به همین دلیل نیاز است دادههای موردنیاز، درست، بهموقع و با خوانش یکپارچه بین طرفین مبادله شود.
درنهایت، وجود یک نظام حاکمیت داده یکپارچه که در بالا توضیح دادم، به سازمان اجازه میدهد از داراییهای دادهای خود به شکل کارآمد استفاده کند و بتواند از طریق بهبود عملیات و کاهش هزینه، افزایش درآمد و یا تحول در مدل کسبوکار برای خود و جامعه ارزشافزوده خلق کند.
منابع
Eryurek, E., Gilad, U., Lakshmanan, V., Kibunguchy, A., & Ashdown, J. (2021). “Data Governance: The Definitive Guide”, O’Reilly
Franks, B. (2014). “The Analytics Revolution”, Wiley
DalleMule, L. & Davenport, T. H. (2017). “What’s Your Data Strategy?” Harvard Business Review, https://hbr.org/2017/05/whats-your-data-strategy
Mahanti, R. (2021). “Data Governance and Data Management”, Springer Books
Redman, T. (2017). “Seizing Opportunity in Data Quality”, MIT Sloan Management Review, https://sloanreview.mit.edu/article/seizing-opportunity-in-data-quality/
Samitsch, C. (2014). “Data Quality and its Impacts on Decision-Making: How Managers Can Benefit from Good Data”, Springer