هوش مصنوعی (Artificial Intelligence) به ماشینهایی دلالت دارد که میتوانند مانند انسان یا حیوانات یاد بگیرند، استدلال کنند، خودشان اقدام کنند و تصمیم بگیرند. امروزه تحقیقات در حوزه هوش مصنوعی تلاشهای متنوعی را در حوزههای بینایی ماشین، پردازش زبان طبیعی، رباتیک و یادگیری ماشین شامل میشود. گرچه امروزه حوزه هوش مصنوعی یکی از پیشرانهای […]
نویسنده: فرزاد مینویی
نمایش دادههای جغرافیایی در Folium پایتون
امروزه با گسترش اپلیکیشنهایی که اطلاعات مکانی کاربران را ذخیره میکنند، بسیاری از کسبوکارها به دادههای مکانی مشتریان نیز دسترسی پیدا کردند. به نمایش درآوردن دادههای مکانی، میتواند گام اول در بهرهگیری از این دادهها باشد. خوشبختانه امکانات خوبی در R و پایتون برای نمایش دادههای مکانی وجود دارد. در R کتابخانه Leaflet و […]
حاکمیت داده (Data Governance) چیست و چرا اهمیت دارد؟
بهعنوان کسی که در حوزه استفاده از داده برای کاربردهای کسبوکار (Business Analytics) فعال هستم، با لایههای مختلف مفهوم حاکمیت داده در کارم مواجه هستم. البته به خوانندگان باید یادآوری کنم که تخصص من حوزه حاکمیت داده نیست و این مقاله را صرفاً از منظر یک استفادهکننده از داده نوشتم تا افرادی که در لایه […]
رابط برنامهنویسی نرمافزار (API): یک ابزار فنی یا دارایی استراتژیک کسب و کار؟
اگر تخصصتان در حوزه فناوری اطلاعات باشد احتمال زیاد واژه رابط برنامهنویسی نرمافزار (Application Programming Interface – API) را زیاد شنیده باشید. از منظر فنی API به نرمافزارها امکان دسترسی به دادهها و تعامل با اجزای نرمافزار خارجی، سیستمعاملها یا میکرو سرویسها (Microservices) را میدهد. اما امروزه این واژه تنها یک اصطلاح فنی در […]
چگونه میتوان یک کد R را بهصورت خودکار در محیط ویندوز اجرا کرد؟
در این مقاله به این میپردازم که چگونه میتوانید یک کد در R را بهصورت خودکار در سیستمعامل ویندوز (Windows) اجرا کنید. در این مثال ساده هدف من آن است کدی ایجاد کنم که هر پنج دقیقه یکبار به مدت ۱۵ دقیقه یک عدد تصادفی از توزیع نرمال تولید و به همراه زمان تولید […]
کتابخانه Numpy در پایتون برای علوم داده
کتابخانه Numpy در پایتون، ابزارهای قدرتمندی برای محاسبات عددی مبتنی بر ماتریسها و آرایههای چندبعدی در اختیار قرار میدهد. اسم این کتابخانه، Numpy، از مخفف عبارت Numerical Python میآید. این کتابخانه ابزارهای زیادی شامل انواع توابع ریاضی، توابع توزیع آماری، ابزارهای موردنیاز برای محاسبات جبر خطی و تبدیل فوریه (Fourier Transformations) و … را […]
تجربه مشتری (CX) چیست و چگونه آن را اندازهگیری کنیم؟
من در چند سال اخیر بیمه خودروام را از یک پلتفورم آنلاین خرید بیمه تهیه میکنم. واقعیت این است که تا قبل از آشناییم با این پلتفورم، خرید و تمدید بیمهنامه خودرو برای من کار بسیار آزاردهندهای بود. این پلتفورم آنلاین تجربه من را از خرید بیمه بهطور کل متحول کرد. قبل از رسیدن […]
مدل ICE برای اولویتبندی پروژههای داده
ازآنجاکه حوزه علم داده (Data Science) یک حوزه کاربردی جدید محسوب میشود، اجرای پروژههای داده معمولاً با عدم قطعیتهای زیادی همراه است. یکی از شرایطی که ممکن است تیمهای داده با آن مواجه شوند، وجود ایدههای مختلف در داخل شرکت برای پیادهسازی است. برای مثال، تیم عملیات پیشنهاد میدهد یک مدل ریاضی برای پیشبینی […]
مقدمهای بر یادگیری ماشین (Machine Learning)
پیشتر در مقاله “هوش مصنوعی (Artificial Intelligence): ماشینهایی که یاد میگیرند” اشاره کردم، یادگیری ماشین شاخهای از هوش مصنوعی است که در آن هدف استدلال کردن و تصمیمگیری بر اساس حجم زیادی از دادههای ورودی است. برای مثال، میتوان یک الگوریتم یادگیری ماشین را بهگونهای آموزش داد تا دادههای سلامتی و پزشکی یک بیمار […]
هوش مصنوعی (Artificial Intelligence): ماشینهایی که یاد میگیرند
دنیای علم داده (Data Science) پر از کلمات و مفاهیمی است که در نگاه اول برای افراد خارج از این حوزه مبهم است. حتی افراد متخصص این حوزه هم ممکن است تعریف یکسانی از برخی مفاهیم نداشته باشند. عبارت هوش مصنوعی یکی از این موارد است. در این مقاله سعی دارم تا مفهوم آن […]
تحلیل علل ریشهای (Root Cause Analysis) چیست؟
به نسبت در دنیای پزشکی، تفاوت بین درمان بیماری و تسکین نشانههای آن قابلفهمتر است. کسی که شکستگی مچ حاد دارد نیاز به عمل جراحی برای درمان دارد، درحالیکه داروی مسکن صرفاً درد ناشی از شکستگی را تخفیف میدهد. ولی در بسیاری از حوزههای کاربردی شناسایی عوامل یک مشکل و پیدا کردن راهکار برای […]
ساختار شکست کار (WBS) و کاربرد آن در پروژههای داده چیست؟
ساختار شکست کار (Work Breakdown Structure – WBS) به شما کمک میکند تا ابعاد (Scope) فعالیتهای پروژه از طریق دستهبندی و ساختاردهی آنها مشخص شود. این رویکرد ضمن آنکه یک ساختار برای مدیریت پروژه در اختیار میدهد، کمک میکند جنبههای فنی و حل مسئله پروژه روشن شود. ساختار شکست کار سه مزیت عمده دارد: پروژه […]
ماتریس واگذاری مسئولیت (RACI) و اهمیت آن در پروژههای داده چیست؟
بسیاری از پروژههای داده پیچیده هستند و نیاز است تا افراد از تیمهای مختلف یک سازمان در کنار هم قرار گیرند تا پروژه به موفقیت برسد. مطالعات نشان میدهد از عوامل مهم شکست پروژههای داده درگیر نبودن تمامی ذینفعان، عدم تعهد مدیران میانی و نبود فهم درست از مسائل کسبوکار است. بسیار پیش میآید […]
مروری بر تبدیل Box-Cox و کاربردهای آن
بسیاری از تحلیلهای آماری و پارهای از الگوریتمهای یادگیری ماشین مبتنی بر این فرض است که نمونه از جامعهای با توزیع نرمال (Normal Distribution) به دست آمده و ساختار خطا جمعی است (Additive Error Structure). جمعی بودن ساختار خطا به این معنی است که خطا تنها به مقدار واقعی اضافه میشود و خودش وابسته به […]
توزیع نمونهگیری (Sampling Distribution)
در مقاله تابع توزیع احتمال شرح دادم چگونه تابع توزیع، متغیر تصادفی و نحوه توزیع هر یک از مقادیر آن را تبیین میکند. توزیع نمونهگیری درباره توزیع هر یک از مقادیر متغیر تصادفی نیست بلکه توزیع آماره (Statistics) یک نمونه با اندازه مشخص را نشان میدهد. در این مقاله بهصورت شهودی مفهوم توزیع نمونهگیری […]
تابع توزیع احتمال (Probability Distribution Function)
تابع توزیع احتمال نشاندهنده احتمال هر یک از مقادیر متغیر تصادفی (برای متغیرهای گسسته) یا احتمال قرار گرفتن متغیر تصادفی در یک بازه مشخص (برای متغیرهای پیوسته) است. در این مقاله سعی دارم به زبان ساده مفهوم تابع توزیع احتمال و تابع توزیع احتمال تجمعی را توضیح دهم. تصور کنید بهصورت تصادفی ۱۰۰ فرد […]
قضیه بیز (Bayes Theorem) و دلالتهای آن در عمل چیست؟
تصور کنید روزی از خواب بلند میشوید و احساس کسالت میکنید. به پزشک میروید و او از شما آزمایشهای مختلفی میگیرد. مشخص میشود نتیجه آزمایش شما برای یک بیماری نادر مثبت شده است. بیماری نادری که احتمال مبتلا شدن به آن، ۱ در هر ۱۰۰ هزار نفر است. بیماری که بسیار بد است و […]
احتمال شرطی؛ برداشتها و سوءبرداشتها
یکی از حوزههایی در احتمال که بهراحتی افراد را گیج میکند و منجر به استدلالهای خطا میشود، احتمال شرطی (Conditional Probability) است. احتمال شرطی، احتمال وقوع رخدادی مانند است بهشرط آنکه بدانیم رخدادی مانند اتفاق افتاده است. در ریاضی آن را با نشان میدهند. فرض کنید یک مطالعه ادعا میکند ۸۵ درصد بیماران سرطانی […]
مروری بر مفاهیم احتمال به زبان ساده
برتراند راسل (Bertrand Russell) میگوید “احتمال مهمترین مفهوم در علم مدرن است، بخصوص که هیچکس کوچکترین ایدهای ندارد که چه معنی میدهد.” بسیاری از ما در دوران مدرسه و دانشگاه با مفهوم احتمال از طریق آزمایشهای فکری (Thought Experiment) مانند پرتاب سکه و یا پرتاب طاس آشنا شدهایم. گرچه این مثالهای ساده به درک […]
چگونه میتوان پایتون را در خط فرمان ویندوز (CMD) اجرا کرد؟
پایتون (Python) یکی از زبانهای پرکاربرد برنامهنویسی برای کاربردهای علم داده (Data Science) است. برای پایتون محیطهای توسعه (Integrated Development Environment) متنوعی وجود دارد. خیلی از کسانی که از پایتون برای تحلیل داده استفاده میکنند ممکن است از محیطهای توسعهای نظیر Jupyter Notebook ،Spyder و یا PyCharm استفاده کنند. یکی دیگر از راههای اجرای […]