هوش مصنوعی (Artificial Intelligence) به ماشینهایی دلالت دارد که میتوانند مانند انسان یا حیوانات یاد بگیرند، استدلال کنند، خودشان اقدام کنند و تصمیم بگیرند. امروزه تحقیقات در حوزه هوش مصنوعی تلاشهای متنوعی را در حوزههای بینایی ماشین، پردازش زبان طبیعی، رباتیک و یادگیری ماشین شامل میشود. گرچه امروزه حوزه هوش مصنوعی یکی از پیشرانهای […]
یادگیری ماشین
کتابخانه Numpy در پایتون برای علوم داده
کتابخانه Numpy در پایتون، ابزارهای قدرتمندی برای محاسبات عددی مبتنی بر ماتریسها و آرایههای چندبعدی در اختیار قرار میدهد. اسم این کتابخانه، Numpy، از مخفف عبارت Numerical Python میآید. این کتابخانه ابزارهای زیادی شامل انواع توابع ریاضی، توابع توزیع آماری، ابزارهای موردنیاز برای محاسبات جبر خطی و تبدیل فوریه (Fourier Transformations) و … را […]
مقدمهای بر یادگیری ماشین (Machine Learning)
پیشتر در مقاله “هوش مصنوعی (Artificial Intelligence): ماشینهایی که یاد میگیرند” اشاره کردم، یادگیری ماشین شاخهای از هوش مصنوعی است که در آن هدف استدلال کردن و تصمیمگیری بر اساس حجم زیادی از دادههای ورودی است. برای مثال، میتوان یک الگوریتم یادگیری ماشین را بهگونهای آموزش داد تا دادههای سلامتی و پزشکی یک بیمار […]
هوش مصنوعی (Artificial Intelligence): ماشینهایی که یاد میگیرند
دنیای علم داده (Data Science) پر از کلمات و مفاهیمی است که در نگاه اول برای افراد خارج از این حوزه مبهم است. حتی افراد متخصص این حوزه هم ممکن است تعریف یکسانی از برخی مفاهیم نداشته باشند. عبارت هوش مصنوعی یکی از این موارد است. در این مقاله سعی دارم تا مفهوم آن […]
مروری بر تبدیل Box-Cox و کاربردهای آن
بسیاری از تحلیلهای آماری و پارهای از الگوریتمهای یادگیری ماشین مبتنی بر این فرض است که نمونه از جامعهای با توزیع نرمال (Normal Distribution) به دست آمده و ساختار خطا جمعی است (Additive Error Structure). جمعی بودن ساختار خطا به این معنی است که خطا تنها به مقدار واقعی اضافه میشود و خودش وابسته به […]
الگوریتم گرادیان کاهشی چیست؟
در بسیاری از الگوریتمهای یادگیری ماشین (Machine Learning) عملاً یک مسئله بهینهسازی حل میشود. برای مثال در مسائل رگرسیون (Regression) هدف آن است که فاصله مقدار پیشبینیشده توسط الگوریتم یادگیری ماشین از مقدار واقعی آن کمینه شود. ازآنجاکه بسیاری از الگوریتمهای یادگیری ماشین در کامپیوتر با روشهای عددی پیادهسازی میشوند، الگوریتم گرادیان کاهشی (Gradient […]
مقدمهای بر مفاهیم کیفیت داده
یکی از موضوعاتی که در بسیاری از پروژههای داده که تاکنون درگیر آن بودم، برجسته بوده اهمیت کیفیت داده (Data Quality) است. کیفیت داده موضوعی است که شاید در ادبیات حوزه علم داده (Data Science) کمتر به آن پرداخته شده ولی در هنگام اجرای پروژههای واقعی داده با آن زیاد مواجه خواهید شد. بهخصوص […]
مراحل اجرای یک پروژه دادهکاوی چیست؟
ممکن است برخی دادهکاوی (Data Mining) را مجموعهای از نرمافزارهای خودکار یا روشهای ریاضی و آماری بدانند. درواقع دادهکاوی یک فرآیند و متدولوژی است که به مدیران کمک میکند تا از دادههای خام به اطلاعات ارزشمندی برسند که به بهبود تصمیمگیریهای آنان منجر شود. یکی از متداولترین فرآیندها برای انجام پروژههای دادهکاوی، CRISP-DM (Cross-Industry […]
چگونه مانند یک دانشمند داده فکر کنید؟ راهنمایی برای مدیران اجرایی
امروزه بسیار توصیه میشود تا مدیران از داده برای تصمیمگیریهای حوزههای کسبوکار استفاده کنند. اما ممکن است مدیران در کار با داده، استنتاج و تحلیل بر اساس آن و درنهایت شکلگیری تصمیم خود راحت نباشند. خبر خوب این است که لزومی ندارد شما یک متخصص و یا دانشمند داده باشید تا بتوانید تصمیمات دادهمحور […]
آیا با استفاده از تحلیل کلیدواژههای جستجوشده در گوگل میتوان روندهای تقاضا را پیشبینی کرد؟
بنا به آمار سال ۲۰۱۷، روزانه ۴٫۵ میلیارد جستجو در گوگل صورت میگیرد. در حال حاضر سهم بازار گوگل از موتورهای جستجو حدود ۷۰ درصد است. نکته جالب دیگر اینکه ایرانیان جزء کاربران اصلی گوگل محسوب میشوند. طبق آمار ماه فوریه ۲۰۱۷، ۳٫۱ درصد از کاربران موتور جستجوگر گوگل از ایران هستند. بهاینترتیب ایران […]