آموزش نرم‌افزار R برای علوم داده: توابع

بیشتر کارهایی که در نرم‌افزار R انجام می‌دهیم، توسط توابع صورت می‌گیرد. تاکنون من از توابعی که به‌صورت پیش‌فرض در R تعریف‌شده‌اند، استفاده کردم. ولی این امکان وجود دارد که شما توابع موردنظرتان را ایجاد کنید. نوشتن توابع آغاز راهی است که شما را از استفاده‌کننده صرف از R به توسعه‌دهنده تبدیل می‌کند. توابع معمولاً زمانی بکار می‌روند که بخواهیم یک سری دستور را در کنار هم قرار داده و بارها و بارها به شکل تقریباً مشابهی استفاده کنیم.

همین‌طور در زمان‌هایی که بخواهیم کدهای خود را با دیگران به اشتراک بگذاریم، غالباً از تابع استفاده می‌کنیم. با استفاده از توابع توسعه‌دهند‌گان می‌توانند برای کدهای خود یک رابط تعریف کنند که کاربران با تنظیم چند پارامتر آن را اجرا کنند بدون آنکه لازم باشد با کدهای پشت آن آشنا باشند. برای نمونه معمولاً در بسته‌هایی (Packages) که توسط توسعه‌دهندگان ایجاد شده است، شما به‌عنوان کاربر از توابع تعریف‌شده استفاده می‌کنید بدون آنکه خود را درگیر کدهای این بسته‌ها کنید.

در این مقاله من به نحوه کدنویسی توابع در R می‌پردازم. رویکرد من در آموزش برنامه‌نویسی R بیشتر مبتنی بر استفاده از مثال است تا خواننده با اجرای کدها بتواند این زبان را یاد بگیرد.

برای آشنایی با نحوه شروع به کار با نرم‌افزار R به مقاله “آموزش نرم‌افزار R برای علوم داده: مباحث مقدماتی” مراجعه کنید.

نوشتن تابع در R

برای نوشتن توابع در R از تابع function استفاده می‌شود. در کد زیر من تابع ساده‌ای نوشتم که با فراخوانی این تابع کلمه “سلام” چاپ می‌شود. ابتدا لازم است برای تابع خود نامی انتخاب کنم. من این تابع را f1 نام‌گذاری کردم. داخل آکولاد دستورهایی را که لازم است با فراخوانی این تابع اجرا شوند، آوردم. در این مثال تنها یک دستور وجود دارد و آن چاپ کردن کلمه سلام است. در انتها تابع f1 را فراخوانی کردم و همان‌طور که می‌بینید دستور موردنظر اجرا شده است.

در مثال دیگر، من تابعی نوشتم که یک بردار مانند x را می‌گیرد و k درصد از کوچک‌ترین و بزرگ‌ترین اعداد آن را جدا کرده و میانگین اعداد باقی‌مانده در بردار x را اعلام می‌کند. من این تابع را tmean نام‌گذاری می‌کنم که لازم دارد ورودی x و k را از کاربر دریافت کند. با استفاده از تابع پیش‌فرض quantile در R، دو عددی که یکی از k درصد اعداد موجود در x کوچک‌تراست و دیگری را که از ۱-k درصد اعداد موجود در x بزرگ‌تر است، مشخص می‌کنم. سپس میانگین اعداد موجود در بردار x را که بین این دو عدد قرار دارند، با استفاده از تابع mean به دست می‌آورم.

توجه کنید می‌توانید از تابع return استفاده کنید تا آنچه را که تابع قرار است به‌صورت خروجی نشان دهد، برگردانید. به‌صورت پیش‌فرض، توابع در R پس از اجرا، آخرین خط بدنه کد را به‌عنوان خروجی در نظر می‌گیرد.

در زیر این تابع را روی بردار test که شامل ۱۰۰ عدد تصادفی که از توزیع نرمال با میانگین ۰ و انحراف معیار ۱ نمونه‌گیری شده است، آزمایش کردم.

در تعریف تابع tmean من از دو تابع موجود در R استفاده کردم. به‌طور مشابه می‌توانید در داخل تابعی که تعریف می‌کنید از توابعی که قبلاً خودتان و یا دیگران تعریف کردند، استفاده کنید.

نکته جالب دیگر این‌که اگر نام تابع را بدون پرانتز وارد کنید، می‌توانید کدهای پشت آن را مشاهده کنید. این به شما کمک می‌کند در صورت نیاز توابعی را که دیگران نوشتند، بررسی نمایید.

ذخیره کردن توابع در R

من از تابع dump استفاده کردم تا تابع tmean را ذخیره کنم. این تابع را در فایلی به نام tmean.R بر روی نشانی فضای کاری (Work Directory) ذخیره کردم. در صورت نیاز می‌توانید با نرم‌افزارهای پردازش متنی مانند Notepad این فایل را باز و ویرایش کنید. برای فراخوانی این تابع از source استفاده کنید و پس از فراخوانی، می‌توانید آن را بکار ببرید.

آرگومان‌ها و متغیرها

ورودی‌هایی که تابع دریافت می‌کند و بر اساس آن اعمالی را انجام می‌دهد آرگومان نامیده می‌شوند. در تعریف یک تابع می‌توانید روشن کنید واردکردن چه آرگومان‌هایی باید اجباری باشند و کدام‌یک اختیاری. در مثال زیر، تابع f2 دو آرگومان دارد. مقدار توان، k،  به‌صورت پیش‌فرض ۲ در نظر گرفته شده است. اگر کاربر مقدار k را ندهد، تابع با خطا مواجه نمی‌شود ولی واردکردن مقدار x اجباری است. ضمن این‌که کاربر می‌تواند هر دو آرگومان را نیز وارد کند.

نکته دیگر این‌که متغیرها در داخل توابع، متغیرهای محلی (Local Variables) هستند؛ یعنی پس از اجرای تابع این متغیرها از دست می‌روند و کاربردشان تنها به کدهای داخل تابع محدود می‌شود. در مثال زیر من به متغیر x مقدار ۳ را تخصیص دادم. سپس متغیر x را در داخل تابع f3 بکار بردم و به آن مقدار صفر را تخصیص دادم. پس از اجرای تابع دوباره x را فراخوانی کردم و همان‌طور که می‌بینید، x همچنان مقدار ۳ را به خود گرفته است.

مفهوم ارزیابی تنبل (Lazy Evaluation) در R

ارزیابی تنبل یک رویکرد در طراحی الگوریتم‌هاست که بر این دیدگاه استوار است که “زمانت را برای چیزی که به آن نیاز نداری، صرف نکن.” به تابع f4 در زیر توجه کنید. با توجه به تعریف، این تابع نیازمند دو آرگومان است ولی اگر تنها یک آرگومان به آن بدهید، تابع با خطا مواجه نمی‌شود چراکه تابع برای اجرا به آرگومان دومی نیازی ندارد.

ارزیابی تنبل در R اجازه می‌دهد که برنامه کارآمدتر شود، تنها ورودی‌هایی که لازم است ارزیابی شوند و تنها اشیائی که لازم است در حافظه کامپیوتر بارگذاری شوند.

توابع و ساختارهای کنترلی (Control Structures)

این امکان وجود دارد که شما ساختارهای کنترلی را داخل توابع بکار ببرید. من در مقاله دیگری، درباره ساختارهای کنترلی مفصل بحث کردم. در اینجا تنها به یک مثال از نحوه بکار بردن حلقه داخل تابع، اکتفا می‌کنم.

در این مثال من مدل ریکر (Ricker’s Model) را در مدل‌سازی جمعیت یک گونه زیستی بکار بردم. مدل ریکر جمعیت در زمان t+1 را بر اساس جمعیت در زمان t از رابطه زیر محاسبه می‌کند:

N_{{t+1}} =N_{{t}}*e^{r(1-N_{{t}}/k)}

در رابطه بالا، r نرخ رشد جمعیت، k حداکثر جمعیت ممکن آن گونه زیستی با توجه به ظرفیت محیط و N_{{t}} و N_{{t+1}} به ترتیب جمعیت در زمان t و t+1 است.

تابع زیر مقادیر ورودی را گرفته و نمودار تغییر جمعیت در بازه زمانی موردنظر را به نمایش می‌گذارد. شکل-۱ خروجی این تابع را بر اساس جمعیت اولیه ۱۰۰، نرخ رشد ۹ درصد و حداکثر ظرفیت ۱۰۰۰۰ نشان می‌دهد.

شکل-۱

مقالات آموزش زبان R در آنالیکا

آموزش نرم‌افزار R برای علوم داده: مباحث مقدماتی

آموزش نرم‌افزار R برای علوم داده: خواندن و نوشتن داده‌ها

آموزش نرم‌افزار R برای علوم داده: عبارات شرطی و حلقه‌ها

آموزش نرم‌افزار R برای علوم داده: توابع

آموزش نرم‌افزار R برای علوم داده: رسم نمودار

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *