انتقال یادگیری مبتنی بر مهارت در مسایل یادگیری تقویتی پیوسته

یک عامل‌ یادگیرنده‌ی تقویتی می‌تواند با زندگی بر پایه‌ی آزمایش و خطا و تنها بر اساس پاداش دریافتی از محیط تحت تاثیر عمل انتخابی خود، اقدام به یادگیری و دست‌یابی به سیاست بهینه نماید. روش‌های یادگیری تقویتی اغلب با مشکل نفرین ابعاد روبرو هستند. این مشکل بر میزان کارآیی و کاربردی  بودن این روش‌ها در مسائل دنیای واقعی تاثیر گذاشته‌اند. از این رو راه‌کارهایی برای غلبه بر این چالش ارائه گشته، که از این جمله می‌توان به ارائه‌ی ساختار سلسله‌مراتبی از وظیفه  و یا  فشرده‌سازی حالات اشاره نمود. از طرف دیگر در صورتی که امکان ایجاد بستر همکاری و انتقال یادگیری و دانش یادگرفته شده در محیط‌های متفاوت اما مرتبط برقرار باشد، سرعت و کیفیت یادگیری عامل‌ بهبود بخشیده خواهد شد. امروزه مفهوم انتقال یادگیری در حوزه هوش مصنوعی و یادگیری ماشین بصورت کاربردی وارد شده است.

ایده استفاده از راهکار انتقال یادگیری در الگوریتم های هوش مصنوعی و یادگیری ماشین از تحقیقات به عمل آمده در حوزه روانشناسی و علوم شناختی الهام گرفته شده است. تعداد پژوهش‌های زیادی در این زمینه انجام شده که بیانگر اثربخشی دانش کسب شده در وظایف مرتبط و مشابه قبلی در یادگیری یک وظیفه جدید است. به عنوان مثال، فردی که دوچرخه سواری بلد است خیلی سریع تر و کاراتر موتور سواری را یاد خواهد گرفت نسبت به کسی که مهارت دوچرخه سواری ندارد. علت این امر این است که فرد با یادگیری دوچرخه سواری یکسری دانش مجرد در مورد عمل سواری کردن فرا می‌گیرد که در آینده در حین یادگیری موتورسواری به وی کمک می‌کند. این دانش مجرد بر مبنای خصوصیات مشترک دو وظیفه مرتبط، همان دوچرخه سواری و موتور سواری، استوار است. از طرفی، یکی از ویژگی‌های برجسته انسان به عنوان یک عامل هوشمند، توانایی او در فراگیری مهارت‌ها، ساخت مهارت‌های جدید، اصلاح و تغییر آن‌ها با کسب تجربیات جدید و در نهایت اعمال آن‌ها در یک وظیفه جدید است. از این رو انسان ها، بطور روزمره با یادگیری و کسب دانش و مهارت و انتقال آن ها سعی دارند یادگیری خود را سریع تر و کارا تر کنند، زیرا با این امر یادگیری خود را به سمت مجموعه جوابهایی که در گذشته با یادگیری وظایف مشابه کسب کرده اند معطوف می کنند.

در این پایان نامه قصد داریم تا به بررسی استفاده و اعمال تکنیکهای انتقال یادگیری در عامل یادگیرنده تقویتی پرداخته شود به نحوی که عامل در وظیفه جدید یادگیری سریع تر و کاراتری را داشته باشد. 

 

ارائه دهنده پروژه

فرزانه شعله
پست الکترونیک: f.shoeleh@ut.ac.ir
عضو فعال
 

استاد راهنما

مسعود اسدپور
استادیار
اتاق: ساختمان جدید، 720
تلفن: 61114951
پست الکترونیکی: asadpour [AT] ut.ac.ir