پردازش الگو با استفاده از فرایند یادگیری تقویتی مبتنی بر مغز / دانشجو: میلاد مظفری - science- دانشکدگان علوم
آگهی دفاع از رساله دکتری
دانشکده ریاضی، آمار و علوم کامپیوتر
عنوان: پردازش الگو با استفاده از فرایند یادگیری تقویتی مبتنی بر مغز
دانشجو: میلاد مظفری
رشته: علوم کامپیوتر
اساتید راهنما: دکتر عباس نوذری دالینی و دکتر محمد گنج تابش
استاد مشاور: دکتر تیموته ماسکولیه
زمان: سه شنبه، 20 آذرماه 1397 ، ساعت 17
مکان : دانشکده ریاضی، آمار و علوم کامپیوتر، سالن هشترودی
چکیده:
بازشناسی اشیاء یک مسئله شناختی پیچیده است که در آن موجود زنده در مورد چیستی شئ هدف تصمیم می گیرد. الگوهای بینایی توسط شبکیه به الگوهای ضربه تبدیل شده و در سلسله مراتب قشر بینایی مغز پردازش می شوند. الگوهای ضربه در ناحیه IT به عنوان بالاترین سطح مسیر شکمی، قابلیت بازنمایی یک شئ کامل را دارند. در این رساله برای اولین بار از یادگیری تقویتی برای آموزش شبکه های عصبی ضربه ای در جهت پردازش و کدگشایی الگوهای ضربه و انجام بازشناسی اشیاء در تصاویر طبیعی استفاده شده است. در راستای این هدف، یک شبکه عصبی ضربه ای و کانولوشنی پیش خور ارائه شده است که در آن از کدگذاری زمان ضربه استفاده می شود. در لایه نهایی این شبکه به نورون ها یک برچسب نسبت داده شده است که بر اساس آن، نورون صاحب زودترین ضربه یا بیشترین پتانسیل غشاء تصمیم شبکه در مورد چیستی شئ هدف را تعیین می کند. در صورتی که تصمیم شبکه صحیح باشد، سیگنال پاداش تولید می شود و با اعمال قانون یادگیری مبتنی بر زمان ضربه ها (STDP) عملکرد نورون تقویت می شود. در غیر این صورت، با تولید سیگنال جریمه و اعمال قانون پاد- STDP ، نورون فرصت تغییر عملکرد خود را پیدا می کند. نتایج استفاده از این قانون (Reward-Modulated STDP) در پایگاه های تصویر گوناگون نشان می دهد که نورون های شبکه پیشنهادی ویژگی های متمایز کننده و کارامدی را استخراج می کنند. این در حالی است که قانون STDP بدون توجه به وظیفه هدف، تنها ویژگی های تکرار شونده را استخراج می کند. شبکه پیشنهادی نه تنها نیاز به استفاده از طبقه بندهای خارجی را حذف کرده است، بلکه مقبولیت زیستی، عملکرد، و قابلیت پیاده سازی سخت افزاری شبکه را بهبود داده است.