Reinforcement Learning


معرفی:

انسان از بدو تولد تا لحظه مرگ درحال یادگیری است. این یادگیری به نوعی در تعامل با محیط بدست می‌آید و انسان با بازخورد هایی که از محیط میگیرد تصمیمات خود را اصلاح میکند و با محیط تطابق پیدا میکند. در رباتیک نیز با بهره گیری از این الگوی یادگیری انسان شاخه از یادگیری ماشین بدست آمده است به نام یادگیری تقویتی. حتما برای شما پیش آمده است که در یک بازی دونفره مقاله رایانه بازی کرده باشید و حتما به این موضوع پی برده اید که بعد از چند دست پیروزی در بازی در مقابل رایانه برای شما سخت تر شده است. الگوریتم هایی که در پشت پرده به رایانه این اجازه را میدهند تا الگوهای بازی شما پیدا کنند و بر اساس آن ها رفتار بازی خود را تغییر دهد یادگیری تقویتی است. در یادگیری تقویتی سیتسم با تعامل با محیط یادمیگیرد که چگونه رفتار کند تا بتواند وظایف خود را به بهترین نحو انجام دهد. در این کارگاره ابتدا با مسائلی واقعی و کاربردهایی از یادگیری تقویتی در زندگی روزمره آشنا خواهید شد سپس به صورت گام به گام از مسائل پایه ای یادگیری تقویتی شروع میکنیم و تا الگوریتم های پیشرفته ای مانند یادگیری Q پی میرویم. در این کارگاه سه روزه با کمک دستیاران آموزشی به صورت قدم به قدم و همراه با نوشتن کد های الگوریتم ها فرا خواهید گرفت.


سرفصل ها:
  • مفاهیم و تعاریف اولیه شامل تعریف State، Action، Reward، Discount factor، MDP، State Value، Q-Value، Policy و...
  • Policy Evaluation, Policy Improvement, Planning, Policy Iteration, Value Iteration
  • Monte Carlo Learning Methods, SARSA Learning Methods, Q-Learning
  • n-step return, Eligibility Trace
  • Introduction to Inverse Reinforcement Learning

سخنرانان: سروش قندی – شهرزاد خرسند – معین کافی – نیلوفر شریفی صدر – مرجان شاهی


تاریخ برگزاری: چهارشنبه ۴ دی ماه الی جمعه ۶ دی ماه ۱۳۹۸


ساعت برگزاری: ۹ الی ۱۸


محل برگزاری: تهران، ولنجک، دانشگاه شهید بهشتی، تالار دانشکده ریاضی


ثبت نام:

ثبت نام