یادگیری رفتار در ساختار رفتاری توسط یادگیری تقویتی

علی اکبر آقامحمدی; مجید نیلی احمدآبادی; طاهر شهبازی میرزاحسنلو

یادگیری رفتار در ساختار رفتاری توسط یادگیری تقویتی

محل انتشار: دوازدهمین کنفرانس سالانه انجمن کامپیوتر ایران

سال انتشار: 1385

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 2,159

نسخه کامل این مقاله ارائه نشده است و در دسترس نمی باشد

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/44671

شناسه ملی سند علمی:

ACCSI12_285

تاریخ نمایه سازی: 23 دی 1386

چکیده مقاله:

مشکل عمده رو شهای یادگیری مبتنی بر یادگیری تقویتی ، طولانی شدن زمان یادگیری در اثر افزایش ابعاد فضای مسئله است . یادگیری تقویتی سلسله مر اتبی با تجزیه مسئله به اجزای کوچ کتر سعی در حل چنین مشکلی دار د. در این مقاله نیز با تجزیه مسئله به اجزای کوچک تر که آنها را رفتار م ینامیم، از ساختارهای BB به عنوان ساختارهای سلسله مراتبی برای یادگیری رفتارها استفاده می شود و روشی برای تجدید توابع ارزش و تقسیم پاداش دریافتی پیشنهاد می شو د. در این روش دانش طراح بیشتر در ساختار کد می شود و مزایایی مانند سرعت بالای همگرایی، روش های یادگیری سلسله مراتبی و کاهش فضای حالت را با مزایای سیستمهایBBیکجا جمع می کنیم . به علاوه در چنین ساختاری قابلیت یادگیری خود ساخ تار نیز امکان پذیر است. نتایج شبیه سازی روی مسئله هدایت تاکسی، کارایی روش را بهتر نشان می دهد.

کلیدواژه ها:

سیستم های رفتاری ، یادگیری رفتار ، یادگیری تقویتی ، ساختار سلسله مراتبی

نویسندگان

علی اکبر آقامحمدی

مجید نیلی احمدآبادی

طاهر شهبازی میرزاحسنلو