یادگیری رفتار در ساختار رفتاری توسط یادگیری تقویتی

سال انتشار: 1385
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 2,159

نسخه کامل این مقاله ارائه نشده است و در دسترس نمی باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ACCSI12_285

تاریخ نمایه سازی: 23 دی 1386

چکیده مقاله:

مشکل عمده رو شهای یادگیری مبتنی بر یادگیری تقویتی ، طولانی شدن زمان یادگیری در اثر افزایش ابعاد فضای مسئله است . یادگیری تقویتی سلسله مر اتبی با تجزیه مسئله به اجزای کوچ کتر سعی در حل چنین مشکلی دار د. در این مقاله نیز با تجزیه مسئله به اجزای کوچک تر که آنها را رفتار م ینامیم، از ساختارهای BB به عنوان ساختارهای سلسله مراتبی برای یادگیری رفتارها استفاده می شود و روشی برای تجدید توابع ارزش و تقسیم پاداش دریافتی پیشنهاد می شو د. در این روش دانش طراح بیشتر در ساختار کد می شود و مزایایی مانند سرعت بالای همگرایی، روش های یادگیری سلسله مراتبی و کاهش فضای حالت را با مزایای سیستمهایBBیکجا جمع می کنیم . به علاوه در چنین ساختاری قابلیت یادگیری خود ساخ تار نیز امکان پذیر است. نتایج شبیه سازی روی مسئله هدایت تاکسی، کارایی روش را بهتر نشان می دهد.