شکل دهی پاداش با استفاده از کنترل کننده فازی در سیستم های چندعامله

در این مقاله از کنترل کننده فازی 1 استفاده کرده ایم تا شکل دهی پاداش 2 را بهبود ببخشیم. شکل دهی پاداش یکی از روش هایی که برای سرعت بخشیدن به همگرایی و استفاده از اطلاعات موجود از آن استفاده می شود. یکی از مشکلات این روش به کارگیری درست این اطلاعات برای بدست آوردن خروجی صحیح است. از آنجا که ویژگی فازی به کار گیری درست دانش انسانی است پس راه حل مناسب استفاده از فازی است است. این روش بر روی یک محیط ماز 3 اعمال شده است . نتایج حاکی از شکل دهی درست پاداش و افزایش سرعت همگرایی است

کلیدواژه ها:

شکل دهی پاداش ، سیستم های چند کارگزاره 4 ، کنترل کننده فازی

نویسندگان

مریم صادقلو

قطب علمی رایانش نرم و پردازش هوشمند اطلاعات، دانشگاه فردوسی مشهد ، مشهد

محمدرضا اکبرزاده توتونچی

قطب علمی رایانش نرم و پردازش هوشمند اطلاعات، دانشگاه فردوسی مشهد ، مشهد

محمدباقر نقیبی سیستانی

گروه مهندسی برق دانشگاه فردوسی مشهد، مشهد

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

S.Sutton & A. G. Barto, Reinforcemet Learning : An Introduction, ...
M. Wooldridge. An Introduction to MultiAgent Systems. John Wiley and ...
V. Gullapalli and A. G. Barto, "Shaping as a method ...
J. Randlov and P Alstrom, "Learning to drive a bicycle ...
M. Grzes and D. Kudenko, "Plan-based reward shaping for reinforcement ...
_ _ Analysis of reward shaping in reinforcement learing, " ...
S. Devlin and D Kudenko, "Theoretical consideration of potential-based reward ...
S. Devlin and D Kudenko, "Dynamic potential-based ...
M. Marashi and A khalilian, " Automatic Reward Shaping in ...
A. Y. Ng, D. Harada, and S. J. Russell, "Policy ...
_ _ _ initialization are equivalent, " JAIR, vol. 19, ...
_ _ _ Conference on Machine learning, page 608. ACM, ...
M. Matari'c. Reinforcemen learning in the multi-robot domain. Autonomous Robots, ...

نمایش کامل مراجع

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/276196

شناسه ملی سند علمی:

ICS12_116

تاریخ نمایه سازی: 11 مرداد 1393

نحوه استناد به مقاله:

در صورتی که می خواهید در اثر پژوهشی خود به این مقاله ارجاع دهید، به سادگی می توانید از عبارت زیر در بخش منابع و مراجع استفاده نمایید:

صادقلو، مریم و اکبرزاده توتونچی، محمدرضا و نقیبی سیستانی، محمدباقر،1392،شکل دهی پاداش با استفاده از کنترل کننده فازی در سیستم های چندعامله،دوازدهمین کنفرانس ملی سیستم های هوشمند ایران،بم،https://civilica.com/doc/276196

در داخل متن نیز هر جا که به عبارت و یا دستاوردی از این مقاله اشاره شود پس از ذکر مطلب، در داخل پارانتز، مشخصات زیر نوشته می شود.
برای بار اول: (1392، صادقلو، مریم؛ محمدرضا اکبرزاده توتونچی و محمدباقر نقیبی سیستانی)
برای بار دوم به بعد: (1392، صادقلو؛ اکبرزاده توتونچی و نقیبی سیستانی)
برای آشنایی کامل با نحوه مرجع نویسی لطفا بخش راهنمای سیویلیکا (مرجع دهی) را ملاحظه نمایید.

علم سنجی و رتبه بندی مقاله

مشخصات مرکز تولید کننده این مقاله به صورت زیر است:

رتبه علمی دانشگاه فردوسی مشهد

نوع مرکز: دانشگاه دولتی

تعداد مقالات: 40,919

در بخش علم سنجی پایگاه سیویلیکا می توانید رتبه بندی علمی مراکز دانشگاهی و پژوهشی کشور را بر اساس آمار مقالات نمایه شده مشاهده نمایید.