تکنیک جدید GSAT برای انتقال دانش بین عاملها و کمک به الگوریتمهای یادگیری تقویتی در محیط های پیچیده چند عامله

سال انتشار: 1393
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 776

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CSITM01_450

تاریخ نمایه سازی: 10 شهریور 1393

چکیده مقاله:

هم اکنون الگوریتم های بر مبنای جمعیت شاخه ی مهمی از علم هوش مصنوعی گردیده اند. در این زمینه تحقیقات وسیعی جهتایجاد، بهبود و استفاده از این الگوریتم ها در حل مسائل پیچیده توسط محققان علوم رایانه انجام گرفته است. می توان برای حلمسائل کوتاهترین مسیر از الگوریتم های یادگیری تقویتی بر مبنای جمعیت استفاده نمود؛ از جمله الگوریتم های بر مبنای جمعیت، الگوریم GSA می باشد که توسط خانم راشدی و همکارانش ارائه گردید. ما در این مقاله از الگوریتم GSA به همراه الگوریتم SARSA برای حل مسئله ی Grid World با هدف متحرک استفاده نموده ایم تا به الگوریتم بهتری در حل این گونه مسائل دست یابیم و تعداد حرکات لازم برای رسیدن عامل به هدف را کاها دهیم. در این روش چند عامل بصورت انفرادی شروعبه یادگیری کرده و بعد با همدیگر به همکاری می پردازند تا اینکه عامل ها به سمت هدف با کمترین خطا حرکت نمایند. جهت ارتباط و انتقال دانا بین عامل ها تکنیک GSAT پیشنهاد می شود. تکنیک ارائه شده نسبت به بسیاری از تکنیک های موجود توانسته است بهبود زیادی در کاها تعداد حرکات عامل برای رسیدن به هدف و عبور از موانع از خود نشان دهد. کارایی این روش در بخش بحث و نتیجه گیری با رسم نمودار نشان داده شده است.

نویسندگان

محمد نور محمدی زرده سوار

دانشجوی کارشناسی ارشد هوش مصنوعی دانشگاه هرمزگان

امین موسوی

عضو هیئت علمی دانشگاه هرمزگان

شهرام گلزاری

عضو هیئت علمی دانشگاه هرمزگان

احمد حاتم

عضو هیئت علمی دانشگاه هرمزگان

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • «Ant colony optimization algorithm and its application to neuro- ؛(2007) ...
  • «Re inforcement Learning through Interaction among Multiple ؛(2006) [2] Iima, ...
  • «Swarm reinforcement learning algorithms based on Sarsa ؛(2008) [3] Iima, ...
  • «Particle SWarm optimization«, Proceedings of IEEE ؛(1995) [4] Kennedy, James ...
  • «GSA: a gravitational search ؛(2009) [5] Rashedi, Esmmat and Nezamabadi ...
  • »Cooperative multi-agent learning: The state of the art«, ؛(2005) [6] ...
  • Schutz, Bernard (2003). Gravity from the ground up: An introductory ...
  • «Multiple-goal reinforcement learning with modular SARSA ؛(2003) [8] Sprague, Nathan ...
  • نمایش کامل مراجع