تکنیک جدید GSAT برای انتقال دانش بین عاملها و کمک به الگوریتمهای یادگیری تقویتی در محیط های پیچیده چند عامله

محمد نور محمدی زرده سوار; امین موسوی; شهرام گلزاری; احمد حاتم

تکنیک جدید GSAT برای انتقال دانش بین عاملها و کمک به الگوریتمهای یادگیری تقویتی در محیط های پیچیده چند عامله

محل انتشار: همایش ملی مهندسی رایانه و مدیریت فناوری اطلاعات

سال انتشار: 1393

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 776

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/282991

شناسه ملی سند علمی:

CSITM01_450

تاریخ نمایه سازی: 10 شهریور 1393

چکیده مقاله:

هم اکنون الگوریتم های بر مبنای جمعیت شاخه ی مهمی از علم هوش مصنوعی گردیده اند. در این زمینه تحقیقات وسیعی جهتایجاد، بهبود و استفاده از این الگوریتم ها در حل مسائل پیچیده توسط محققان علوم رایانه انجام گرفته است. می توان برای حلمسائل کوتاهترین مسیر از الگوریتم های یادگیری تقویتی بر مبنای جمعیت استفاده نمود؛ از جمله الگوریتم های بر مبنای جمعیت، الگوریم GSA می باشد که توسط خانم راشدی و همکارانش ارائه گردید. ما در این مقاله از الگوریتم GSA به همراه الگوریتم SARSA برای حل مسئله ی Grid World با هدف متحرک استفاده نموده ایم تا به الگوریتم بهتری در حل این گونه مسائل دست یابیم و تعداد حرکات لازم برای رسیدن عامل به هدف را کاها دهیم. در این روش چند عامل بصورت انفرادی شروعبه یادگیری کرده و بعد با همدیگر به همکاری می پردازند تا اینکه عامل ها به سمت هدف با کمترین خطا حرکت نمایند. جهت ارتباط و انتقال دانا بین عامل ها تکنیک GSAT پیشنهاد می شود. تکنیک ارائه شده نسبت به بسیاری از تکنیک های موجود توانسته است بهبود زیادی در کاها تعداد حرکات عامل برای رسیدن به هدف و عبور از موانع از خود نشان دهد. کارایی این روش در بخش بحث و نتیجه گیری با رسم نمودار نشان داده شده است.

کلیدواژه ها:

الگوریتم جستجوی گرانشی ، یادگیری تقویتی ، Grid World ، Q-learning ، GSAT

نویسندگان

محمد نور محمدی زرده سوار

دانشجوی کارشناسی ارشد هوش مصنوعی دانشگاه هرمزگان

امین موسوی

عضو هیئت علمی دانشگاه هرمزگان

شهرام گلزاری

عضو هیئت علمی دانشگاه هرمزگان

احمد حاتم

عضو هیئت علمی دانشگاه هرمزگان

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

«Ant colony optimization algorithm and its application to neuro- ؛(2007) ...
«Re inforcement Learning through Interaction among Multiple ؛(2006) [2] Iima, ...
«Swarm reinforcement learning algorithms based on Sarsa ؛(2008) [3] Iima, ...
«Particle SWarm optimization«, Proceedings of IEEE ؛(1995) [4] Kennedy, James ...
«GSA: a gravitational search ؛(2009) [5] Rashedi, Esmmat and Nezamabadi ...
»Cooperative multi-agent learning: The state of the art«, ؛(2005) [6] ...
Schutz, Bernard (2003). Gravity from the ground up: An introductory ...
«Multiple-goal reinforcement learning with modular SARSA ؛(2003) [8] Sprague, Nathan ...

نمایش کامل مراجع