بهبود یادگیری الگوریتم بهینه سازی ازدحام با رویکرد یادگیری تقویتی

سال انتشار: 1393
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 349

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

SASTECH09_052

تاریخ نمایه سازی: 11 اردیبهشت 1398

چکیده مقاله:

یکی از الگوریتم های مشهور هوش جمعی، الگوریتم PSO است که ابزار مناسب برای حل مسایل بهینه سازی سراسری می باشد. در بسیاری از الگوریتمهای بهینهسازی ازدحام ذرات، ذرات از الگوی یادگیری واحد استفاده میکنند؛ که باعث می شود ذره در موقعیت های مختلف پیچیده موفق عمل نکند. به منظور حل این مسایل، ذرات نیاز به یادگیری استراتژیهای مختلف برای مقابله با موقعیتهای مختلف؛ دارند. جهت بهبود این مسیله سراغ یادگیری تقویتی رفتیم که یکی از روش های یادگیری است که می تواند ایده ای نو برای هوشمندی بیشتر در عامل ها باشد. در روش پیشنهادی از Q-learning برای افزایش توانایی در جستجو جلوگیری از افتادن در بهینه محلی استفاده می شود. برای ارزیابی نتایج از تابع محک Ackley،Sphere ،Zakharov ،Sum Squares ،De Jong Function N. استفاده شده است. نتایج با الگوریتم PSO معمولی الگوریتم PSOآشوبی (CPSO) مقایسه شده است. از مشاهده نتایج دیده می شود که نرخ همگرایی بهتراز بقیه روش ها شده است همچنین بهینه سراسری واقعی تر نسبت به دیگر الگوریتم ها بدست آمده است.

کلیدواژه ها:

الگوریتمQ-learning الگوریتم ازدحام ذرات (PSO) ، بهینه سازی سراسری ، یادگیری تقویتی

نویسندگان

مرضیه یوسفی

دانشگاه آزاد اسلامی واحد بوشهر، گروه هوش مصنوعی، بوشهر، ایران

سیدمحمدحسین معطر

دانشگاه آزاد اسلامی واحد مشهد، گروه کامپیوتر-نرم افزار، مشهد، ایران