بررسی تاثیر یادگیری تقویتی بر کنترل ربات دوپا با استفاده از شبکه عصبی

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 599

فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ETECH03_048

تاریخ نمایه سازی: 1 مرداد 1397

چکیده مقاله:

امروزه تحقیقات در زمینه ی کنترل تطبیقی روی تکنیکهای یادگیری الهام گرفته از زندگی موجود زنده برای کاربردهای زندگی حقیقی متمرکز شده است. یادگیری تقویتی یکی از این تکنیکها است، که اخیرا به طور گسترده ای روی کنترل در حوزه ی رباتیک مورد استفاده قرار گرفته است. از طرف دیگر، شبکه های عصبی مصنوعی یک ابزار تقریب زننده ی دقیق در کارهای کنترل غیرخطی ربات به حساب میآید. در این پژوهش، هدف اصلی ما ترکیب مزایای شبکه های عصبی مصنوعی و یادگیری تقویتی برای کاهش زمان یادگیری و بهبود دقت کنترلی است. بنابراین یکی از بهترین رهیافتهای یادگیری تقویتی تحت نام یادگیری تقویتی عامل-نقاد برای کنترل گشتاورهای ربات دوپای پنج رابط و حفظ بدنه غیرفعال در موقعیت عمودی مورد ارزیابی قرار گرفته است. هر دو بخش کنترلگر، یعنی نقاد و عامل، با یک شبکه ی عصبی مصنوعی فیدبکدار پیادهسازی شده است. این واحدها با استفاده از خطای تفاضل زمانی همزمان سازی میشوند و از بردار اثر شایستگی برای تخصیص پاداش یا مجازات برای عمل انتخابی بهره میبرند. نتایج شبیه سازی نشان میدهد که روش کنترلی پیشنهادی دارای عملکرد مطلوب روی کنترل پایدار راه رفتن ربات دوپا است.

نویسندگان

مهدی مصلی

دانشکده مهندسی برق، دانشگاه البرز استان قزوین قزوین، ایران

حسن زرآبادی پور

دانشکده مهندسی برق،دانشگاه بین المللی امام خمینی استان قزوین قزوین، ایران