بررسی تاثیر یادگیری تقویتی بر کنترل ربات دوپا با استفاده از شبکه عصبی

مهدی مصلی; حسن زرآبادی پور

بررسی تاثیر یادگیری تقویتی بر کنترل ربات دوپا با استفاده از شبکه عصبی

محل انتشار: سومین کنفرانس ملی تکنولوژی مهندسی برق و کامپیوتر

سال انتشار: 1396

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 599

فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > شبکه عصبی

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/749212

شناسه ملی سند علمی:

ETECH03_048

تاریخ نمایه سازی: 1 مرداد 1397

چکیده مقاله:

امروزه تحقیقات در زمینه ی کنترل تطبیقی روی تکنیکهای یادگیری الهام گرفته از زندگی موجود زنده برای کاربردهای زندگی حقیقی متمرکز شده است. یادگیری تقویتی یکی از این تکنیکها است، که اخیرا به طور گسترده ای روی کنترل در حوزه ی رباتیک مورد استفاده قرار گرفته است. از طرف دیگر، شبکه های عصبی مصنوعی یک ابزار تقریب زننده ی دقیق در کارهای کنترل غیرخطی ربات به حساب میآید. در این پژوهش، هدف اصلی ما ترکیب مزایای شبکه های عصبی مصنوعی و یادگیری تقویتی برای کاهش زمان یادگیری و بهبود دقت کنترلی است. بنابراین یکی از بهترین رهیافتهای یادگیری تقویتی تحت نام یادگیری تقویتی عامل-نقاد برای کنترل گشتاورهای ربات دوپای پنج رابط و حفظ بدنه غیرفعال در موقعیت عمودی مورد ارزیابی قرار گرفته است. هر دو بخش کنترلگر، یعنی نقاد و عامل، با یک شبکه ی عصبی مصنوعی فیدبکدار پیادهسازی شده است. این واحدها با استفاده از خطای تفاضل زمانی همزمان سازی میشوند و از بردار اثر شایستگی برای تخصیص پاداش یا مجازات برای عمل انتخابی بهره میبرند. نتایج شبیه سازی نشان میدهد که روش کنترلی پیشنهادی دارای عملکرد مطلوب روی کنترل پایدار راه رفتن ربات دوپا است.

کلیدواژه ها:

پایداری گام ، ربات دوپا ، شبکه عصبی ، یادگیری تقویتی

نویسندگان

مهدی مصلی

دانشکده مهندسی برق، دانشگاه البرز استان قزوین قزوین، ایران

حسن زرآبادی پور

دانشکده مهندسی برق،دانشگاه بین المللی امام خمینی استان قزوین قزوین، ایران