تلفیق مبانی فازی و یادگیری تقویتی در کنترل سیستم های دینامیکی

سال انتشار: 1394
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 534

فایل این مقاله در 14 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_JACSM-27-1_009

تاریخ نمایه سازی: 2 آبان 1396

چکیده مقاله:

یادگیری تقویتی، روشی است که در آن عامل یا عاملان باتوجه به ی کسری پاداش های مثبت و یا منفی، یک عمل بهینه را انجام می دهند. این روش، زمانی کارایی بسیار بالایی خواهد داشت که مدل سیستم به صورت طبیعی موجود نباشد و یا به دست آوردن آن موجب زحمت فراوان گردد. در این صورت می توان، آن را جایگزین مناسبی برای منطقه ای کنترلی دیگر دانست. یکی از معایب اساسی این روش، استفاده از عمل های گسسته در حین انجام آن می باشد. این در حالی است که خیلی از سیستم های دینامیکی با چنین رویکردی، عملکرد بهینه ای نخواهند داشت. برای جبران این نقیصه، رویکردهای متفاوتی از جمله تقریب مقادیر ظهور پیدا می کنند. در این مقاله از منطق فازی برای پیوسته کردن عمل های بهینه استفاده شده است. در این حالت، سیستم یادگیری تقویتی، قوانین بین کنترل کننده فازی را در جهت نیل به بهینه ترین عمل تنظیم می نماید و به این ترتیب می تواند عمل های پیوست های را تولید نماید. به این منظور مدل یک آونگ معکوس در سیم مکانیکس در نظر گرفته شده است که توسط کنترل کننده طراحی شده است و حرکت آن در دو حالت کنترل زاویه آونگ و کنترل کامل آونگ و ارابه مورد بررسی قرار می گیرد. نتایج به دست آمده نشان می دهند، هوش مصنوعی به کار گرفته شده به جای انتخاب قوانین موجود، می تواند کارایی بالاتری در کنترل سیستم های دینامیکی داشته باشد.

نویسندگان

مسعود گوهری منش

دانشجوی دکتری مهندسی مکانیک، دانشگاه فردوسی مشهد

علی اکبر اکبری

دانشیار گروه مهندسی مکانیک، دانشگاه فردوسی مشهد

محمد باقر نقیبی سیستانی

دانشیار گروه مهندسی برق، دانشگاه فردوسی مشهد