روش یادگیری تقویتی دربهینه سازی استوکاستیک سیستم مخزن
سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,208
فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICCAU01_0840
تاریخ نمایه سازی: 29 تیر 1393
چکیده مقاله:
روش برنامه ریزی پویای استوکاستیک صریح (Stochastic Dynamic Programming) SDP برای حل مسایل پیچیده منابع آب با مشکلاتی نظیر بلای ابعادی و بلای مدلسازی مواجه می شود؛ این مساله موجب گردیده محققانهمواره در پی ارایه و توسعه روشهای مختلف برای حل مسایل بهینه سازی استوکاستیک سیستمهای منابع آب باشند. در این تحقیق روش Q-learning که یکی از تکنیک های الگوریتم یادگیری تقویتی است برای بهره برداری بهینه از یکسیستم مخزن پیشنهاد شده و سپس نتایج آن با نتایج حاصل از روش SDP مقایسه گردیده است. مقایسه سیاست های بهینه مستخرج از این دو روش نشان می دهد که Q-learning در برخورد با پدیده های استوکاستیک جریان رودخانه و مسئله عدم قطعیت دخیل در آن عملکرد بهتری داشته است
کلیدواژه ها:
نویسندگان
امیرمحمد مرادی
دانشجوی دکتری دانشگاه صنعتی خواجه نصیرالدین طوسی دانشکده عمران
علیرضا برهانی داریان
دانشیارمنابع آب دانشگاه صنعتی خواجه نصیرالدین طوسی دانشکده عمران
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :