روش یادگیری تقویتی دربهینه سازی استوکاستیک سیستم مخزن

سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,208

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICCAU01_0840

تاریخ نمایه سازی: 29 تیر 1393

چکیده مقاله:

روش برنامه ریزی پویای استوکاستیک صریح (Stochastic Dynamic Programming) SDP برای حل مسایل پیچیده منابع آب با مشکلاتی نظیر بلای ابعادی و بلای مدلسازی مواجه می شود؛ این مساله موجب گردیده محققانهمواره در پی ارایه و توسعه روشهای مختلف برای حل مسایل بهینه سازی استوکاستیک سیستمهای منابع آب باشند. در این تحقیق روش Q-learning که یکی از تکنیک های الگوریتم یادگیری تقویتی است برای بهره برداری بهینه از یکسیستم مخزن پیشنهاد شده و سپس نتایج آن با نتایج حاصل از روش SDP مقایسه گردیده است. مقایسه سیاست های بهینه مستخرج از این دو روش نشان می دهد که Q-learning در برخورد با پدیده های استوکاستیک جریان رودخانه و مسئله عدم قطعیت دخیل در آن عملکرد بهتری داشته است

کلیدواژه ها:

بهینه سازی استوکاستیک مخزن ، یادگیری تقویتی ، برنامه ریزی پویای استوکاستیک ، سیاست بهره برداری

نویسندگان

امیرمحمد مرادی

دانشجوی دکتری دانشگاه صنعتی خواجه نصیرالدین طوسی دانشکده عمران

علیرضا برهانی داریان

دانشیارمنابع آب دانشگاه صنعتی خواجه نصیرالدین طوسی دانشکده عمران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • International Conference _ Civil Engineering Architecture & Urban Sustainable Development ...
  • Lee J-H, Labadie JW. Stochastic optimization of multireservot systems via ...
  • Labadie JW. Optimal operation of multireservot system: State-of-the-ar review. Journal ...
  • Sutton RS, Barto AG. Reinforcemet Learning: An Introduction, MIT Press, ...
  • Wilson G. Reinforcemet learning: A new technique for the real-time ...
  • Bouchart FJ-C, Chkam H. A reinforcement learning model for the ...
  • Castelletti A, Corani G, Rizzoli A, Soncini-Sessa R, Weber E. ...
  • Bhattacharya A, Lobbrecht A, Solomatine D Neural networks and reinforcement ...
  • Mahootchi M, Tizhoosh HR, Ponnambalam K. Opp osition-based reinforcement learning ...
  • Castelletti A, Galelli S, Restelli M, Soncini-Sessa R. Tree-based reinforcement ...
  • Gosavi A, S imulated-based optimization: parametric optimization techniques and reinforcement ...
  • Kim Y-O, Palmer RN. Value of seasonal flow forcasts in ...
  • نمایش کامل مراجع