روش یادگیری تقویتی دربهینه سازی استوکاستیک سیستم مخزن

امیرمحمد مرادی; علیرضا برهانی داریان

روش یادگیری تقویتی دربهینه سازی استوکاستیک سیستم مخزن

محل انتشار: کنفرانس بین المللی عمران، معماری و توسعه پایدار شهری

سال انتشار: 1392

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 1,208

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/272796

شناسه ملی سند علمی:

ICCAU01_0840

تاریخ نمایه سازی: 29 تیر 1393

چکیده مقاله:

روش برنامه ریزی پویای استوکاستیک صریح (Stochastic Dynamic Programming) SDP برای حل مسایل پیچیده منابع آب با مشکلاتی نظیر بلای ابعادی و بلای مدلسازی مواجه می شود؛ این مساله موجب گردیده محققانهمواره در پی ارایه و توسعه روشهای مختلف برای حل مسایل بهینه سازی استوکاستیک سیستمهای منابع آب باشند. در این تحقیق روش Q-learning که یکی از تکنیک های الگوریتم یادگیری تقویتی است برای بهره برداری بهینه از یکسیستم مخزن پیشنهاد شده و سپس نتایج آن با نتایج حاصل از روش SDP مقایسه گردیده است. مقایسه سیاست های بهینه مستخرج از این دو روش نشان می دهد که Q-learning در برخورد با پدیده های استوکاستیک جریان رودخانه و مسئله عدم قطعیت دخیل در آن عملکرد بهتری داشته است

کلیدواژه ها:

بهینه سازی استوکاستیک مخزن ، یادگیری تقویتی ، برنامه ریزی پویای استوکاستیک ، سیاست بهره برداری

نویسندگان

امیرمحمد مرادی

دانشجوی دکتری دانشگاه صنعتی خواجه نصیرالدین طوسی دانشکده عمران

علیرضا برهانی داریان

دانشیارمنابع آب دانشگاه صنعتی خواجه نصیرالدین طوسی دانشکده عمران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :

International Conference _ Civil Engineering Architecture & Urban Sustainable Development ...
Lee J-H, Labadie JW. Stochastic optimization of multireservot systems via ...
Labadie JW. Optimal operation of multireservot system: State-of-the-ar review. Journal ...
Sutton RS, Barto AG. Reinforcemet Learning: An Introduction, MIT Press, ...
Wilson G. Reinforcemet learning: A new technique for the real-time ...
Bouchart FJ-C, Chkam H. A reinforcement learning model for the ...
Castelletti A, Corani G, Rizzoli A, Soncini-Sessa R, Weber E. ...
Bhattacharya A, Lobbrecht A, Solomatine D Neural networks and reinforcement ...
Mahootchi M, Tizhoosh HR, Ponnambalam K. Opp osition-based reinforcement learning ...
Castelletti A, Galelli S, Restelli M, Soncini-Sessa R. Tree-based reinforcement ...
Gosavi A, S imulated-based optimization: parametric optimization techniques and reinforcement ...
Kim Y-O, Palmer RN. Value of seasonal flow forcasts in ...

نمایش کامل مراجع