روش یادگیری تقویتی دربهینه سازی استوکاستیک سیستم مخزن

امیرمحمد, مرادی; علیرضا, برهانی داریان

روش یادگیری تقویتی دربهینه سازی استوکاستیک سیستم مخزن

عنوان مقاله: روش یادگیری تقویتی دربهینه سازی استوکاستیک سیستم مخزن
شناسه ملی مقاله: ICCAU01_0840
منتشر شده در کنفرانس بین المللی عمران، معماری و توسعه پایدار شهری در سال 1392

مشخصات نویسندگان مقاله:

امیرمحمد مرادی - دانشجوی دکتری دانشگاه صنعتی خواجه نصیرالدین طوسی دانشکده عمران
علیرضا برهانی داریان - دانشیارمنابع آب دانشگاه صنعتی خواجه نصیرالدین طوسی دانشکده عمران

خلاصه مقاله:

روش برنامه ریزی پویای استوکاستیک صریح (Stochastic Dynamic Programming) SDP برای حل مسایل پیچیده منابع آب با مشکلاتی نظیر بلای ابعادی و بلای مدلسازی مواجه می شود؛ این مساله موجب گردیده محققانهمواره در پی ارایه و توسعه روشهای مختلف برای حل مسایل بهینه سازی استوکاستیک سیستمهای منابع آب باشند. در این تحقیق روش Q-learning که یکی از تکنیک های الگوریتم یادگیری تقویتی است برای بهره برداری بهینه از یکسیستم مخزن پیشنهاد شده و سپس نتایج آن با نتایج حاصل از روش SDP مقایسه گردیده است. مقایسه سیاست های بهینه مستخرج از این دو روش نشان می دهد که Q-learning در برخورد با پدیده های استوکاستیک جریان رودخانه و مسئله عدم قطعیت دخیل در آن عملکرد بهتری داشته است

کلمات کلیدی:

بهینه سازی استوکاستیک مخزن، یادگیری تقویتی، برنامه ریزی پویای استوکاستیک ، سیاست بهره برداری

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/272796/