روش یادگیری تقویتی دربهینه سازی استوکاستیک سیستم مخزن
عنوان مقاله: روش یادگیری تقویتی دربهینه سازی استوکاستیک سیستم مخزن
شناسه ملی مقاله: ICCAU01_0840
منتشر شده در کنفرانس بین المللی عمران، معماری و توسعه پایدار شهری در سال 1392
شناسه ملی مقاله: ICCAU01_0840
منتشر شده در کنفرانس بین المللی عمران، معماری و توسعه پایدار شهری در سال 1392
مشخصات نویسندگان مقاله:
امیرمحمد مرادی - دانشجوی دکتری دانشگاه صنعتی خواجه نصیرالدین طوسی دانشکده عمران
علیرضا برهانی داریان - دانشیارمنابع آب دانشگاه صنعتی خواجه نصیرالدین طوسی دانشکده عمران
خلاصه مقاله:
امیرمحمد مرادی - دانشجوی دکتری دانشگاه صنعتی خواجه نصیرالدین طوسی دانشکده عمران
علیرضا برهانی داریان - دانشیارمنابع آب دانشگاه صنعتی خواجه نصیرالدین طوسی دانشکده عمران
روش برنامه ریزی پویای استوکاستیک صریح (Stochastic Dynamic Programming) SDP برای حل مسایل پیچیده منابع آب با مشکلاتی نظیر بلای ابعادی و بلای مدلسازی مواجه می شود؛ این مساله موجب گردیده محققانهمواره در پی ارایه و توسعه روشهای مختلف برای حل مسایل بهینه سازی استوکاستیک سیستمهای منابع آب باشند. در این تحقیق روش Q-learning که یکی از تکنیک های الگوریتم یادگیری تقویتی است برای بهره برداری بهینه از یکسیستم مخزن پیشنهاد شده و سپس نتایج آن با نتایج حاصل از روش SDP مقایسه گردیده است. مقایسه سیاست های بهینه مستخرج از این دو روش نشان می دهد که Q-learning در برخورد با پدیده های استوکاستیک جریان رودخانه و مسئله عدم قطعیت دخیل در آن عملکرد بهتری داشته است
کلمات کلیدی: بهینه سازی استوکاستیک مخزن، یادگیری تقویتی، برنامه ریزی پویای استوکاستیک ، سیاست بهره برداری
صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/272796/