بهینه سازی بر مبنای شبیه سازی در بهره برداری از مخازن سدها: رویکرد یادگیری تقویتی

بهزاد, شریف; سیدجمشید, موسوی

بهینه سازی بر مبنای شبیه سازی در بهره برداری از مخازن سدها: رویکرد یادگیری تقویتی

عنوان مقاله: بهینه سازی بر مبنای شبیه سازی در بهره برداری از مخازن سدها: رویکرد یادگیری تقویتی
شناسه ملی مقاله: WRM02_072
منتشر شده در دومین کنفرانس مدیریت منابع آب در سال 1385

مشخصات نویسندگان مقاله:

بهزاد شریف - دانشجوی کارشناسی ارشد عمران - محیط زیست دانشگاه علم و صنعت ایران
سیدجمشید موسوی - دانشیار دانشکده مهندسی عمران دانشگاه صنعتی امیرکبیر

خلاصه مقاله:

استفاده از برنامه ریزی پویای استوکستیک (SDP) در بهینه سازی مسائل بزرگ مقیاس بهره برداری از مخازن سدها به دلیل نیاز به گسسته سازی متغیرهای حالت و تصمیم، و در نتیجه مشکل ابعادی با محدودیتهای جدی مواجه است. روش یادگیری تقویتی (RL) یکی از تکنیک های پیشرفته در حل مسائل تصمیم گیری متوالی در محیط استوکستیک و مبتنی بر شبیه سازی است. RL می تواند باپیدا کردن سیاست بهینه برای حالتهایی از سیستم که درواقعیت بیشتر رخ می دهند به جوابهای نزدیک به جواب بهینه، در زمان قابل قبول نایل شود. در این مقاله، مساله بهینه سازی بهره برداری از سد مخزنی چراغ ویس واقع در استان کردستان به عنوان مطالعه موردی با استفاده از روش RL مطالعه شده و با روش SDP مقایسه گردیده است. نتایج نشان دهنده همگرایی مطلوب روش RL در نیل به جواب بهینه است.

کلمات کلیدی:

یادگیری تقویتی ، برنامه ریزی پویا ، بهره برداری از مخزن

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/13336/