بهینه سازی تخصیص بار آلودگی با استفاده از روشهای یادگیری تقویتی

سال انتشار: 1385
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,819

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

WRM02_073

تاریخ نمایه سازی: 2 مرداد 1385

چکیده مقاله:

استفاده از برنامه ریزی پویای استوکستیک (SDP) در مدلهای بهینه سازی بزرگ مقیاس منابع آب به دلیل نیاز به گسسته سازی متغیرهای حالت و تصمیم و در نتیجه بروز مشکل ابعادی با محدودیتهای جدی مواجه است. روش یادگیری تقویتی (RL) یکی از تکنیکهای پیشرفته مبتنی بر شبیه سازی در حل مسائل تصمیم گیری متوالی در محیط استوکستیک است. در این مقاله، مساله بهینه سازی تخصیص بار آلاینده در رودخانه با استفاده از RL حل شده و کارایی روش با مدل SPD مقایسه گردیده است. نتایج نشان دهنده همگرایی مطلوب روش RL درنیل به جواب بهینه مساله تحت بررسی و سرعت بالاتر آن در مقایسه با روش SDP است.

کلیدواژه ها:

یادگیری تقویتی ، برنامه ریزی پویای استوکستیک ، تخصیص بار آلودگی در رودخانه

نویسندگان

بهزاد شریف

دانشجوی کارشناسی ارشد عمران - محیط زیست دانشگاه علم و صنعت ایران

سیدجمشید موسوی

دانشیار دانشکده مهندسی عمران دانشگاه صنعتی امیرکبیر

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Lohani B.N., Hee K.B. (1983), A CCDP model for water ...
  • Takyi A.K, Lence B.J., "Markov chain model for se asonal-water ...
  • Mujumdar P.P, Saxena P, "A strochastic dynamic programming model for ...
  • Sutton R.S., and Barto A.G. 1998, Re inforcement Learning. The ...
  • Gosavi A. 2003, S imul ation-based optimization: parametric optimization techniques ...
  • نمایش کامل مراجع