شماره ركورد كنفرانس :
2742
عنوان مقاله :
بهينه سازي تخصيص بار آلودگي در رودخانه با استفاده از روشهاي يادگيري تقويتي
پديدآورندگان :
شريف بهزاد نويسنده , موسوي جمشيد نويسنده
كليدواژه :
تخصيص بار آلودگي در رودخانه , يادگيري تقويتي , برنامه ريزي پوياي استوكستيك
عنوان كنفرانس :
دومين كنفرانس مديريت منابع آب ايران
چكيده فارسي :
استفاده از برنامه ریزی پویای استوكستیك (SDP) در مدلهای بهینه سازی بزرگ مقیاس منابع آب به دلیل نیاز به گسسته سازی متغیرهای حالت و تصمیم و در نتیجه بروز مشكل ابعادی با محدودیتهای جدی مواجه است. روش یادگیری تقویتی (RL) یكی از تكنیكهای پیشرفته مبتنی بر شبیه سازی در حل مسائل تصمیم گیری متوالی در محیط استوكستیك است. در این مقاله، مساله بهینه سازی تخصیص بار آلاینده در رودخانه با استفاده از RL حل شده و كارایی روش با مدل SPD مقایسه گردیده است. نتایج نشان دهنده همگرایی مطلوب روش RL درنیل به جواب بهینه مساله تحت بررسی و سرعت بالاتر آن در مقایسه با روش SDP است.
شماره مدرك كنفرانس :
4461017