شماره ركورد كنفرانس :
2742
عنوان مقاله :
بهينه سازي بر مبناي شبيه سازي در بهره برداري از مخازن سدها: رويكرد يادگيري تقويتي
پديدآورندگان :
شريف بهزاد نويسنده , موسوي جمشيد نويسنده
كليدواژه :
برنامه ريزي پويا , بهره برداري از مخزن , يادگيري تقويتي
عنوان كنفرانس :
دومين كنفرانس مديريت منابع آب ايران
چكيده فارسي :
استفاده از برنامه ریزی پویای استوكستیك (SDP) در بهینه سازی مسائل بزرگ مقیاس بهره برداری از مخازن سدها به دلیل نیاز به گسسته سازی متغیرهای حالت و تصمیم، و در نتیجه مشكل ابعادی با محدودیتهای جدی مواجه است. روش یادگیری تقویتی (RL) یكی از تكنیك های پیشرفته در حل مسائل تصمیم گیری متوالی در محیط استوكستیك و مبتنی بر شبیه سازی است. RL می تواند باپیدا كردن سیاست بهینه برای حالتهایی از سیستم كه درواقعیت بیشتر رخ می دهند به جوابهای نزدیك به جواب بهینه، در زمان قابل قبول نایل شود. در این مقاله، مساله بهینه سازی بهره برداری از سد مخزنی چراغ ویس واقع در استان كردستان به عنوان مطالعه موردی با استفاده از روش RL مطالعه شده و با روش SDP مقایسه گردیده است. نتایج نشان دهنده همگرایی مطلوب روش RL در نیل به جواب بهینه است.
شماره مدرك كنفرانس :
4461017