عنوان مقاله :
كاربرد يادگيري تقويتي در يك مدلسازي عاملمحور براي بازار عمدهفروشي برق ايران
پديد آورندگان :
اصغري اسكوئي ، محمدرضا دانشگاه علامه طباطبائي - دانشكده علوم رياضي و رايانه - گروه علوم رايانه , فلاحي ، فرهاد دانشگاه شاهد و پژوهشگر پژوهشگاه نيرو , دوستيزاده ، ميثم دانشگاه لرستان - دانشكده فني و مهندسي , مشيري ، سعيد دانشگاه علامه طباطبائي - گروه اقتصاد نظري
كليدواژه :
مدلسازي عاملمحور , بازار برق , يادگيري تقويتي , نظريه بازيها , ايران
چكيده فارسي :
مطالعات اخير بازارهاي عمدهفروشي برق عموماً براساس مدلهاي چندعاملي است، كه در آنها تعادل بازار برپايه رقابت و تعامل عوامل متعدد با يك ديگر به دست ميآيد. از ويژگيهاي اصلي اين نوع مدلها، امكان يادگيري عوامل از نتايج رفتار خود و سايرين دريك محيط رقابتي است. در بازار عمدهفروشي برق، هرعامل يك واحد توليدكننده برق است كه به صورت مستقل و هوشمند با ساير عاملها براي عرضه برق با قيمتهاي پيشنهادي رقابت ميكند. فرآيند قيمتگذاري را ميتوان يك بازي ايستا فرض نمود كه هرروز تكرار ميشود. در اين بازي هر عامل قيمت پيشنهادي خود را مستقلا اعلام نموده و بهرهبردار با توجه به تقاضاي بار مصرفي و محدوديتها، بهترين پيشنهادها را انتخاب مينمايد. عامل به صورت عقلائي عمل نموده و با انتخاب استراتژي مناسب، به دنبال بيشينه نمودن سود بلندمدت خود است. در اين راستا، عامل از قدرت يادگيري و بهبود استراتژي قيمتگذاري، كه نقش بسيار تعيين كننده در موفقيت عامل دارد، استفاده ميكند. يادگيري تقويتي يك روش كلاسيك است كه در مدلهاي چندعاملي امكان يادگيري مبتني بر سعي و خطا را فراهم مينمايد. هدف اين مقاله كاربرد و مطالعه روشهاي يادگيري تقويتي در مدل چندعاملي بازار برق ايران و مقايسه آنها با دو استراتژي تصادفي و حريصانه است. در اين مطالعه، ميزان سود واحدها و زمان رسيدن به حالت تعادل به عنوان ملاك ارزيابي در نظر گرفته شده است. نتايج شبيه سازي نشان ميدهد، استراتژي يادگيرنده سود عاملها را به طور معناداري افزايش ميدهد و سرعت همگرائي به حالت تعادل را بيشتر ميكند.
عنوان نشريه :
پژوهشنامه اقتصاد انرژي ايران