شماره ركورد :
1107538
عنوان مقاله :
كاربرد يادگيري تقويتي در يك مدل‌سازي عامل‌محور براي بازار عمده‌فروشي برق ايران
پديد آورندگان :
اصغري اسكوئي ، محمدرضا دانشگاه علامه طباطبائي - دانشكده علوم رياضي و رايانه - گروه علوم رايانه , فلاحي ، فرهاد دانشگاه شاهد و پژوهشگر پژوهشگاه نيرو , دوستي‌زاده ، ميثم دانشگاه لرستان - دانشكده فني و مهندسي , مشيري ، سعيد دانشگاه علامه طباطبائي - گروه اقتصاد نظري
تعداد صفحه :
40
از صفحه :
1
تا صفحه :
40
كليدواژه :
مدل‌سازي عامل‌محور , بازار برق , يادگيري تقويتي , نظريه بازي‌ها , ايران
چكيده فارسي :
مطالعات اخير بازارهاي عمده‌فروشي برق عموماً براساس مدل‌هاي چندعاملي است، كه در آن‌ها تعادل بازار برپايه  رقابت و تعامل عوامل متعدد با يك ديگر به دست مي‌آيد. از ويژگي‌هاي اصلي اين نوع مدل‌ها، امكان يادگيري عوامل از نتايج رفتار خود و سايرين دريك محيط رقابتي است. در بازار عمده‌فروشي برق، هرعامل يك واحد توليدكننده برق است كه به صورت مستقل و هوشمند با ساير عامل‌ها براي عرضه برق با قيمت‌هاي پيشنهادي رقابت مي‌كند. فرآيند قيمت‌گذاري را مي‌توان يك بازي ايستا فرض نمود كه هرروز تكرار مي‌شود. در اين بازي هر عامل قيمت پيشنهادي خود را مستقلا اعلام نموده و بهره‌بردار با توجه به تقاضاي بار مصرفي و محدوديت‌ها، بهترين پيشنهادها را انتخاب مي‌نمايد. عامل به صورت عقلائي عمل نموده و با انتخاب استراتژي مناسب، به دنبال بيشينه نمودن سود بلندمدت خود است. در اين راستا، عامل از قدرت يادگيري و بهبود استراتژي قيمت‌گذاري، كه نقش بسيار تعيين كننده در موفقيت عامل دارد، استفاده مي‌كند. يادگيري تقويتي يك روش كلاسيك است كه در مدل‌هاي چندعاملي امكان يادگيري مبتني بر سعي و خطا را فراهم مي‌نمايد. هدف اين مقاله كاربرد و مطالعه روش‌هاي يادگيري تقويتي در مدل چندعاملي بازار برق ايران و مقايسه آن‌ها با دو استراتژي تصادفي و حريصانه است. در اين مطالعه، ميزان سود واحدها و زمان رسيدن به حالت تعادل به عنوان ملاك ارزيابي در نظر گرفته شده است. نتايج شبيه سازي نشان مي‌دهد، استراتژي يادگيرنده سود عامل‌ها را به طور معناداري افزايش مي‌دهد و سرعت همگرائي به حالت تعادل را بيشتر مي‌كند.
عنوان نشريه :
پژوهشنامه اقتصاد انرژي ايران
لينک به اين مدرک :
بازگشت