شماره ركورد
1363356
عنوان مقاله
بيشينه سازي امتياز در بازي تصادفي match-3 با استفاده از يادگيري تقويتي عميق
پديد آورندگان
افروغ ، علي دانشگاه تربيت مدرس - دانشكده مهندسي برق و كامپيوتر , رعايائي اردكاني ، مهدي دانشگاه تربيت مدرس - دانشكده مهندسي برق و كامپيوتر
از صفحه
129
تا صفحه
140
كليدواژه
يادگيري تقويتي عميق , بازي تصادفي , فضاي حالت بزرگ , match-3
چكيده فارسي
بازيهاي رايانهاي در سال هاي اخير نقش مهمي در پيشرفت هوش مصنوعي داشتهاند. بازيها به عنوان محيطي مناسب براي آزمون و خطا، آزمايش ايدهها و الگوريتمهاي مختلف هوش مصنوعي مورد استفاده قرار گرفتهاند. بازي match-3 يك سبك از بازيهاي محبوب در تلفنهاي همراه است كه از فضاي حالت تصادفي و بسيار بزرگ تشكيل شده كه عمل يادگيري در آن را دشوار ميكند. در اين مقاله يك عامل هوشمند مبتني بر يادگيري تقويتي عميق ارائه ميشود كه هدف آن بيشينهسازي امتياز در بازي match-3 است. در تعريف عامل پيشنهادي از نگاشت فضاي عمل، حالت و همچنين ساختار شبكه عصبي مبتكرانهاي براي محيط بازي match-3 استفاده ميشود كه توانايي يادگيري حالتهاي زياد را داشته باشد. مقايسه روش پيشنهادي با ساير روشهاي موجود از جمله روش يادگيري تقويتي مبتني بر سياست، روش يادگيري تقويتي مبتني بر ارزش، روشهاي حريصانه و عامل انساني نشان از عملكرد برتر روش پيشنهادي در بازي match-3 دارد.
عنوان نشريه
پردازش علائم و داده ها
عنوان نشريه
پردازش علائم و داده ها
لينک به اين مدرک