• شماره ركورد
    1363356
  • عنوان مقاله

    بيشينه سازي امتياز در بازي تصادفي match-3 با استفاده از يادگيري تقويتي عميق

  • پديد آورندگان

    افروغ ، علي دانشگاه تربيت مدرس - دانشكده مهندسي برق و كامپيوتر , رعايائي اردكاني ، مهدي دانشگاه تربيت مدرس - دانشكده مهندسي برق و كامپيوتر

  • از صفحه
    129
  • تا صفحه
    140
  • كليدواژه
    يادگيري تقويتي عميق , بازي تصادفي , فضاي حالت بزرگ , match-3
  • چكيده فارسي
    بازي‌هاي رايانه‌اي در سال ‌هاي اخير نقش مهمي در پيشرفت هوش مصنوعي داشته‌اند. بازي‌ها به عنوان محيطي مناسب براي آزمون و خطا، آزمايش ايده‌ها و الگوريتم‌هاي مختلف هوش مصنوعي مورد استفاده قرار گرفته‌اند. بازي match-3 يك سبك از بازي‌هاي محبوب در تلفن‌هاي همراه است كه از فضاي حالت تصادفي و بسيار بزرگ تشكيل شده كه عمل يادگيري در آن را دشوار مي‌كند. در اين مقاله يك عامل هوشمند مبتني بر يادگيري تقويتي عميق ارائه مي‌شود كه هدف آن بيشينه‌سازي امتياز در بازي match-3 است. در تعريف عامل پيشنهادي از نگاشت فضاي عمل، حالت و همچنين ساختار شبكه عصبي مبتكرانه‌اي براي محيط بازي match-3 استفاده مي‌شود كه توانايي يادگيري حالت‌هاي زياد را داشته باشد. مقايسه روش پيشنهادي با ساير روش‌هاي موجود از جمله روش‌ يادگيري تقويتي مبتني بر سياست، روش يادگيري تقويتي مبتني بر ارزش، روش‌هاي حريصانه و عامل انساني نشان از عملكرد برتر روش پيشنهادي در بازي match-3 دارد.
  • عنوان نشريه
    پردازش علائم و داده ها
  • عنوان نشريه
    پردازش علائم و داده ها