• شماره ركورد
    1001253
  • عنوان مقاله

    استخراج گذرگاه‌ها با استفاده از تشخيص اشيا در يادگيري تقويتي

  • پديد آورندگان

    غضنفري، بهزاد دانشگاه علم و صنعت ايران - دانشكده مهندسي كامپيوتر , مزيني، ناصر دانشگاه علم و صنعت ايران - دانشكده مهندسي كامپيوتر , جاهد مطلق، محمدرضا دانشگاه علم و صنعت ايران - دانشكده مهندسي كامپيوتر

  • تعداد صفحه
    8
  • از صفحه
    55
  • تا صفحه
    62
  • كليدواژه
    يادگيري تقويتي , خوشه‌بندي اشيا , يادگيري تقويتي سلسله مراتبي , اقدامات گسترش‌يافته زماني
  • چكيده فارسي
    اين مقاله روش جديدي را مطرح مي‌كند كه قادر به استخراج گذرگاه‌ها به‌صورت اتوماتيك براي عامل يادگيري تقويتي است. روش پيشنهادي از سيستم‌هاي بيولوژيكي، رفتار و مسيريابي حيوانات الهام گرفته شده است و به‌ واسطه تعاملات عامل با محيط پيراموني‌اش عمل مي‌كند. عامل با استفاده از خوشه‌بندي و تشخيص اشيا به‌صورت سلسله مراتبي، نشانه‌هايي را پيدا مي‌كند. اگر اين نشانه‌ها در فضاي اقدام به هم نزديك باشند، گذرگاه‌ها با استفاده از حالت‌هاي بين آنها استخراج مي‌شوند. نتايج آزمايش‌ها بهبود قابل ملاحظه‌اي را در فرايند يادگيري تقويتي در مقايسه با ساير روش‌هاي مشابه نشان مي‌دهد.
  • سال انتشار
    1391
  • عنوان نشريه
    مهندسي برق و مهندسي كامپيوتر ايران
  • فايل PDF
    7430386
  • عنوان نشريه
    مهندسي برق و مهندسي كامپيوتر ايران