عنوان مقاله :
استخراج گذرگاهها با استفاده از تشخيص اشيا در يادگيري تقويتي
پديد آورندگان :
غضنفري، بهزاد دانشگاه علم و صنعت ايران - دانشكده مهندسي كامپيوتر , مزيني، ناصر دانشگاه علم و صنعت ايران - دانشكده مهندسي كامپيوتر , جاهد مطلق، محمدرضا دانشگاه علم و صنعت ايران - دانشكده مهندسي كامپيوتر
كليدواژه :
يادگيري تقويتي , خوشهبندي اشيا , يادگيري تقويتي سلسله مراتبي , اقدامات گسترشيافته زماني
چكيده فارسي :
اين مقاله روش جديدي را مطرح ميكند كه قادر به استخراج گذرگاهها بهصورت اتوماتيك براي عامل يادگيري تقويتي است. روش پيشنهادي از سيستمهاي بيولوژيكي، رفتار و مسيريابي حيوانات الهام گرفته شده است و به واسطه تعاملات عامل با محيط پيرامونياش عمل ميكند. عامل با استفاده از خوشهبندي و تشخيص اشيا بهصورت سلسله مراتبي، نشانههايي را پيدا ميكند. اگر اين نشانهها در فضاي اقدام به هم نزديك باشند، گذرگاهها با استفاده از حالتهاي بين آنها استخراج ميشوند. نتايج آزمايشها بهبود قابل ملاحظهاي را در فرايند يادگيري تقويتي در مقايسه با ساير روشهاي مشابه نشان ميدهد.
عنوان نشريه :
مهندسي برق و مهندسي كامپيوتر ايران
عنوان نشريه :
مهندسي برق و مهندسي كامپيوتر ايران