شماره ركورد كنفرانس
3752
عنوان مقاله
مروري بر راهكارهاي بهبود الگوريتم يادگيري تقويتي
پديدآورندگان
شهرياري فولادي مريم mry_sh@yahoo.com دانشكده مهندسي كامپيوتر، واحد نجف آباد، دانشگاه آزاد اسلامي، نجف آباد، ايران. , نورافزا نسيم noorafza@iaun.ac.ir دانشكده مهندسي كامپيوتر، واحد نجف آباد، دانشگاه آزاد اسلامي، نجف آباد، ايران.
تعداد صفحه
8
كليدواژه
الگوريتم يادگيري تقويتي Q , ماژولاريتي , سيستمهاي فازي , شبكه عصبي
سال انتشار
1395
عنوان كنفرانس
اولين كنفرانس بين المللي مهندسي و علوم كامپيوتر
زبان مدرك
فارسي
چكيده فارسي
رباتها و يا عوامل هوشمند به جهت يافتن راهكار و روشي جهت حل مسائل دشوار و كنترل كردن سيستمهاي پيچيده و توزيعشده مورد استفاده قرار ميگيرند. تعامل صحيح بين عوامل و يا محيط پيرامون آنها منجر ميشود تا بتوان در دنياي واقعي از آنها بهره بهتر برد. هر ربات براي بهبود رفتار خود ميتواند از راهكارهاي يادگيري ماشين استفاده كند كه روشهاي بدون مدل براي محيطهاي غيرقابلپيشبيني مناسب به نظر ميرسد. از بين روشهاي يادگيري بدون مدل نيز، روش يادگيري تقويتي Q، محبوبيت بسيار زيادي در طراحي و ساخت رباتها يافته است. به همين جهت در اين مقاله سعي بر آن شده تا علاوه بر معرفي اين روش، كاربردهاي آن در انواع رباتهاي زيرآبي، انساننما، وزنهبردار، بازيكن فوتبال و مسيرياب بررسي گردد. بسياري از محققين راهكارهايي براي ارتقا كيفيت يادگيري نسبت به روش اوليه يادگيري تقويتي Q ارائه دادهاند كه به اجمال به آنها پرداخته خواهد شد.
كشور
ايران
لينک به اين مدرک