عنوان :
كاربرد يادگيري تقويتي در كنترل سيستم هاي پويا
پديدآورندگان :
كاتبي سراج الدين نويسنده , شادي مهديه نويسنده
نام دانشگاه :
دانشگاه شيراز
كليدواژه زبان طبيعي :
يادگيري تقويتي شبكه عصبي كنترل مهندسي رده مهندسي
چكيده :
روشهاي طراحي در زمينه كنترل اغلب به يك مدل رياضي دقيق براي Plant نيا دارند كه در اكثر مسايل قابل دسترس نمي باشد الگوريتمهاي يادگيري تقويتي بدون نياز به مدل سيستم ، قادر به يادگيري و بهبود كارايي آن مي باشند. يادگيري تقويتي ، ساختار ساده اي از يادگيري است كه از طريق ارتباط متقابل با محيط به هدف مي رسد. در اين شيوه ، يك عامل با استفاده از نتجه اعمال خود در محيط ياد مي گيرد. در اين پايان نامه روش يادگيري تقويتي جهت بهبود سيستم هاي مورد بررسي قرار گرفته است . كنترلر براساس روش عملگر - نقاد و الگوريتم يادگيري ... يكي از روشهاي يادگيري تقويتي طراحي شده است . عملگر كه با يك شبكه عصبي ... دو لايه پياده سازي شده به عنوان كنترلر در سيستم قرار مي گيرد. تحقيقات نشان ميدهد كه اين روش يادگيري به ايجاد كنترلرهاي موثري مي باشد. همچنين روشي كه در اين پايان نامه مورد استفاده قرار گرفته در مقايسه با تحقيقات گذشته نتايج بهتري به دنبال داشته باشد.