شماره ركورد كنفرانس
5235
عنوان مقاله
طراحي تنظيمكنندهي خروجي بهينهي مبتني بر يادگيري تقويتي ايمن با استفاده از تابع مانع كنترلي نمايي
پديدآورندگان
اصغري سيدرضا sr_asghari@elec.iust.ac.ir دانشجوي كارشناسي ارشد، دانشگاه علم و صنعت ايران، دانشكده مهندسي برق , شمقدري سعيد shamaghdari@iust.ac.ir استاديار، دانشگاه علم و صنعت ايران، دانشكده مهندسي برق
تعداد صفحه
8
كليدواژه
ايمني , تابع مانع كنترلي نمايي , تنظيمكنندهي خروجي بهينه , سيستم چهار-تانك , سيستم دو-تانك , يادگيري تقويتي
سال انتشار
1401
عنوان كنفرانس
كنفرانس بين المللي مهندسي برق
زبان مدرك
فارسي
چكيده فارسي
يكي از روشهاي حل مسئله تنظيمكنندهي خروجي بهينه براي يك سيستم زمان-گسسته، استفاده از كنترلكننده مبتني بر يادگيري تقويتي ميباشد و اين در حالي است كه در حضور محدوديتهاي ايمني، اين امكان وجود دارد كه استفاده از آن كنترلكننده، سبب بروز رفتارهاي پرخطر در كاربردهاي دنياي واقعي گردد. از اين رو، در اين مقاله، ضمن تبيين الگوريتم off-policy مستقل از مدل، فيلتر مبتني بر تابع مانع كنترلي نمايي به منظور تحقق محدوديتهاي ايمني، معرفي ميگردد. اين فيلتر، در قالب يك مسئله بهينهسازي مرتبه-دوم، با توسعه مفهوم تابع مانع كنترلي نمايي و تركيب آن با رگرسيون فرآيند گوسي، اين امكان را ايجاد ميكند كه محدوديتهاي مدنظر براي وروديهاي كنترلي و حالتهاي سيستم، تحقق يابد. نتايج حاصل از اعتبارسنجي رويكرد پيشنهادي در كنترل سيستمهاي چهار-تانك و دو-تانك نشان ميدهند كه رويكرد مدنظر با طراحي ورودي كنترلي مناسب توانايي لازم براي دفع اغتشاش و رديابي مسير مرجع را دارد و تحقق محدوديتهاي مدنظر را نيز تضمين مينمايد.
كشور
ايران
لينک به اين مدرک