• شماره ركورد كنفرانس
    5235
  • عنوان مقاله

    طراحي تنظيم‌كننده‌ي خروجي بهينه‌ي مبتني بر يادگيري تقويتي ايمن با استفاده از تابع مانع كنترلي نمايي

  • پديدآورندگان

    اصغري سيدرضا sr_asghari@elec.iust.ac.ir دانشجوي كارشناسي ارشد، دانشگاه علم و صنعت ايران، دانشكده مهندسي برق , شمقدري سعيد shamaghdari@iust.ac.ir استاديار، دانشگاه علم و صنعت ايران، دانشكده مهندسي برق

  • تعداد صفحه
    8
  • كليدواژه
    ايمني , تابع مانع كنترلي نمايي , تنظيم‌كننده‌ي خروجي بهينه , سيستم چهار-تانك , سيستم دو-تانك , يادگيري تقويتي
  • سال انتشار
    1401
  • عنوان كنفرانس
    كنفرانس بين المللي مهندسي برق
  • زبان مدرك
    فارسي
  • چكيده فارسي
    يكي از روش‌هاي حل مسئله تنظيم‌كننده‌ي خروجي بهينه براي يك سيستم زمان-گسسته، استفاده از كنترل‌كننده‌ مبتني بر يادگيري تقويتي مي‌باشد و اين در حالي است كه در حضور محدوديت‌هاي ايمني، اين امكان وجود دارد كه استفاده از آن كنترل‌كننده، سبب بروز رفتارهاي پرخطر در كاربردهاي دنياي واقعي گردد. از اين رو، در اين مقاله، ضمن تبيين الگوريتم off-policy مستقل از مدل، فيلتر مبتني بر تابع مانع كنترلي نمايي به منظور تحقق محدوديت‌هاي ايمني، معرفي مي‌گردد. اين فيلتر، در قالب يك مسئله بهينه‌سازي مرتبه-دوم، با توسعه مفهوم تابع مانع كنترلي نمايي و تركيب آن با رگرسيون فرآيند گوسي، اين امكان را ايجاد مي‌كند كه محدوديت‌هاي مدنظر براي ورودي‌هاي كنترلي و حالت‌هاي سيستم، تحقق يابد. نتايج حاصل از اعتبارسنجي رويكرد پيشنهادي در كنترل سيستم‌هاي چهار-تانك و دو-تانك نشان مي‌دهند كه رويكرد مدنظر با طراحي ورودي كنترلي مناسب توانايي لازم براي دفع اغتشاش و رديابي مسير مرجع را دارد و تحقق محدوديت‌هاي مدنظر را نيز تضمين مي‌نمايد.
  • كشور
    ايران