• شماره ركورد كنفرانس
    5235
  • عنوان مقاله

    طراحي كنترل كننده امن سيستم‌هاي غيرخطي با استفاده از يادگيري تقويتي و بهينه سازي مجموع مربعات

  • پديدآورندگان

    قلي زاده حسين hossein.gholizadeh21@gmail.com دانشگاه علم و صنعت ايران , رضوي احسان ser@aut.ac.ir دانشگاه صنعتي اميركبير , پاك خصال سجاد sajjad_pakkhesal@elec.iust.ac.ir دانشگاه علم و صنعت ايران , شمقدري سعيد shamaghdari@iust.ac.ir دانشگاه علم و صنعت ايران , منهاج محمدباقر menhaj@aut.ac.ir دانشگاه صنعتي اميركبير

  • تعداد صفحه
    7
  • كليدواژه
    - تكرار سياست امن , بهينه سازي مجموع مربعات , ناحيه امن , يادگيري تقويتي امن , سيستم غيرخطي
  • سال انتشار
    1401
  • عنوان كنفرانس
    كنفرانس بين المللي مهندسي برق
  • زبان مدرك
    فارسي
  • چكيده فارسي
    حل مساله مقيد يكي از بزرگ‌ترين چالش‌هاي الگوريتم‌هاي يادگيري تقويتي مي‌باشد. در مساله مقيد چنانچه قيد بر روي حالت‌هاي سيستم باشد به آن مسئله ايمني نيز مي‎گويند. اكثر روش‌هايي كه بهينگي قانون كنترل را تضمين مي‌كنند در مورد ايمني آن ادعايي ندارند و بالعكس. در اين مقاله الگوريتمي براي طراحي كنترل‌كننده امن و بهينه براي يك سيستم غيرخطي پيوسته ارائه مي‌شود. در اين روش، الگوريتم تكرار سياست با استفاده از مفهوم تابع مانع (barrier function) به الگوريتم تكرار سياست امن تبديل مي‌شود. براي حل اين مسئله نيازمند داشتن ناحيه امن و ناحيه داراي تضمين پايداري، در حضور قيدهاي مسئله هستيم. علاوه بر اين يك الگوريتم تكراري ديگر ارائه مي‌شود كه بزرگترين ناحيه امن و با تضمين پايداري را ارائه مي‌كند. اين تضمين داده مي‌شود كه مسير حالت‌هاي سيستم از اين ناحيه خارج ‌نخواهند شد. در الگوريتم تكرار سياست از برنامه‌ريزي مجموع مربعات استفاده شده است كه روشي موثر براي حل مسائل بهينه‌سازي با قيود چند جمله‌اي مي‌باشد. نهايتا كارايي كنترل‌كننده پيشنهاد شده با استفاده از شبيه‌سازي نشان داده شده است.
  • كشور
    ايران