طراحي كنترل كننده امن سيستم‌هاي غيرخطي با استفاده از يادگيري تقويتي و بهينه سازي مجموع مربعات

پديدآورندگان

قلي زاده حسين hossein.gholizadeh21@gmail.com دانشگاه علم و صنعت ايران , رضوي احسان ser@aut.ac.ir دانشگاه صنعتي اميركبير , پاك خصال سجاد sajjad_pakkhesal@elec.iust.ac.ir دانشگاه علم و صنعت ايران , شمقدري سعيد shamaghdari@iust.ac.ir دانشگاه علم و صنعت ايران , منهاج محمدباقر menhaj@aut.ac.ir دانشگاه صنعتي اميركبير

تعداد صفحه

كليدواژه

- تكرار سياست امن , بهينه سازي مجموع مربعات , ناحيه امن , يادگيري تقويتي امن , سيستم غيرخطي

سال انتشار

1401

عنوان كنفرانس

كنفرانس بين المللي مهندسي برق

زبان مدرك

فارسي

چكيده فارسي

حل مساله مقيد يكي از بزرگ‌ترين چالش‌هاي الگوريتم‌هاي يادگيري تقويتي مي‌باشد. در مساله مقيد چنانچه قيد بر روي حالت‌هاي سيستم باشد به آن مسئله ايمني نيز مي‎گويند. اكثر روش‌هايي كه بهينگي قانون كنترل را تضمين مي‌كنند در مورد ايمني آن ادعايي ندارند و بالعكس. در اين مقاله الگوريتمي براي طراحي كنترل‌كننده امن و بهينه براي يك سيستم غيرخطي پيوسته ارائه مي‌شود. در اين روش، الگوريتم تكرار سياست با استفاده از مفهوم تابع مانع (barrier function) به الگوريتم تكرار سياست امن تبديل مي‌شود. براي حل اين مسئله نيازمند داشتن ناحيه امن و ناحيه داراي تضمين پايداري، در حضور قيدهاي مسئله هستيم. علاوه بر اين يك الگوريتم تكراري ديگر ارائه مي‌شود كه بزرگترين ناحيه امن و با تضمين پايداري را ارائه مي‌كند. اين تضمين داده مي‌شود كه مسير حالت‌هاي سيستم از اين ناحيه خارج ‌نخواهند شد. در الگوريتم تكرار سياست از برنامه‌ريزي مجموع مربعات استفاده شده است كه روشي موثر براي حل مسائل بهينه‌سازي با قيود چند جمله‌اي مي‌باشد. نهايتا كارايي كنترل‌كننده پيشنهاد شده با استفاده از شبيه‌سازي نشان داده شده است.

كشور

ايران

لينک به اين مدرک

https://search.isc.ac/dl/search/defaultta.aspx?DTC=36&DC=339657