شماره ركورد كنفرانس
5235
عنوان مقاله
طراحي كنترل كننده امن سيستمهاي غيرخطي با استفاده از يادگيري تقويتي و بهينه سازي مجموع مربعات
پديدآورندگان
قلي زاده حسين hossein.gholizadeh21@gmail.com دانشگاه علم و صنعت ايران , رضوي احسان ser@aut.ac.ir دانشگاه صنعتي اميركبير , پاك خصال سجاد sajjad_pakkhesal@elec.iust.ac.ir دانشگاه علم و صنعت ايران , شمقدري سعيد shamaghdari@iust.ac.ir دانشگاه علم و صنعت ايران , منهاج محمدباقر menhaj@aut.ac.ir دانشگاه صنعتي اميركبير
تعداد صفحه
7
كليدواژه
- تكرار سياست امن , بهينه سازي مجموع مربعات , ناحيه امن , يادگيري تقويتي امن , سيستم غيرخطي
سال انتشار
1401
عنوان كنفرانس
كنفرانس بين المللي مهندسي برق
زبان مدرك
فارسي
چكيده فارسي
حل مساله مقيد يكي از بزرگترين چالشهاي الگوريتمهاي يادگيري تقويتي ميباشد. در مساله مقيد چنانچه قيد بر روي حالتهاي سيستم باشد به آن مسئله ايمني نيز ميگويند. اكثر روشهايي كه بهينگي قانون كنترل را تضمين ميكنند در مورد ايمني آن ادعايي ندارند و بالعكس. در اين مقاله الگوريتمي براي طراحي كنترلكننده امن و بهينه براي يك سيستم غيرخطي پيوسته ارائه ميشود. در اين روش، الگوريتم تكرار سياست با استفاده از مفهوم تابع مانع (barrier function) به الگوريتم تكرار سياست امن تبديل ميشود. براي حل اين مسئله نيازمند داشتن ناحيه امن و ناحيه داراي تضمين پايداري، در حضور قيدهاي مسئله هستيم. علاوه بر اين يك الگوريتم تكراري ديگر ارائه ميشود كه بزرگترين ناحيه امن و با تضمين پايداري را ارائه ميكند. اين تضمين داده ميشود كه مسير حالتهاي سيستم از اين ناحيه خارج نخواهند شد. در الگوريتم تكرار سياست از برنامهريزي مجموع مربعات استفاده شده است كه روشي موثر براي حل مسائل بهينهسازي با قيود چند جملهاي ميباشد. نهايتا كارايي كنترلكننده پيشنهاد شده با استفاده از شبيهسازي نشان داده شده است.
كشور
ايران
لينک به اين مدرک