شماره ركورد كنفرانس :
3985
عنوان مقاله :
طراحي مانور گريز دوبعدي هواپيما با استفاده از يادگيري تقويتي عميق
عنوان به زبان ديگر :
Planar Evasive Aircrafts Maneuvers Using Deep Reinforcement Learning
پديدآورندگان :
محمدي جهانبخش jhanbksh.mohammadi@gmail.com كارشناسارشد هوش مصنوعي، تهران , حسين زاده سعيد jh_mohammadi@comp.iust.ac.ir كارشناس ارشد الكترونيك ، تهران
كليدواژه :
ناوبري متناسب خالص , يادگيري Q , شبكه عميق , مانور گريز , يادگيري تقويتي
عنوان كنفرانس :
دومين كنفرانس بين المللي مكانيك و هوافضا
چكيده فارسي :
در اين پژوهش از تكنيك يادگيري تقويتي عميق براي طراحي يك استراتژي گريز هواپيما از يك درگيري استفاده شده است. براي بيان معادلات حركت هواپيما و موشك از مدلهاي ساده جرم نقطهايي استفاده شده است. موشك با استفاده از قانون هدايت ناوبري متناسب خالص (PPNG) به هواپيما حمله مي¬كند. ما يك الگوريتم يادگيري تقويتي عميق براي بدست آوردن سياست تعامل هواپيما در محيط استفاده كرده¬ايم. هواپيما در هر لحظه از زمان يك تصوير از محيط را دريافت خواهد كرد و براساس اين تصاوير شبكه عميق آموزش داده شده و سياست تعامل با محيط را ياد خواهد گرفت. نتايج شبيهسازي بيانگر اين است كه اين الگوريتم توانايي انجام بلادرنگ مانور گريز را دارد
چكيده لاتين :
In this research we used deep reinforcement learning proposed to implement evasive strategies for aircrafts during engagement. A simplified point-mass model is used to describe the aircraft and the missile equations of motion. The missile follows the pure proportional navigation guidance (PPNG) law to attack the aircraft. In this paper aircraft at each timesteps received an image from environment then train deep neural network based them and learned policy from it.