شماره ركورد كنفرانس :
3528
عنوان مقاله :
بهينه سازي جريان هاي ترافيكي در يك تقاطع توسط الگوريتم يادگيري تقويتي با حذف جدول حالت و عمل
پديدآورندگان :
عربي عليرضا دانشگاه صنعتي سجاد , نوري امين دانشگاه صنعتي سجاد
كليدواژه :
شبكه عصبي , يادگيري تقويتي , كنترل سيگنال ترافيك
سال انتشار :
ارديبهشت 1397
عنوان كنفرانس :
بيست و ششمين كنفرانس مهندسي برق ايران
زبان مدرك :
فارسي
چكيده فارسي :
رشد جمعيت و افزايش وسايل نقليه در شهرها، موجب افزايش مدت زمان سفرهاي داخلي، افزايش مصرف سوخت، افزايش آلودگي هاي محيط زيستي و مسدود شدن تقاطع ها شده است براي مقابله. با اين مشكلات و افزايش كارايي زير ساخت هاي فعلي از سيستمهاي هوشمند كنترل ترافيك استفاده مي شود. ترافيك داراي ماهيت پويا و تصادفي است، به همين دليل استفاده از يادگيري تقويتي به عنوان يك سيستم هوشمند براي كنترل ترافيك حائز اهميت مي باشد، اما ساختار داخلي اين كنترل كننده (جدول حالت-عمل) موجب كاهش سرعت يادگيري در محيط هاي ترافيكي با پويايي بالا (تعداد حالت و عمل زياد) مي شود و در مواردي عامل يادگيرنده به علت بزرگي اين جدول درگير نفرين ابعاد مي شود و عمل يادگيري اتفاق نمي افتد. در اين مقاله براي اولين بار، با ارائه يك روش جديد بر پايه تركيب شبكه عصبي و يادگيري تقويتي موجب حذف جدول حالت و عمل و ارزش دهي اعمال و سياست شده است. همچنين اين روش، سرعت همگرايي عامل يادگيرنده را به نسبت به روش يادگيري تقويتي بدون شبكه عصبي تا 97 درصد افزايش و با تعداد كم آموزش، عملكرد مطلوب را ارايه داده است.
كشور :
ايران
تعداد صفحه 2 :
8
از صفحه :
1
تا صفحه :
8
لينک به اين مدرک :
بازگشت