شماره ركورد كنفرانس :
3528
عنوان مقاله :
بهينه سازي جريان هاي ترافيكي در يك تقاطع توسط الگوريتم يادگيري تقويتي با حذف جدول حالت و عمل
پديدآورندگان :
عربي عليرضا دانشگاه صنعتي سجاد , نوري امين دانشگاه صنعتي سجاد
كليدواژه :
شبكه عصبي , يادگيري تقويتي , كنترل سيگنال ترافيك
سال انتشار :
ارديبهشت 1397
عنوان كنفرانس :
بيست و ششمين كنفرانس مهندسي برق ايران
چكيده فارسي :
رشد جمعيت و افزايش وسايل نقليه در شهرها، موجب افزايش مدت زمان سفرهاي داخلي، افزايش مصرف سوخت، افزايش آلودگي هاي محيط زيستي و
مسدود شدن تقاطع ها شده است براي مقابله. با اين مشكلات و افزايش كارايي زير ساخت هاي فعلي از سيستمهاي هوشمند كنترل ترافيك استفاده مي شود. ترافيك
داراي ماهيت پويا و تصادفي است، به همين دليل استفاده از يادگيري تقويتي به عنوان يك سيستم هوشمند براي كنترل ترافيك حائز اهميت مي باشد، اما ساختار
داخلي اين كنترل كننده (جدول حالت-عمل) موجب كاهش سرعت يادگيري در محيط هاي ترافيكي با پويايي بالا (تعداد حالت و عمل زياد) مي شود و در مواردي
عامل يادگيرنده به علت بزرگي اين جدول درگير نفرين ابعاد مي شود و عمل يادگيري اتفاق نمي افتد. در اين مقاله براي اولين بار، با ارائه يك روش جديد بر پايه
تركيب شبكه عصبي و يادگيري تقويتي موجب حذف جدول حالت و عمل و ارزش دهي اعمال و سياست شده است. همچنين اين روش، سرعت همگرايي عامل
يادگيرنده را به نسبت به روش يادگيري تقويتي بدون شبكه عصبي تا 97 درصد افزايش و با تعداد كم آموزش، عملكرد مطلوب را ارايه داده است.