• شماره ركورد
    1119910
  • عنوان مقاله

    بهبود شبكه عميق R-FCN در آشكارسازي و برچسب‎زني اشياء

  • پديد آورندگان

    قنبري سرخي ، علي دانشگاه صنعتي شاهرود , حسن پور ، حميد دانشگاه صنعتي شاهرود - دانشكده مهندسي كامپيوتر , فاتح ، منصور دانشگاه صنعتي شاهرود - دانشكده مهندسي كامپيوتر

  • تعداد صفحه
    17
  • از صفحه
    43
  • تا صفحه
    59
  • كليدواژه
    ‏ آشكارسازي و شناسايي اشياء , R-FCN , يادگيري عميق , ماشين بردار پشتيبان دودويي فازي , اختلاف كوشي-شوارتز
  • چكيده فارسي
    امروزه آشكارسازي و برچسب‎زني اشياء در تصاوير يكي از چالش‎هاي اساسي در برخي از كاربردهاي بينايي‎ماشين مي‎باشد. در سال‎هاي اخير استفاده از يادگيري عميق مورد توجه محققان قرار گرفته است. در همين راستا، در اين مقاله ابتدا جديدترين شبكه‎هاي عميق موجود معرفي، سپس نقاط قوت و ضعف آنها تحليل مي‌شود. در ادامه شبكه‎اي بهبود يافته از شبكه RFCN ارائه مي‎شود. روش پيشنهادي بر پايه معماري ResNet و شبكه تمام كانولوشن است. در اين روش، معماري جديدي مبتني بر شبكه عميق براي پيشنهاد ناحيه كانديد و روشي تركيبي مبتني بر SVMفازي دوكلاسه و SVR براي آشكارسازي و برچسب‎زني اشياء ارائه شده است. در اين روش از تابع زيان جديد با عنوان اختلاف كوشيشوارتز استفاده شده است. اين تابع زيان از لحاظ سرعت و دقت، عملكرد بهتري از خود نشان داده است. روش پيشنهادي با معماري 101ResNet بر روي مجموعه داده SUN براي آشكارسازي و برچسب‎زني 36 شي مورد آزمايش قرار گرفت و نتايج بدست آمده نشان دهنده بهبود عملكرد اين روش نسبت به روش پايه شبكه RFCN است. روش پيشنهادي از لحاظ معيار mAP، عملكرد 48/38% و مدت زمان متوسط براي هر تصوير 0/13 را دارد، و نسبت به بهترين روش در اين حوزه تقريبا 2% در عملكرد و 0/4 ثانيه در زمان بهتر عمل كرده است.
  • عنوان نشريه
    مجله ماشين بينايي