شماره ركورد :
1119910
عنوان مقاله :
بهبود شبكه عميق R-FCN در آشكارسازي و برچسب‎زني اشياء
پديد آورندگان :
قنبري سرخي ، علي دانشگاه صنعتي شاهرود , حسن پور ، حميد دانشگاه صنعتي شاهرود - دانشكده مهندسي كامپيوتر , فاتح ، منصور دانشگاه صنعتي شاهرود - دانشكده مهندسي كامپيوتر
تعداد صفحه :
17
از صفحه :
43
تا صفحه :
59
كليدواژه :
‏ آشكارسازي و شناسايي اشياء , R-FCN , يادگيري عميق , ماشين بردار پشتيبان دودويي فازي , اختلاف كوشي-شوارتز
چكيده فارسي :
امروزه آشكارسازي و برچسب‎زني اشياء در تصاوير يكي از چالش‎هاي اساسي در برخي از كاربردهاي بينايي‎ماشين مي‎باشد. در سال‎هاي اخير استفاده از يادگيري عميق مورد توجه محققان قرار گرفته است. در همين راستا، در اين مقاله ابتدا جديدترين شبكه‎هاي عميق موجود معرفي، سپس نقاط قوت و ضعف آنها تحليل مي‌شود. در ادامه شبكه‎اي بهبود يافته از شبكه RFCN ارائه مي‎شود. روش پيشنهادي بر پايه معماري ResNet و شبكه تمام كانولوشن است. در اين روش، معماري جديدي مبتني بر شبكه عميق براي پيشنهاد ناحيه كانديد و روشي تركيبي مبتني بر SVMفازي دوكلاسه و SVR براي آشكارسازي و برچسب‎زني اشياء ارائه شده است. در اين روش از تابع زيان جديد با عنوان اختلاف كوشيشوارتز استفاده شده است. اين تابع زيان از لحاظ سرعت و دقت، عملكرد بهتري از خود نشان داده است. روش پيشنهادي با معماري 101ResNet بر روي مجموعه داده SUN براي آشكارسازي و برچسب‎زني 36 شي مورد آزمايش قرار گرفت و نتايج بدست آمده نشان دهنده بهبود عملكرد اين روش نسبت به روش پايه شبكه RFCN است. روش پيشنهادي از لحاظ معيار mAP، عملكرد 48/38% و مدت زمان متوسط براي هر تصوير 0/13 را دارد، و نسبت به بهترين روش در اين حوزه تقريبا 2% در عملكرد و 0/4 ثانيه در زمان بهتر عمل كرده است.
عنوان نشريه :
مجله ماشين بينايي
لينک به اين مدرک :
بازگشت