عنوان مقاله :
بهبود شبكه عميق R-FCN در آشكارسازي و برچسبزني اشياء
پديد آورندگان :
قنبري سرخي ، علي دانشگاه صنعتي شاهرود , حسن پور ، حميد دانشگاه صنعتي شاهرود - دانشكده مهندسي كامپيوتر , فاتح ، منصور دانشگاه صنعتي شاهرود - دانشكده مهندسي كامپيوتر
كليدواژه :
آشكارسازي و شناسايي اشياء , R-FCN , يادگيري عميق , ماشين بردار پشتيبان دودويي فازي , اختلاف كوشي-شوارتز
چكيده فارسي :
امروزه آشكارسازي و برچسبزني اشياء در تصاوير يكي از چالشهاي اساسي در برخي از كاربردهاي بيناييماشين ميباشد. در سالهاي اخير استفاده از يادگيري عميق مورد توجه محققان قرار گرفته است. در همين راستا، در اين مقاله ابتدا جديدترين شبكههاي عميق موجود معرفي، سپس نقاط قوت و ضعف آنها تحليل ميشود. در ادامه شبكهاي بهبود يافته از شبكه RFCN ارائه ميشود. روش پيشنهادي بر پايه معماري ResNet و شبكه تمام كانولوشن است. در اين روش، معماري جديدي مبتني بر شبكه عميق براي پيشنهاد ناحيه كانديد و روشي تركيبي مبتني بر SVMفازي دوكلاسه و SVR براي آشكارسازي و برچسبزني اشياء ارائه شده است. در اين روش از تابع زيان جديد با عنوان اختلاف كوشيشوارتز استفاده شده است. اين تابع زيان از لحاظ سرعت و دقت، عملكرد بهتري از خود نشان داده است. روش پيشنهادي با معماري 101ResNet بر روي مجموعه داده SUN براي آشكارسازي و برچسبزني 36 شي مورد آزمايش قرار گرفت و نتايج بدست آمده نشان دهنده بهبود عملكرد اين روش نسبت به روش پايه شبكه RFCN است. روش پيشنهادي از لحاظ معيار mAP، عملكرد 48/38% و مدت زمان متوسط براي هر تصوير 0/13 را دارد، و نسبت به بهترين روش در اين حوزه تقريبا 2% در عملكرد و 0/4 ثانيه در زمان بهتر عمل كرده است.
عنوان نشريه :
مجله ماشين بينايي