شماره ركورد :
1205300
عنوان مقاله :
احتمالات آگاه به محتوا براي قطعه بندي معنايي تصوير
پديد آورندگان :
نصيري ، مجيد دانشگاه تربيت دبير شهيد رجايي - دانشكده مهندسي كامپيوتر - گروه هوش مصنوعي , رشيدي كنعان ، حميدرضا دانشگاه تربيت دبير شهيد رجايي - دانشكده مهندسي كامپيوتر - گروه هوش مصنوعي , اميري ، حميد دانشگاه تربيت دبير شهيد رجايي - دانشكده مهندسي كامپيوتر - گروه هوش مصنوعي
از صفحه :
32
تا صفحه :
42
كليدواژه :
قطعه‌بندي معنايي تصوير , شبكه‌هاي عصبي عميق , شبكه‌هاي عصبي كانولوشني , واحد احتمالات آگاه به محتوا
چكيده فارسي :
قطعه‌بندي معنايي تصوير مبتني بر شبكه‌هاي عصبي عميق، از رويكردهاي مهم محققان بينايي ماشين مي باشد. در روش هاي مبتني بر شبكه‌هاي عصبي عميق، بطور كلي از يك شبكهپايه كه براي كاربرد شناسايي تصوير، آموزش ديده است، بمنظور استخراج ويژگي از تصوير استفاده مي‌شود. از آنجا كه ابعاد ويژگي‌هاي خروجي از اين شبكه‌هايپايه، كوچكتر از تصوير ورودي‌ مي‌باشد، لذا با اضافه كردن چندين لايه پيچشي به انتهاي اين شبكه‌هايپايه، ابعاد ويژگي‌هاي خروجي از اين شبكه‌ها را به اندازه ابعاد تصوير وروي ميرسانند. استفاده از ويژگي‌هاي‌ محلي خروجي از شبكه‌هايپايه، بدون در نظر گرفتن ارتباط كلي بين اين ويژگي‌هاي محلي، منجر به قطعه‌بندي ضعيف و ناهموار مي‌شود. بر اين اساس، در اين تحقيق واحدي با نام واحد احتمالات آگاه به محتوا پيشنهاد مي‌شود. اين واحد با كمك ويژگي‌هاي محلي خروجي از شبكه‌هايپايه، بردار احتمال حضور كلاس‌هاي مختلف را در تصوير توليد مي‌كند. واحد پيشنهادي را مي‌توان در معماري‌هاي مختلف قطعه‌بندي معنايي تصوير قرار داد. در اين تحقيق، با اضافه كردن واحد پيشنهادي CAP به معماريهاي پايه FCN و DeepLabv3plus، به ترتيب معماريهاي FCNCAP و DeepLabv3plusCAP پيشنهاد شده است. بمنظور آموزش معماريهاي پيشنهادي از دادگان PASCAL VOC2012 استفاده شده است. نتايج آزمايش‌ها نشان مي دهد كه معماريهاي پيشنهادي نسبت به معماريهاي پايه مربوطه، به ترتيب 9/1درصد و 4/0درصد بهبود دقت (mIoU) دارد.
عنوان نشريه :
رايانش نرم و فناوري اطلاعات
عنوان نشريه :
رايانش نرم و فناوري اطلاعات
لينک به اين مدرک :
بازگشت