شماره ركورد كنفرانس :
4051
عنوان مقاله :
برچسب‌گذاري تصوير بر ‌مبناي نواحي مهم با استفاده از شبكه‌هاي كانوولوشن عميق
پديدآورندگان :
رضايي نوين ناصر nasser.rezaei.novin@gmail.com دانشگاه شهيد بهشتي , ناديان قمشه علي دانشگاه شهيد بهشتي
تعداد صفحه :
6
كليدواژه :
شبكه مانده اي , شبكه Inception , مدل پيشنهاد ناحيه , شبكه تبديل فضايي
سال انتشار :
1396
عنوان كنفرانس :
دهمين كنفرانس ملي بينايي ماشين و پردازش تصوير ايران
زبان مدرك :
فارسي
چكيده فارسي :
قابليت توليد برچسبِ متني براي تصاوير، كاري چالش‌برانگيز و درعين‌حال پر كاربرد است. از كاربردهاي برچسب‌گذاري خودكار مي‌توان به ساخت ابزارهايي براي بازيابي بهتر تصاوير با استفاده از فهم معنايي محتواي و كمك به افرادي كه در سيستم بينايي خود دچار معلوليت هستند اشاره كرد. در اين مقاله يك سيستم جامع و يكپارچه براي برچسب‌گذاري خودكار تصاوير معرفي شده است كه با استخراج ناحيه‌هاي مهم تصوير، به ازاي هر ناحيه برچسبي كه شامل يك كلمه، عبارت يا جمله است را به نواحي نسبت مي‌دهد. يك مدل Inception مانده‌اي براي استخراج ويژگي‌هاي تصوير معرفي‌شده است كه علاوه بر تعداد پارامتر كمتر، داراي عمق و دقت بيشتر نسبت به مدل‌هاي پيشين همچون VGG است. مدل پيشنهاد شده قابليت يادگيري در يك مرحله گذر رو به جلو را دارد. بانك داده استفاده شده جهت ارزيابي روش پيشنهادي Visual Genome مي باشد.
كشور :
ايران
لينک به اين مدرک :
بازگشت