عنوان مقاله :
تمام متصل به تمام پيچشي: پلي به گذشته
پديد آورندگان :
امين طوسي ، محمود دانشگاه حكيم سبزواري - دانشكده رياضي و علوم كامپيوتر
كليدواژه :
يادگيري عميق , شبكههاي عصبي پيچشي , طبقهبندي تصوير , شناسايي اشياء , پرسپترون چند لايه
چكيده فارسي :
در يك دههي گذشته شبكههاي پيچشي متعددي براي قطعهبندي معنايي تصاوير ابداع شدهاند كه عملكرد بسيار خوبي در تشخيص و برچسبزني اشياء از خود نشان دادهاند. عمدهي اين شبكهها متضمن معماريهاي با اندازهي بزرگ هستند كه توانايي آشكارسازي دهها يا صدها دستهي از قبل مشخص را داشته باشند. در بيشتر كاربردها از معماريهايي استفاده ميشود كه پس از چند لايهي پيچشي از يك طبقهبند معمول براي طبقهبندي ويژگيهاي استخراج شدهي شبكه استفاده ميشود. در اين نوشتار روش تبديل يك شبكه كه به عنوان طبقهبند، دو لايهي مسطح و چگال (تمام متصل) دارد، به يك شبكه تمام پيچشي بيان شده است. مزيت اصلي اين شيوه، قابليت كاركرد بر روي وروديهاي با اندازه متغير و توليد يك نقشه خروجي به جاي يك عدد ميباشد كه همان مزيت شبكههاي تمام پيچشي است. در مدلهاي جديد حوزهي يادگيري عميق عموماً از تصاوير آموزشي كه در آنها نواحي موردنظر با ماسك مشخص شدهاند استفاده ميشود، اما در شيوهي پيشنهادي در اين نوشتار فقط تصاوير برچسبدار (مشخصكننده طبقهي كل تصوير) به شبكه داده ميشود. جزييات روش كار در قالب مسئلهي جديد طبقهبندي و شناسايي تابلوهاي با رسمالخطهاي شكسته نستعليق و ثلث، شناسايي برگ سالم از مريض سيب (به عنوان مسائل دو كلاسه) و مسئلهي شناسايي ارقام فارسي بيان شده است. به اين منظور ابتدا يك شبكه پيچشي با لايه آخر تمام متصل طراحي و بر روي تصاوير مربعي آموزش داده ميشود. سپس مدل تمام پيچشي جديدي بر اساس مدل قبلي تعريف شده و وزنهاي مدل قبلي به مدل جديد كپي ميشود. تنها تفاوت دو مدل در لايه آخر است، اما مدل جديد قابليت كار بر روي تصاوير ورودي با هر اندازه را خواهد داشت. نتايج آزمايشات كارايي اين شيوه را نشان داده است (كد برنامه در https://github.com/mamintoosi/FC2FC ).
عنوان نشريه :
رايانش نرم و فناوري اطلاعات
عنوان نشريه :
رايانش نرم و فناوري اطلاعات