عنوان مقاله :
تفريق پس زمينه با استفاده از شبكههاي عصبي حافظه كوتاه - مدت بلند عميق و سازوكار توجه
پديد آورندگان :
كوشكي ، مهشام دانشگاه تحصيلات تكميلي صنعتي و فناوري پيشرفته - دانشكده مهندسي برق و كامپيوتر , راشدي ، عصمت دانشگاه تحصيلات تكميلي صنعتي و فناوري پيشرفته - دانشكده مهندسي برق و كامپيوتر , آموزگار ، مريم دانشگاه تحصيلات تكميلي صنعتي و فناوري پيشرفته - پژوهشگاه علوم و تكنولوژي پيشرفته و علوم محيطي - گروه كامپيوتر و فناوري اطلاعات
كليدواژه :
تفريق پس زمينه از پيش زمينه , يادگيري عميق , شبكه عصبي LSTM , سازوكار توجه , يادگيري بدون نظارت , تفريق برخط پس زمينه
چكيده فارسي :
جداسازي اشياء متحرك از پسزمينه يكي از مسايل مهم و كاربردي در حوزه بينايي ماشين است. در اين زمينه راهكارهاي بسيار زيادي ارائه شده است. دستهاي از اين راهكارها مبتني بر يادگيري عميق و شبكههاي عصبي عميق هستند كه عمدتا به صورت نظارت شده و برون خط هستند. در اين مقاله يك روش برخط و بدون نظارت مبتني براي جداسازي پسزمينه از پيشزمينه در دادههاي ويديويي ارائه شده است كه در آن پسزمينه به صورت يك ماتريس كم رتبهL توسط يك شبكه عصبي عميق استخراج ميشود و پيشزمينه به صورت يك ماتريس تنك با تفريق L از تصوير اصلي به دست ميآيد. در طراحي شبكه عصبي فوق، از يك شبكه حافظه كوتاه-مدت بلند (LSTM) مبتني بر سازوكار توجه استفاده شده است. يادگيري اين روش به صورت بدون نظارت انجام ميشود و ميتواند آموزش ببيند به قسمتهايي از دادهها و تصوير كه پيشزمينه در آن وجود دارد، وزن بيشتري اختصاص داده و توجه و تمركز بيشتري داشته باشد. جهت ارزيابي مدل پيشنهادي، پايگاه داده LASIEST كه تعداد زيادي از چالشهاي حوزه تفريق پسزمينه را پوشش ميدهد، انتخاب شده است. كارايي راهكار پيشنهادي به طور كمي با استفاده از معيارهاي استاندارد يادآوري، دقت و اندازهي F-measuresارزيابي و با تعدادي از روشهاي معتبر و مطرح مقايسه شده كه به ترتيب به ميزان 8%، 10%، و 5% بهبود داشته است. علاوه بر اين از نظر كيفي و شهودي نيز با راهكارهاي موجود مورد مقايسه قرار گرفته كه موفق به اخذ نتايج مطلوبتر شده است.
عنوان نشريه :
ماشين بينايي و پردازش تصوير
عنوان نشريه :
ماشين بينايي و پردازش تصوير