عنوان مقاله :
ارائهي يك معماري جديد از شبكههاي باور عميق براي شناسايي عمل در ويدئو
پديد آورندگان :
جودكي ، مجيد دانشگاه كاشان - دانشكده برق و كامپيوتر , ابراهيم پور كومله ، حسين دانشگاه كاشان - دانشكده برق و كامپيوتر - گروه كامپيوتر
كليدواژه :
يادگيري عميق , شبكههاي باور عميق , ماشين هاي بولتزمن محدود , شناسايي عمل , شبكههاي عصبي بازگشتي
چكيده فارسي :
استفاده از يادگيري عميق در حل مسايل مربوط به تحليل دادههاي پيچيده و حجيم مانند ويدئوها گسترش يافته است. از جمله پردازشهايي كه روي ويديوها انجام ميگيرد، تشخيص عملهاي انساني است كه كاربردهاي مهمي در حوزه نظارت خودكار، تعامل انسان با رايانه و بررسي رفتارهاي سالمندان دارد. شبكههاي باور عميق از ميان انواع مختلف شبكههاي عميق، به خاطر ويژگيهاي خاص خود، به ويژه توانايي همگرايي سريع نسبت به ديگر روشها و ساختار يكسان لايهها، مورد توجه قرار گرفتهاند. ليكن، قدرت شبكه هاي باور عميق پايه در پردازش دادههاي پيچيده كه مبتني بر زمان نيز هستند جاي تامل دارد.در اين مقاله، يك روش بازگشتي جديد بر مبناي شبكههاي باور عميق ارائه شده است. در روش پيشنهادي، توانايي پردازش و تفسير فريمهاي دوبعدي ويدئو و درك مفهوم زمان به وسيله پيادهسازي بازگشتي به شبكههاي باور عميق اضافه شده است. اين روش قادر به درك مفاهيم كوتاه مدت زماني با استفاده از ماشينهاي بولتزمن محدود و بلند مدت زماني بر مبناي پيادهسازي بازگشتي ميباشد. روش پيشنهادي بر روي سه پايگاه داده شناختهشده در اين حوزه با نامهاي KTH، UCF و HMDB51 ارزيابي شده و به ترتيب به دقتهاي برابر با 95.02، 93.14 و 74.28 دست يافته و با ساير روشهاي محبوب در شرايط مختلف مقايسه گرديده است.
عنوان نشريه :
ماشين بينايي و پردازش تصوير
عنوان نشريه :
ماشين بينايي و پردازش تصوير