شماره ركورد :
1398536
عنوان مقاله :
ارائه‌ي يك معماري جديد از شبكه‌هاي باور عميق براي شناسايي عمل در ويدئو
پديد آورندگان :
جودكي ، مجيد دانشگاه كاشان - دانشكده برق و كامپيوتر , ابراهيم پور كومله ، حسين دانشگاه كاشان - دانشكده برق و كامپيوتر - گروه كامپيوتر
از صفحه :
43
تا صفحه :
58
كليدواژه :
يادگيري عميق , شبكه‌هاي باور عميق , ماشين هاي بولتزمن محدود , شناسايي عمل , شبكه‌هاي عصبي بازگشتي
چكيده فارسي :
استفاده از يادگيري عميق در حل مسايل مربوط به تحليل داده‌هاي پيچيده و حجيم مانند ويدئوها گسترش يافته است. از جمله پردازش‌هايي كه روي ويديوها انجام مي‌گيرد، تشخيص عمل‌هاي انساني است كه كاربردهاي مهمي در حوزه نظارت خودكار، تعامل انسان با رايانه و بررسي رفتارهاي سالمندان دارد. شبكه‌هاي باور عميق از ميان انواع مختلف شبكه‌هاي عميق، به خاطر ويژگي‌هاي خاص خود، به ويژه توانايي همگرايي سريع نسبت به ديگر روش‌ها و ساختار يكسان لايه‌ها، مورد توجه قرار گرفته‌اند. ليكن، قدرت شبكه هاي باور عميق پايه در پردازش داده‌هاي پيچيده كه مبتني بر زمان نيز هستند جاي تامل دارد.در اين مقاله، يك روش بازگشتي جديد بر مبناي شبكه‌هاي باور عميق ارائه شده است. در روش پيشنهادي، توانايي پردازش و تفسير فريم‌هاي دوبعدي ويدئو و درك مفهوم زمان به وسيله پياده‌سازي بازگشتي به شبكه‌هاي باور عميق اضافه شده است. اين روش قادر به درك مفاهيم كوتاه مدت زماني با استفاده از ماشين‌هاي بولتزمن محدود و بلند مدت زماني بر مبناي پياده‌سازي بازگشتي مي‌باشد. روش پيشنهادي بر روي سه پايگاه داده شناخته‌شده در اين حوزه با نام‌هاي KTH، UCF و HMDB51 ارزيابي شده و به ترتيب به دقت‌هاي برابر با 95.02، 93.14 و 74.28 دست يافته و با ساير روش‌هاي محبوب در شرايط مختلف مقايسه گرديده است.
عنوان نشريه :
ماشين بينايي و پردازش تصوير
عنوان نشريه :
ماشين بينايي و پردازش تصوير
لينک به اين مدرک :
بازگشت