مرکز منطقه ای اطلاع رساني علوم و فناوري - تخمين جريان نوري با استفاده از تقسيم‌بندي معنايي و شبكه عصبي عميق AES

شماره ركورد :

1141015

عنوان مقاله :

تخمين جريان نوري با استفاده از تقسيم‌بندي معنايي و شبكه عصبي عميق AES

پديد آورندگان :

زمانيان، هانيه دانشگاه بيرجند، بيرجند , فرسي، حسن دانشگاه بيرجند، بيرجند , محمدزاده، سجاد دانشگاه بيرجند، بيرجند

تعداد صفحه :

از صفحه :

تا صفحه :

كليدواژه :

جريان نوري , تقسيم‌بندي معنايي , شبكه عصبي عميق , رمزگذار , رمزگشا

چكيده فارسي :

اهميت و نياز به درك صحنههاي بصري به علت پيشرفت سامانه‌هاي خودكار به‌طور پيوسته افزايش يافته است. جريان نوري يكي از ابزارهاي درك صحنه‌هاي بصري است. روشهاي جريان نوري موجود، مفروضات كلي و همگن فضايي، در مورد ساختار فضايي جريان نوري ارائه ميدهند. درواقع، جريان نوري در يك تصوير، بسته به كلاس شي و همچنين نوع حركت اشياء مختلف، متفاوت است. فرض اول در ميان بسياري از روش‌ها در اين زمينه، پايداري روشنايي در طي حركت پيكسلها بين فريمها است. ثابت شده است كه اين فرض در حالت كلي صحيح ناست. در اين پژوهش از تقسيم‌بندي اشياي موجود در تصوير و تعيين حركت اشيا به‌جاي حركت پيكسلي كمك گرفته شده است. درواقع از پيشرفتهاي اخير شبكه‌هاي عصبي كانولوشن در تقسيمبندي معنايي صحنههاي استاتيك، براي تقسيم تصوير به اشيا مختلف بهره گرفته ميشود و الگوهاي مختلف حركتي بسته به نوعشي تعريف ميشود. سپس، تخمين جريان نوري با استفاده از ايجاد يك شبكه عصبي كانولوشن عميق براي تصويري كه در مرحله اول تقسيمبندي معنايي شده است، انجام ميشود. روش پيشنهادي كمترين خطا در معيار جريان نوري براي پايگاه داده KITTI-2015 را فراهم ميآورد و تقسيمبندي بهتري را نسبت به روشهاي اخير در طيف وسيعي از فيلمهاي طبيعي توليد ميكند.

چكيده لاتين :

The importance and demand of visual scene understanding have been increasing because of autonomous systems development. Optical flow is known as an important tool for scene understanding. Current optical flow methods present general assumptions and spatial homogeneous for spatial structure of flow. In fact, the optical flow in an image depends on object class and the type of object movement. The first assumption in many methods in this field is the brightness constancy during movements of pixels between frames. This assumption is proven to be inaccurate in general. In this paper, we use recent development of deep convolutional networks in semantic segmentation of static scenes to divide an image in to different objects and also depends on type of the object different movement patterns are defined. Next, estimation of the optical flow is performed by using deep neural network for initial image which has been semantically segmented. The proposed method provides minimum error in optical flow measures for KITTI-2015 database and results in more accurate segmentation compared to state-of-the-art methods for several natural videos.

سال انتشار :

1399

عنوان نشريه :

علوم و فناوري هاي پدافند نوين

فايل PDF :

8111890

لينک به اين مدرک :

https://search.ricest.ac.ir/dl/search/defaultta.aspx?DTC=8&DC=1141015