عنوان مقاله :
تخمين جريان نوري با استفاده از تقسيمبندي معنايي و شبكه عصبي عميق AES
پديد آورندگان :
زمانيان، هانيه دانشگاه بيرجند، بيرجند , فرسي، حسن دانشگاه بيرجند، بيرجند , محمدزاده، سجاد دانشگاه بيرجند، بيرجند
كليدواژه :
جريان نوري , تقسيمبندي معنايي , شبكه عصبي عميق , رمزگذار , رمزگشا
چكيده فارسي :
اهميت و نياز به درك صحنههاي بصري به علت پيشرفت سامانههاي خودكار بهطور پيوسته افزايش يافته است. جريان نوري يكي از ابزارهاي درك صحنههاي بصري است. روشهاي جريان نوري موجود، مفروضات كلي و همگن فضايي، در مورد ساختار فضايي جريان نوري ارائه
ميدهند. درواقع، جريان نوري در يك تصوير، بسته به كلاس شي و همچنين نوع حركت اشياء مختلف، متفاوت است. فرض اول در ميان بسياري از روشها در اين زمينه، پايداري روشنايي در طي حركت پيكسلها بين فريمها است. ثابت شده است كه اين فرض در حالت كلي صحيح ناست. در اين پژوهش از تقسيمبندي اشياي موجود در تصوير و تعيين حركت اشيا بهجاي حركت پيكسلي كمك گرفته شده است. درواقع از پيشرفتهاي اخير شبكههاي عصبي كانولوشن در تقسيمبندي معنايي صحنههاي استاتيك، براي تقسيم تصوير به اشيا مختلف بهره گرفته ميشود و الگوهاي مختلف حركتي بسته به نوعشي تعريف ميشود. سپس، تخمين جريان نوري با استفاده از ايجاد يك شبكه عصبي كانولوشن عميق براي تصويري كه در مرحله اول تقسيمبندي معنايي شده است، انجام ميشود. روش پيشنهادي كمترين خطا در معيار جريان نوري براي پايگاه داده KITTI-2015 را فراهم ميآورد و تقسيمبندي بهتري را نسبت به روشهاي اخير در طيف وسيعي از فيلمهاي طبيعي توليد ميكند.
چكيده لاتين :
The importance and demand of visual scene understanding have been increasing because of autonomous systems development. Optical flow is known as an important tool for scene understanding. Current optical flow methods present general assumptions and spatial homogeneous for spatial structure of flow. In fact, the optical flow in an image depends on object class and the type of object movement. The first assumption in many methods in this field is the brightness constancy during movements of pixels between frames. This assumption is proven to be inaccurate in general. In this paper, we use recent development of deep convolutional networks in semantic segmentation of static scenes to divide an image in to different objects and also depends on type of the object different movement patterns are defined. Next, estimation of the optical flow is performed by using deep neural network for initial image which has been semantically segmented. The proposed method provides minimum error in optical flow measures for KITTI-2015 database and results in more accurate segmentation compared to state-of-the-art methods for several natural videos.
عنوان نشريه :
علوم و فناوري هاي پدافند نوين