شماره ركورد :
1141015
عنوان مقاله :
تخمين جريان نوري با استفاده از تقسيم‌بندي معنايي و شبكه عصبي عميق AES
پديد آورندگان :
زمانيان، هانيه دانشگاه بيرجند، بيرجند , فرسي، حسن دانشگاه بيرجند، بيرجند , محمدزاده، سجاد دانشگاه بيرجند، بيرجند
تعداد صفحه :
10
از صفحه :
51
تا صفحه :
60
كليدواژه :
جريان نوري , تقسيم‌بندي معنايي , شبكه عصبي عميق , رمزگذار , رمزگشا
چكيده فارسي :
اهميت و نياز به درك صحنه­هاي بصري به علت پيشرفت سامانه‌هاي خودكار به‌طور پيوسته افزايش يافته است. جريان نوري يكي از ابزارهاي درك صحنه‌هاي بصري است. روش­هاي جريان نوري موجود، مفروضات كلي و همگن فضايي، در مورد ساختار فضايي جريان نوري ارائه مي­دهند. درواقع، جريان نوري در يك تصوير، بسته به كلاس شي و همچنين نوع حركت اشياء مختلف، متفاوت است. فرض اول در ميان بسياري از روش‌ها در اين زمينه، پايداري روشنايي در طي حركت پيكسل­ها بين فريم­ها است. ثابت شده است كه اين فرض در حالت كلي صحيح ناست. در اين پژوهش از تقسيم‌بندي اشياي موجود در تصوير و تعيين حركت اشيا به‌جاي حركت پيكسلي كمك گرفته شده است. درواقع از پيشرفت­هاي اخير شبكه‌هاي عصبي كانولوشن در تقسيم­بندي معنايي صحنه­هاي استاتيك، براي تقسيم تصوير به اشيا مختلف بهره گرفته مي­شود و الگوهاي مختلف حركتي بسته به نوعشي تعريف مي­شود. سپس، تخمين جريان نوري با استفاده از ايجاد يك شبكه عصبي كانولوشن عميق براي تصويري كه در مرحله اول تقسيم­بندي معنايي شده است، انجام مي­شود. روش پيشنهادي كمترين خطا در معيار جريان نوري براي پايگاه داده KITTI-2015 را فراهم مي­آورد و تقسيم­بندي بهتري را نسبت به روش­هاي اخير در طيف وسيعي از فيلم­هاي طبيعي توليد مي­كند.
چكيده لاتين :
The importance and demand of visual scene understanding have been increasing because of autonomous systems development. Optical flow is known as an important tool for scene understanding. Current optical flow methods present general assumptions and spatial homogeneous for spatial structure of flow. In fact, the optical flow in an image depends on object class and the type of object movement. The first assumption in many methods in this field is the brightness constancy during movements of pixels between frames. This assumption is proven to be inaccurate in general. In this paper, we use recent development of deep convolutional networks in semantic segmentation of static scenes to divide an image in to different objects and also depends on type of the object different movement patterns are defined. Next, estimation of the optical flow is performed by using deep neural network for initial image which has been semantically segmented. The proposed method provides minimum error in optical flow measures for KITTI-2015 database and results in more accurate segmentation compared to state-of-the-art methods for several natural videos.
سال انتشار :
1399
عنوان نشريه :
علوم و فناوري هاي پدافند نوين
فايل PDF :
8111890
لينک به اين مدرک :
بازگشت