شماره ركورد :
1125169
عنوان مقاله :
تلفيق الگوريتم‌هاي يادگيري عميق و فيلترهاي دوطرفه با هدف استخراج ساختمان از تك‌تصوير نوري هوايي
پديد آورندگان :
خوش برش ماسوله، مهدي دانشگاه تهران، تهران , شاه حسيني، رضا دانشگاه تهران، تهران , صفري، عبدالرضا دانشگاه تهران، تهران
تعداد صفحه :
23
از صفحه :
241
تا صفحه :
263
كليدواژه :
استخراج ساختمان , تك‌تصوير نوري هوايي , قطعه‌بندي معنايي , شبكه‌هاي عصبي كانوولوشني عميق , فيلترهاي دوطرفه
چكيده فارسي :
مسئله استخراج ساختمان از تك‌تصوير نوري هوايي با قدرت تفكيك مكاني بالا، همواره به‌عنوان يكي از چالش‌هاي مهم در تهيه نقشه به‌شمار مي‌آيد. هدف از پژوهش حاضر، بهره‌گيري از قطعه‌بندي معنايي تك‌تصوير نوري هوايي بر پايه تلفيق شبكه‌هاي عصبي كانوولوشني عميق و فيلترهاي دوطرفه جهت استخراج ساختمان مي‌باشد. به‌همين‌منظور، پس از انتخاب يك مجموعه داده مناسب از تصاوير نوري سه‌باندي، با در نظر گرفتن اين‌كه براي آموزش شبكه‌هاي عصبي عميق نياز است تا داده‌هاي آموزشي با تعداد زياد انتخاب شوند و باتوجه به محدوديت‌هاي سخت‌افزاري در اين پژوهش، پس از چندين بار آزمايش، حداقل داده‌اي كه بالاترين نرخ دقت آموزش را به دست مي‌دهد انتخاب گرديد؛ تا نتايج به‌دست آمده، از كمبود داده‌هاي آموزشي تأثير منفي نپذيرد. در اين پژوهش، با بهينه‌سازي شبكه عصبي عميق سِگنت كه از نوع شبكه‌هاي كدگذار-كدگشا مي‌باشد، با استفاده از تابع بهينه‌سازي برآورد لحظه تطبيقي و به‌كارگيري فيلترهاي دوطرفه با كرنل گوسين، فرآيند پردازش و استخراج ساختمان از تصاوير نوري صورت گرفته است. نتايج تحقيق بر روي مجموعه داده مربوط به تصاوير نوري هوايي از مناطق شهري واقع در شهر پوتسدام آلمان از مجموعه داده‌هاي دو بعدي برچسب‌دار انجمن بين‌المللي فتوگرامتري و سنجش‌ازدور نشان داد؛ به‌كارگيري تلفيقي شبكه عصبي عميق بهينه‌سازي شده سِگنت و فيلترهاي دو طرفه با كرنل گوسين قابليت‌هاي بسيار مناسبي از نظر بهبود شناسايي مرز ساختمان در مقايسه با روش‌هاي مشابه از تصاوير نوري با قدرت تفكيك مكاني بالا دارد. همچنين نتايج حاصل از روش پيشنهادي تحقيق با معيارهاي تماميّت و صحّت براي سه منطقه تست به ترتيب 14/95 و 37/92 درصد براي منطقه تست شماره يك، 67/91 و 20/90 براي منطقه تست شماره دو، 14/96 و 98/93 براي منطقه تست شماره سه مي‌باشد.
چكيده لاتين :
The problem of extracting the building from mono optical aerial imagery with high spatial resolution is always considered as an important challenge to prepare the maps. The goal of the current research is to take advantage of the semantic segmentation of mono optical aerial imagery to extract the building which is realized based on the combination of deep convolutional neural networks (DCNN) and bilateral filters (BF). For this purpose, considering the hardware limitations of the current research and the fact that it is necessary to select a large number of training data to train deep convolutional neural networks, after selecting an appropriate dataset from three-band optical images, the minimum data that obtains the highest training accuracy was selected to avoid getting weak results due to the lack of training data. In this research, by optimizing the SegNet deep neural network which is an encoderdecoder network, the processing task and therefore extracting the building from optical images are done using the adaptive moment estimation (ADAM) optimization and BF with a Gaussian kernel. This method is implemented on a dataset related to the mono optical aerial imagery of urban regions located in Potsdam, Germany, the twodimensional tagged datasets of international society for photogrammetry and remote sensing (ISPRS). The results show that compared to similar methods, the combinational use of the SegNet optimized deep neural network and BF with a Gaussian kernel provides very appropriate capabilities to improve the detection of building boundary in the optical images with high spatial resolution. Also, the results of the proposed method show that the values of the integrity and validity criteria are 95.14 and 92.37 respectively for the test area 1, 91.67 and 90.2 respectively for the test area 2, and 96.14 and 93.98 respectively for the test area 3.
سال انتشار :
1398
عنوان نشريه :
مهندسي فناوري اطلاعات مكاني
فايل PDF :
7757593
لينک به اين مدرک :
بازگشت