عنوان مقاله :
تلفيق الگوريتمهاي يادگيري عميق و فيلترهاي دوطرفه با هدف استخراج ساختمان از تكتصوير نوري هوايي
پديد آورندگان :
خوش برش ماسوله، مهدي دانشگاه تهران، تهران , شاه حسيني، رضا دانشگاه تهران، تهران , صفري، عبدالرضا دانشگاه تهران، تهران
كليدواژه :
استخراج ساختمان , تكتصوير نوري هوايي , قطعهبندي معنايي , شبكههاي عصبي كانوولوشني عميق , فيلترهاي دوطرفه
چكيده فارسي :
مسئله استخراج ساختمان از تكتصوير نوري هوايي با قدرت تفكيك مكاني بالا، همواره بهعنوان يكي از چالشهاي مهم در تهيه نقشه بهشمار ميآيد. هدف از پژوهش حاضر، بهرهگيري از قطعهبندي معنايي تكتصوير نوري هوايي بر پايه تلفيق شبكههاي عصبي كانوولوشني عميق و فيلترهاي دوطرفه جهت استخراج ساختمان ميباشد. بههمينمنظور، پس از انتخاب يك مجموعه داده مناسب از تصاوير نوري سهباندي، با در نظر گرفتن اينكه براي آموزش شبكههاي عصبي عميق نياز است تا دادههاي آموزشي با تعداد زياد انتخاب شوند و باتوجه به محدوديتهاي سختافزاري در اين پژوهش، پس از چندين بار آزمايش، حداقل دادهاي كه بالاترين نرخ دقت آموزش را به دست ميدهد انتخاب گرديد؛ تا نتايج بهدست آمده، از كمبود دادههاي آموزشي تأثير منفي نپذيرد. در اين پژوهش، با بهينهسازي شبكه عصبي عميق سِگنت كه از نوع شبكههاي كدگذار-كدگشا ميباشد، با استفاده از تابع بهينهسازي برآورد لحظه تطبيقي و بهكارگيري فيلترهاي دوطرفه با كرنل گوسين، فرآيند پردازش و استخراج ساختمان از تصاوير نوري صورت گرفته است. نتايج تحقيق بر روي مجموعه داده مربوط به تصاوير نوري هوايي از مناطق شهري واقع در شهر پوتسدام آلمان از مجموعه دادههاي دو بعدي برچسبدار انجمن بينالمللي فتوگرامتري و سنجشازدور نشان داد؛ بهكارگيري تلفيقي شبكه عصبي عميق بهينهسازي شده سِگنت و فيلترهاي دو طرفه با كرنل گوسين قابليتهاي بسيار مناسبي از نظر بهبود شناسايي مرز ساختمان در مقايسه با روشهاي مشابه از تصاوير نوري با قدرت تفكيك مكاني بالا دارد. همچنين نتايج حاصل از روش پيشنهادي تحقيق با معيارهاي تماميّت و صحّت براي سه منطقه تست به ترتيب 14/95 و 37/92 درصد براي منطقه تست شماره يك، 67/91 و 20/90 براي منطقه تست شماره دو، 14/96 و 98/93 براي منطقه تست شماره سه ميباشد.
چكيده لاتين :
The problem of extracting the building from mono optical aerial imagery with high spatial resolution is always
considered as an important challenge to prepare the maps. The goal of the current research is to take advantage of
the semantic segmentation of mono optical aerial imagery to extract the building which is realized based on the
combination of deep convolutional neural networks (DCNN) and bilateral filters (BF). For this purpose, considering
the hardware limitations of the current research and the fact that it is necessary to select a large number of training
data to train deep convolutional neural networks, after selecting an appropriate dataset from three-band optical
images, the minimum data that obtains the highest training accuracy was selected to avoid getting weak results due
to the lack of training data. In this research, by optimizing the SegNet deep neural network which is an encoderdecoder
network, the processing task and therefore extracting the building from optical images are done using the
adaptive moment estimation (ADAM) optimization and BF with a Gaussian kernel. This method is implemented on a
dataset related to the mono optical aerial imagery of urban regions located in Potsdam, Germany, the twodimensional
tagged datasets of international society for photogrammetry and remote sensing (ISPRS). The results
show that compared to similar methods, the combinational use of the SegNet optimized deep neural network and BF
with a Gaussian kernel provides very appropriate capabilities to improve the detection of building boundary in the
optical images with high spatial resolution. Also, the results of the proposed method show that the values of the
integrity and validity criteria are 95.14 and 92.37 respectively for the test area 1, 91.67 and 90.2 respectively for the
test area 2, and 96.14 and 93.98 respectively for the test area 3.
عنوان نشريه :
مهندسي فناوري اطلاعات مكاني