عنوان مقاله :
ارائه يك الگوريتم تركيبي مبتني بر يادگيري عميق و ماشين بولتزمان محدود با هدف قطعهبندي معنايي خودرو از تصاوير مادونقرمز حرارتي پهپاد
پديد آورندگان :
خوش برش ماسوله، مهدي دانشگاه تهران، تهران , شاه حسيني، رضا دانشگاه تهران، تهران
كليدواژه :
شبكه عصبي كانوولوشني عميق , ماشين بولتزمان محدود گوسين - برنولي , قطعهبندي معنايي , وسايل نقليه زميني , تصاوير مادونقرمز حرارتي پهپاد
چكيده فارسي :
امروزه پايش وسايل نقليه زميني با استفاده از روشهاي پردازش تصوير، يكي از حيطههاي كاربردي در كنترل ترافيك هوشمند به شمار ميآيد. در اين زمينه، بهكارگيري تصاوير مادونقرمز حرارتي پهپاد به دليل قدرت تفكيك مكاني مناسب، مقرون به صرفه بودن و حجم كمتر تصاوير، يكي از گزينههاي مطلوب براي هدف پايش وسايل نقليه است. روشهايي كه تا به حال براي استخراج وسايل نقليه از تصاوير حرارتي ارائه شدهاند، اغلب داراي مشكلاتي نظير دقت پايين در شناسايي و قطعهبندي (مانند روش HOG+SVM) و نياز به كلان دادههاي آموزشي (مانند روشهاي يادگيري عميق) است. در تحقيق حاضر، يك مدل جديد با نام SegRBM-Net بر اساس يادگيري عميق و ماشين بولتزمان محدود ارائه شده است. از جمله ويژگيهاي مدل SegRBM-Net، افزايش دقت شناسايي و قطعهبندي وسايل نقليه از تصاوير حرارتي با استفاده توأم از لايههاي كانوولوشني و ويژگيهاي ماشين بولتزمان محدود گوسين - برنولي ميباشد. اين ساختار موجب شده است تا الگوريتم، هدف را با سرعت و دقت بيشتري نسبت به ساير روشهاي يادگيري عميق پيدا كند. بهمنظور ارزيابي كارايي و دقت روش پيشنهادي، از چهار مجموعه داده مادونقرمز حرارتي پهپاد با ويژگيهايي نظير تراكم بالاي وسايل نقليه در صحنه و زاويه ديد متنوع استفاده شده است. بر اساس نتايج اين تحقيق، مدل SegRBM-Net با دقت ميانگين 99 درصد و بهبود سرعت پردازش، نسبت به روشهاي مشابه داراي كارايي مناسبي ميباشد.
چكيده لاتين :
Nowadays, ground vehicle monitoring (GVM) is one of the areas of application in the intelligent traffic control
system using image processing methods. In this context, the use of unmanned aerial vehicles based on thermal
infrared (UAV-TIR) images is one of the optimal options for GVM due to the suitable spatial resolution, costeffective
and low volume of images. The methods that have been proposed for vehicle extraction from thermal
infrared imaging often experience problems such as low accuracy in detection, segmentation (e.g. HOG+SVM)
and also the need for big data training (e.g. deep learning methods). In the present study, a new model, called
SegRBM-Net, based on deep learning (DL) and the restricted Boltzmann machine (RBM) is being presented.
One of the features of the SegRBM-Net model is the improving accuracy of vehicle detection and segmentation
from thermal infrared images by using both convolutional layers and the features of the Gaussian-Bernoulli
restricted Boltzmann machine. This structure has led the algorithm to find the target faster and more
accurately than other DL methods. To examine the performance of the proposed method, we performed a
controlled benchmark (e.g. high density of vehicles scene, and difference in viewing angle) of SegRBM-Net and
other DL models on four UAV-TIR image datasets.The results showed that the SegRBM-Net model with a mean
accuracy of 99% and improved processing speed compared with similar methods have a good performance.
عنوان نشريه :
مهندسي فناوري اطلاعات مكاني