شماره ركورد
1188821
عنوان مقاله
ارائه يك بستر يادگيري عميق نيمه نظارتي براي بازسازي سه بعدي چهره از يك تصوير دوبعدي
عنوان به زبان ديگر
Novel Semi-Supervised Deep Learning Framework for 3D reconstruction of human face from a single 2D image
پديد آورندگان
كامياب، شيما دانشگاه شيراز , عظيمي فر، زهره دانشگاه شيراز - دانشكده مهندسي كامپيوتر و فناوري اطلاعات
تعداد صفحه
10
از صفحه
17
از صفحه (ادامه)
0
تا صفحه
26
تا صفحه(ادامه)
0
كليدواژه
بازسازي سه بعدي از يك تصوير دوبعدي , نگاشت بازنمايي دو بعدي به سه بعدي , بازسازي سه بعدي نيمه نظارتي هوشمندسازي فعاليت ناجا با بازسازي سه بعدي , يادگيري عميق در بازسازي سه بعدي
چكيده فارسي
در اين مقاله يك بستر يادگيري عميق نيمه نظارتي براي بازسازي سه بعدي از يك تصوير دوبعدي پيشنهاد شده است كه در آن به منظور كاهش نياز به برچسب سه بعدي و دوبعدي از دو بخشِ بدون نظارتِ از پيش آموزش داده شده استفاده شده است. بدين ترتيب با بهره گيري از بخشهاي آموزش ديده، به منظور آموزش كل شبكه، به داده برچسب دار كمتري نياز است، علاوه بر اينكه با توجه به استفاده از داده به عنوان تنها منبع دانش براي يادگيري، نيازي به استفاده از فرضهاي مختلف در مورد چگونگي شكل گيري تصوير نخواهد بود. ايده اصلي در بستر پيشنهادي، يافتن نگاشتي بين فضاي هاي بازنمايي با ابعاد پايينتر دوبعدي و سه بعدي مي-باشد. بنابراين بستر پيشنهادي در اين مقاله شامل بخش هاي بدون نظارتِ نگاشت از فضاهاي دوبعدي و سه بعدي به بازنماييهاي بعد پايين، و بخش نظارتي نگاشت بين بازنماييهاي بعدپايين ميباشد. نتايج ارزيابي و مقايسه بستر پيشنهادي با چند بستر مشابه موجود روي پايگاه هاي داده چهرهي انسان، نشاندهنده كارايي مطلوب بستر نيمه نظارتي پيشنهادي در بازسازي سه بعدي از يك تصوير دوبعدي است. اين بستر ميتواند قدمي مفيد در جهت هوشمندسازي فعاليت نيروي انتظامي براي تشخيص چهره باشد.
چكيده لاتين
In this paper a semi supervised framework for 3D reconstruction from a single 2D image is proposed in which there are pre-trained components for reducing the need for label in training procedure. Therefore in order to train the whole framework, fewer labeled data is needed along with this fact that, using only the data for the learning procedure, there is no need to make different constraints for solving the problem. The main idea of the proposed method is fining a mapping between the 2D and 3D representation spaces by using pre-trained components for dimension reduction and a supervised mapping component. The results of performance comparison between the proposed method on different human face datasets including Besel Face Model (BFM), and the images in the wild,, and other deep learning frameworks form the literature indicates the promising performance of the proposed methods. This framework also could be useful toward making FAVA operations intelligent.
سال انتشار
1399
عنوان نشريه
فناوري اطلاعات و ارتباطات انتظامي
فايل PDF
8240860
لينک به اين مدرک