عنوان مقاله :
بهبود كارايي تبديل موجك گسسته دوبعدي با استفاده از تكنيك موازيسازي در سطح داده
عنوان به زبان ديگر :
Performance Improvement of 2D Discrete Wavelet Transform using Data-Level Parallelism Technique
پديد آورندگان :
تيباش، عبدالبصير دانشگاه گيلان - دانشكده فني - گروه مهندسي كامپيوتر، رشت , شاه بهرامي ، اسدالله دانشگاه گيلان - دانشكده فني - گروه مهندسي كامپيوتر، رشت
كليدواژه :
پردازشگرهاي همهمنظوره , پردازش موازي , تبديل موجك گسسته دوبعدي , موازيسازي سطح داده , يك دستورالعمل چندين داده
چكيده فارسي :
تبديل موجك گسسته دوبعدي (2D-DWT) بهصورت گستردهاي در كاربردهاي مختلف پردازش دادههاي چندرسانهاي ازجمله استانداردهاي فشردهسازي تصاوير و ويدئو مورداستفاده قرار ميگيرد. بااينوجود، اين تبديل داراي پيچيدگي محاسباتي بالاتري نسبت به تبديلهاي مرسوم مانند تبديل گسسته كسينوسي و ديگر توابع موجود در استانداردهاي فشردهسازي است و بيشترين درصد از زمان اجرا را به خود اختصاص ميدهد. در اين مقاله، براي بهبود كارايي 2D-DWT از مجموع دستورات فنّاوريهاي توسعه برداري پيشرفته AVX/AVX2 و جمع ضرب تركيبي (FMA) كه قابليت پردازش 256 بيت داده با استفاده از معماري يك دستورالعمل و چندين داده (SIMD) كه توسط اكثر پردازشگرهاي همهمنظوره (GPP) پشتيباني ميگردد، پيشنهادشده است. با استفاده از اين فنّاوريها قابليت پردازش هشت داده 32 بيتي براي اعداد اعشاري و شانزده داده 16 بيتي براي اعداد صحيح شانزده بيتي در ثباتهاي SIMD يك GPP فراهم ميگردد. بعلاوه نحوي نگاشت تبديلهاي مختلف موجك به روش پردازشهاي سطري-ستوني كه پردازشهاي سطري و ستوني را جداگانه انجام ميدهد و مبتني بر خط كه هر دو، سطرها و ستونهاي تصوير را در يك حلقه پردازش ميكند، استفادهشده است. نتايج پيادهسازي موازيسازي تبديلهاي مختلف بر روي يك پلتفرم GPP نشان داد كه كارايي، 2D-DWT به ازاي اندازه تصاوير مختلف را ميتوان تا 28.8 برابر نسبت به پيادهسازي سريال بالا برد. همچنين نگاشت مبتني بر خط كه باعث استفاده بهتر از ساختار سلسله مراتبي حافظه ميگردد، كارايي را نسبت به نگاشت سطري – ستوني بيشتر بهبود ميدهد.
چكيده لاتين :
The two-Dimensional Discrete Wavelet Transform (2D-DWT) is widely used in various applications for multimedia data processing, including image and video compression standards. However, this transform is computational intensive than conventional conversions, such as the discrete cosine transform. In this paper, in order to improve the performance of 2D-DWT, we use Single Instruction, Multiple Data (SIMD) set instructions including Advanced Vector Extensions (AVX), Fused Multiply-Add (FMA), and AVX2 supported by most General-Purpose Processors (GPP). These technologies capable to process 256-bit data located in SIMD registers. The AVX technology can process eight 32-bit floating point numbers, while AVX2 processes sixteen 16-bit fixed-point numbers. In other words, it is possible to exploit 8- and 16-way data-level parallelism. In addition, two different way of parallelism, Row Column Wavelet Transform (RCWT) which processes rows and columns separately and Line-Based Wavelet Transform (LBWT) that processes both rows and columns in a single loop are used. Experimental results of different wavelet transform with different image sizes on a GPP show that the speedups of up to 28.8x yield. Furthermore, LBWT approach improves performance more than RCWT. This is because it uses memory hierarchy structure more efficiently than RCWT approach.
عنوان نشريه :
مهندسي برق دانشگاه تبريز