شماره ركورد :
1127178
عنوان مقاله :
بهبود كارايي تبديل موجك گسسته دوبعدي با استفاده از تكنيك موازي‌سازي در سطح داده
عنوان به زبان ديگر :
Performance Improvement of 2D Discrete Wavelet Transform using Data-Level Parallelism Technique
پديد آورندگان :
تيباش، عبدالبصير دانشگاه گيلان - دانشكده فني - گروه مهندسي كامپيوتر، رشت , شاه بهرامي ، اسدالله دانشگاه گيلان - دانشكده فني - گروه مهندسي كامپيوتر، رشت
تعداد صفحه :
12
از صفحه :
1547
تا صفحه :
1558
كليدواژه :
پردازشگرهاي همه‌منظوره , پردازش موازي , تبديل موجك گسسته دوبعدي , موازي‌سازي سطح داده , يك دستورالعمل چندين داده
چكيده فارسي :
تبديل موجك گسسته دوبعدي (2D-DWT) به‌صورت گسترده‌اي در كاربردهاي مختلف پردازش داده‌هاي چندرسانه‌اي ازجمله استانداردهاي فشرده‌سازي تصاوير و ويدئو مورداستفاده قرار مي‌گيرد. بااين‌وجود، اين تبديل داراي پيچيدگي محاسباتي بالاتري نسبت به تبديل‌هاي مرسوم مانند تبديل گسسته كسينوسي و ديگر توابع موجود در استانداردهاي فشرده‌سازي است و بيشترين درصد از زمان اجرا را به خود اختصاص مي‌دهد. در اين مقاله، براي بهبود كارايي 2D-DWT از مجموع دستورات فنّاوري‌هاي توسعه برداري پيشرفته AVX/AVX2 و جمع ضرب تركيبي (FMA) كه قابليت پردازش 256 بيت داده با استفاده از معماري يك دستورالعمل و چندين داده (SIMD) كه توسط اكثر پردازشگرهاي همه‌منظوره (GPP) پشتيباني مي‌گردد، پيشنهادشده است. با استفاده از اين فنّاوري‌ها قابليت پردازش هشت داده 32 بيتي براي اعداد اعشاري و شانزده داده 16 بيتي براي اعداد صحيح شانزده بيتي در ثبات‌هاي SIMD يك GPP فراهم مي‌گردد. بعلاوه نحوي نگاشت تبديل‌هاي مختلف موجك به روش پردازش‌هاي سطري-ستوني كه پردازش‌هاي سطري و ستوني را جداگانه انجام مي‌دهد و مبتني بر خط كه هر دو، سطرها و ستون‌هاي تصوير را در يك حلقه پردازش مي‌كند، استفاده‌شده است. نتايج پياده‌سازي موازي‌سازي تبديل‌هاي مختلف بر روي يك پلتفرم GPP نشان داد كه كارايي، 2D-DWT به ازاي اندازه تصاوير مختلف را مي‌توان تا 28.8 برابر نسبت به پياده‌سازي سريال بالا برد. همچنين نگاشت مبتني بر خط كه باعث استفاده بهتر از ساختار سلسله مراتبي حافظه مي‌گردد، كارايي را نسبت به نگاشت سطري – ستوني بيشتر بهبود مي‌دهد.
چكيده لاتين :
The two-Dimensional Discrete Wavelet Transform (2D-DWT) is widely used in various applications for multimedia data processing, including image and video compression standards. However, this transform is computational intensive than conventional conversions, such as the discrete cosine transform. In this paper, in order to improve the performance of 2D-DWT, we use Single Instruction, Multiple Data (SIMD) set instructions including Advanced Vector Extensions (AVX), Fused Multiply-Add (FMA), and AVX2 supported by most General-Purpose Processors (GPP). These technologies capable to process 256-bit data located in SIMD registers. The AVX technology can process eight 32-bit floating point numbers, while AVX2 processes sixteen 16-bit fixed-point numbers. In other words, it is possible to exploit 8- and 16-way data-level parallelism. In addition, two different way of parallelism, Row Column Wavelet Transform (RCWT) which processes rows and columns separately and Line-Based Wavelet Transform (LBWT) that processes both rows and columns in a single loop are used. Experimental results of different wavelet transform with different image sizes on a GPP show that the speedups of up to 28.8x yield. Furthermore, LBWT approach improves performance more than RCWT. This is because it uses memory hierarchy structure more efficiently than RCWT approach.
سال انتشار :
1398
عنوان نشريه :
مهندسي برق دانشگاه تبريز
فايل PDF :
7824216
لينک به اين مدرک :
بازگشت