شماره ركورد
1141972
عنوان مقاله
بهسازي گفتار تككاناله با استفاده از تركيب مدل قطعي نمايي و مدل تصادفي t Location-Scale
پديد آورندگان
اميني ، زهرا دانشگاه بينالمللي امام خميني - گروه مهندسي برق , فرجي ، ندا دانشگاه بينالمللي امام خميني (ره) - گروه مهندسي برق
تعداد صفحه
18
از صفحه
63
تا صفحه
80
كليدواژه
بهسازي گفتار , تابع چگالي احتمال t Location-Scale , فيلتر وينر , كمترين ميانگين مربعات خطا , مدل قطعي نمايي , مدل سينوسي
چكيده فارسي
بيشتر روشهاي بهسازي گفتار، تخمينگري كاملاً متكي به مدل تصادفي گفتار ارائه ميدهند. در اين مقاله، يك تخمينگر كمترين ميانگين مربعات خطا تحت يك مدل قطعي تصادفي پيشنهاد ميشود كه در آن از يك توزيع دنباله سنگين به نام(tls) t location-scale براي مدلكردن ضرايب تبديل فوريه گسسته گفتار تميز و از مدل نمايي و سينوسي بهعنوان مدل قطعي استفاده شده است. در مدل نمايي بهكاررفته، تخمين فركانس و ضريب ميرايي به روش ماتريس پِنسِل انجام ميشود. همچنين، در پژوهشهاي قبلي تعداد مؤلفههاي نمايي در ساخت مدل قطعي براي بهسازي گفتار، يك در نظر گرفته شده است كه در اين مقاله، مدل نمايي به تعداد دلخواه مؤلفههاي نمايي بسط داده ميشود. پيادهسازيها در سه حالت تركيبي نمايي گاوسي (روش پيشنهادي نخست)، نمايي tls (روش پيشنهادي دوم) و سينوسي گاوسي انجام شدهاند و با روش موجود نمايي – گاوسي (تنها با يك مؤلفه نمايي) و تخمينگرهاي تصادفي وينر و مبتني بر tls مقايسه ميشوند. نتايج پيادهسازي در حضور شش نويز از مجموعه داده نويز noisex-92 نشان ميدهند كه دو روش پيشنهادي در قياس با روشهاي مبتني بر مدل تصادفي صرف، به بهبود معيار نسبت سيگنال به نويز قطعهاي منجر شدهاند و در ارزيابي ادراكي كيفيت گفتار عملكرد نسبتاً برابري دارند.
عنوان نشريه
هوش محاسباتي در مهندسي برق
لينک به اين مدرک