عنوان مقاله :
بهسازي گفتار تككاناله با استفاده از تركيب مدل قطعي نمايي و مدل تصادفي t Location-Scale
پديد آورندگان :
اميني ، زهرا دانشگاه بينالمللي امام خميني - گروه مهندسي برق , فرجي ، ندا دانشگاه بينالمللي امام خميني (ره) - گروه مهندسي برق
كليدواژه :
بهسازي گفتار , تابع چگالي احتمال t Location-Scale , فيلتر وينر , كمترين ميانگين مربعات خطا , مدل قطعي نمايي , مدل سينوسي
چكيده فارسي :
بيشتر روشهاي بهسازي گفتار، تخمينگري كاملاً متكي به مدل تصادفي گفتار ارائه ميدهند. در اين مقاله، يك تخمينگر كمترين ميانگين مربعات خطا تحت يك مدل قطعي تصادفي پيشنهاد ميشود كه در آن از يك توزيع دنباله سنگين به نام(tls) t location-scale براي مدلكردن ضرايب تبديل فوريه گسسته گفتار تميز و از مدل نمايي و سينوسي بهعنوان مدل قطعي استفاده شده است. در مدل نمايي بهكاررفته، تخمين فركانس و ضريب ميرايي به روش ماتريس پِنسِل انجام ميشود. همچنين، در پژوهشهاي قبلي تعداد مؤلفههاي نمايي در ساخت مدل قطعي براي بهسازي گفتار، يك در نظر گرفته شده است كه در اين مقاله، مدل نمايي به تعداد دلخواه مؤلفههاي نمايي بسط داده ميشود. پيادهسازيها در سه حالت تركيبي نمايي گاوسي (روش پيشنهادي نخست)، نمايي tls (روش پيشنهادي دوم) و سينوسي گاوسي انجام شدهاند و با روش موجود نمايي – گاوسي (تنها با يك مؤلفه نمايي) و تخمينگرهاي تصادفي وينر و مبتني بر tls مقايسه ميشوند. نتايج پيادهسازي در حضور شش نويز از مجموعه داده نويز noisex-92 نشان ميدهند كه دو روش پيشنهادي در قياس با روشهاي مبتني بر مدل تصادفي صرف، به بهبود معيار نسبت سيگنال به نويز قطعهاي منجر شدهاند و در ارزيابي ادراكي كيفيت گفتار عملكرد نسبتاً برابري دارند.
عنوان نشريه :
هوش محاسباتي در مهندسي برق