عنوان مقاله :
تقطيع هجايي گفتار پيوسته فارسي با استفاده از آستانهگذاري ضرايب موجك و نرمسازي فازيِ تابع انرژي
عنوان فرعي :
Syllable Segmentation of Farsi Continuous Speech Using Wavelet Coefficients Thresholding and Fuzzy Smoothing of Energy Contour
پديد آورندگان :
شيخي، غزال نويسنده كارشناس ارشد - مهندسي پزشكي، عضو هيات مديره شركت جويشگر ريزگستر، شهرك علمي و تحقيقاتي اصفهان Sheikhi, Ghazaal , محموديان، سيد حميد نويسنده ,
اطلاعات موجودي :
فصلنامه سال 1392 شماره 15
كليدواژه :
آستانهگذاري ضرايب موجك , تقطيع هجايي , تبديل موجك , فيلتر فازي , همخوان , واكه , انرژي زمان كوتاه
چكيده فارسي :
امروزه در تحقيقات حوزه پردازش و بازشناخت گفتار، هجا به دليل ارتباط قوي آن با توليد و ادراك گفتار در انسان، به عنوان يك واحد زيركلمهاي هر روز بيشتر مورد توجه قرار ميگيرد. آشكارسازي خودكار مرزهاي هجايي گامي مهم در تحقيقات مرتبط با نواي گفتار، توليد گفتار طبيعي و حتي بازشناسي گفتار است. در اين مقاله روش جديدي براي آشكارسازي خودكار مرزهاي هجايي در سيگنال گفتار پيوسته فارسي با تكيه بر اطلاعات صوتي ارايه شده است. تحقيقات قبليِ نويسندگان اين مقاله، كارآيي نرم سازي فازيِ تابع انرژي را در مقايسه با ساير روشهاي به كار رفته در اين زمينه نشان ميدهد. در اين تحقيق، پيشنهاد شده است كه از روشي مشابه روشهاي متداول حذف نويز از گفتار به وسيله آستانه گذاري ضرايب موجك براي بهبود خطاي درج مرز اضافه استفاده شود. اين روند، انرژي همخوانهاي بيواكي را كه در تابع انرژي قلههاي اضافه ايجاد ميكنند، به شدت كاهش ميدهد. نتايج نشان ميدهند با استفاده همزمان از اين روش و روش نرم سازي فازي تابع انرژي، خطاي درج مرز اضافه در حدود %8 كاهش مييابد؛ بدون آنكه ساير معيارهاي كارآيي تحت تاثير قرار گيرند. با استفاده از روش پيشنهادي بيش از %94 از هجاها با خطايي كمتر از 50 ميلي ثانيه تقطيع ميشوند
چكيده لاتين :
Syllable, as a sub-word unit, nowadays plays an active role in the field of speech processing and recognition research according to its robust relation to human speech production and cognition. Automatic syllable boundaries detection is an important step forward in the areas of speech prosody, natural speech synthesis and speech recognition. In this paper, a novel method in automatic syllabification of Farsi continuous speech based on acoustic structure is proposed. Our previous studies, showed the proficiency of energy contour fuzzy smoothing method, compared with other prominent works in this area. This paper suggests that the conventional methodology-used in speech enhancement based on wavelet coefficient thresholding would improve syllable segmentation by decreasing insertion error. This process declines the energy in high energy consonants which are responsible for extra peaks in short term energy contour. Experimental results showed that utilizing proposed method along with fuzzy smoothing would diminish insertion error about 8% with no reasonable effect on other efficiency criteria. More than 94% of syllables are automatically segmented using presented technique with less than 50ms error.
عنوان نشريه :
روشهاي هوشمند در صنعت برق
عنوان نشريه :
روشهاي هوشمند در صنعت برق
اطلاعات موجودي :
فصلنامه با شماره پیاپی 15 سال 1392
كلمات كليدي :
#تست#آزمون###امتحان