شماره ركورد :
672143
عنوان مقاله :
تقطيع هجايي گفتار پيوسته فارسي با استفاده از آستانه‌گذاري ضرايب موجك و نرم‌سازي فازيِ تابع انرژي
عنوان فرعي :
Syllable Segmentation of Farsi Continuous Speech Using Wavelet Coefficients Thresholding and Fuzzy Smoothing of Energy Contour
پديد آورندگان :
شيخي، غزال نويسنده كارشناس ارشد - مهندسي پزشكي، عضو هيات مديره شركت جويشگر ريزگستر، شهرك علمي و تحقيقاتي اصفهان Sheikhi, Ghazaal , محموديان، سيد حميد نويسنده ,
اطلاعات موجودي :
فصلنامه سال 1392 شماره 15
رتبه نشريه :
علمي پژوهشي
تعداد صفحه :
11
از صفحه :
19
تا صفحه :
29
كليدواژه :
آستانه‌گذاري ضرايب موجك , تقطيع هجايي , تبديل موجك , فيلتر فازي , همخوان , واكه , انرژي زمان كوتاه
چكيده فارسي :
امروزه در تحقيقات حوزه پردازش و بازشناخت گفتار، هجا به دليل ارتباط قوي آن با توليد و ادراك گفتار در انسان، به عنوان يك واحد زيركلمه‌اي هر روز بيشتر مورد توجه قرار مي‌گيرد. آشكارسازي خودكار مرزهاي هجايي گامي مهم در تحقيقات مرتبط با نواي گفتار، توليد گفتار طبيعي و حتي بازشناسي گفتار است. در اين مقاله روش جديدي براي آشكارسازي خودكار مرزهاي هجايي در سيگنال گفتار پيوسته فارسي با تكيه بر اطلاعات صوتي ارايه شده است. تحقيقات قبليِ نويسندگان اين مقاله، كارآيي نرم سازي فازيِ تابع انرژي را در مقايسه با ساير روش‌هاي به كار رفته در اين زمينه نشان مي‌دهد. در اين تحقيق، پيشنهاد شده است كه از روشي مشابه روش‌هاي متداول حذف نويز از گفتار به وسيله آستانه گذاري ضرايب موجك براي بهبود خطاي درج مرز اضافه استفاده شود. اين روند، انرژي همخوان‌هاي بي‌واكي را كه در تابع انرژي قله‌هاي اضافه ايجاد مي‌كنند، به شدت كاهش مي‌دهد. نتايج نشان مي‌دهند با استفاده همزمان از اين روش و روش نرم سازي فازي تابع انرژي، خطاي درج مرز اضافه در حدود %8 كاهش مي‌يابد؛ بدون آنكه ساير معيارهاي كارآيي تحت تاثير قرار گيرند. با استفاده از روش پيشنهادي بيش از %94 از هجاها با خطايي كمتر از 50 ميلي ثانيه تقطيع مي‌شوند
چكيده لاتين :
Syllable, as a sub-word unit, nowadays plays an active role in the field of speech processing and recognition research according to its robust relation to human speech production and cognition. Automatic syllable boundaries detection is an important step forward in the areas of speech prosody, natural speech synthesis and speech recognition. In this paper, a novel method in automatic syllabification of Farsi continuous speech based on acoustic structure is proposed. Our previous studies, showed the proficiency of energy contour fuzzy smoothing method, compared with other prominent works in this area. This paper suggests that the conventional methodology-used in speech enhancement based on wavelet coefficient thresholding would improve syllable segmentation by decreasing insertion error. This process declines the energy in high energy consonants which are responsible for extra peaks in short term energy contour. Experimental results showed that utilizing proposed method along with fuzzy smoothing would diminish insertion error about 8% with no reasonable effect on other efficiency criteria. More than 94% of syllables are automatically segmented using presented technique with less than 50ms error.
سال انتشار :
1392
عنوان نشريه :
روشهاي هوشمند در صنعت برق
عنوان نشريه :
روشهاي هوشمند در صنعت برق
اطلاعات موجودي :
فصلنامه با شماره پیاپی 15 سال 1392
كلمات كليدي :
#تست#آزمون###امتحان
لينک به اين مدرک :
بازگشت