عنوان مقاله :
تخمين سريع ضرايب پيچش در هنجارسازي طول مجراي صوتي با استفاده از امتياز به دست آمده از مدلسازي تشخيص جنسيت
پديد آورندگان :
شكفته، ياسر نويسنده , , قلي پور، حسن نويسنده , , گودرزي، محمدمحسن نويسنده , , كبوديان، جهانشاه نويسنده , , الماس گنج، فرشاد نويسنده , , رضا، شقايق نويسنده , , صراف رضايي، ايمان نويسنده ,
اطلاعات موجودي :
فصلنامه سال 1395 شماره 27
كليدواژه :
رگرسيون خطي , هنجارسازي طول مجراي صوتي , ضريب پيچش فركانسي , بازشناسي گفتار , تشخيص جنسيت
چكيده فارسي :
يكي از مشكلات عمدهي سامانههاي خودكار بازشناسي گفتار (ASR)، تنوعات موجود در بين گويندهها، كانال انتقال داده و محيط است كه به علت وجود اين تنوعات، كارايي اين سامانه ها در شرايط كاربردي مختلف به شدت تغيير مي كند. مقاوم سازي سيستمهاي بازشناسي جهت مقابله با اين تغييرات از جمله مسائل حال حاضر در حوزه بازشناسي گفتار است. از جمله عواملي كه باعث كاهش كارايي سيستمها ميشود، تمايز مشخصات صوتي آواهاي يكسانِ توليد شده از گويندههاي مختلف است. يكي از عوامل اصلي اين مشكل ناشي از تفاوت موجود در طول مجراي صوتي (VTL) بين گويندههاي مختلف مي باشد. روش هنجارسازي طول مجراي صوتي (VTLN) از روشهاي رايج براي رفع اين مشكل است كه در آن براي هر گوينده يك ضريب پيچش فركانسي تعيين ميگردد. در اين مقاله روش متداول تعيين ضريب پيچش با رويكرد مبتني بر جستجو در يك سيستم بازشناسي گفتار پيوسته فارسي مبتني بر مدل مخفي ماركوف معرفي و مشكلات محاسباتي استفاده از اين روش شرح داده شده است. در نهايت روشي مبتني بر رگرسيون خطي از روي امتيازِ محاسبه شده از مدلسازي تشخيص جنسيت جهت تخمين ضرايب پيچش پيشنهاد شده است كه منجر به كاهش قابل ملاحظه هزينه محاسباتيِ روش مبتني بر جستجو ميشود. علاوه بر اين، نتايج آزمايشات بر روي دادگان آزمون گفتار تلفني محاورهاي، بيانگر بهبود 54/0 درصدي دقت تشخيص كلمه روش پيشنهادي نسبت به روش متداول مبتني بر جستجو ميباشد.
عنوان نشريه :
پردازش علائم و داده ها
عنوان نشريه :
پردازش علائم و داده ها
اطلاعات موجودي :
فصلنامه با شماره پیاپی 27 سال 1395
كلمات كليدي :
#تست#آزمون###امتحان