شماره ركورد :
1010268
عنوان مقاله :
ارائه درون‌يابي KNNGI و مقايسه آن با درون‌يابي FI در بازشناسي گفتار
عنوان به زبان ديگر :
Presentation of K Nearest Neighbor Gaussian Interpolation and comparing it with Fuzzy Interpolation in Speech Recognition
پديد آورندگان :
صياديان، ابوالقاسم دانشگاه صنعتي اميركبير - دانشكده برق , بديع، كامبيز دانشگاه صنعتي اميركبير - دانشكده برق , شهرام معين، محمد مركز تحقيقات مخابرات ايران , مقدم، نصراله دانشگاه تربيت مدرس - دانشكده فني و مهندسي
تعداد صفحه :
10
از صفحه :
1
تا صفحه :
10
كليدواژه :
بازشناسي تلفظ گسسته , مدل ماركف مخفي چگالي گسسته , درون‌يابي فازي , درون‌يابي گوسي
چكيده فارسي :
مدل‌سازي آماري HMM رويكردي پركاربرد در سيستمهاي بازشناسي گفتار پيوسته و گسسته است. توزيع احتمال بردارهاي مشاهدات هر حالت پنهان مدل، به دو روش پيوسته يا گسسته تخمين زده مي‌شوند. عملكرد توزيع احتمال پيوسته (با مدل‌سازي GMM5) بالاتر از عملكرد توزيع احتمال گسسته (با مدل‌سازي VQ6) است. ولي چنانچه بخواهيم از رويكرد HMM براي بازشناسي گفتار گسسته با دايره لغات وسيع استفاده كنيم، هزينه محاسباتي مرحله بازشناسي با افزايش تعداد لغات، به نحو چشمگيري افزايش مي‌يابد. بدين لحاظ در بازشناسي گفتار گسسته با دايره لغات وسيع، از توزيع احتمال گسسته به منظور كاهش هزينه محاسباتي و امكان پياده‌سازي بي درنگ استفاده مي‌شود. براي جبران كاهش دقت و عملكرد مدل‌سازي DD-HMM، استفاده از درون‌يابي فازي FI مرسوم است. در اين تحقيق روش درون‌يابي گوسي كه داراي پشتوانه نظري قوي‌تر نسبت به FI است ارائه كرده‌ايم. كارايي دو روش درون‌يابي KNNGI و FI در بازشناسي 1500 كلمه فارسي مورد تحقيق و بررسي قرار داديم. نتايج اين تحقيق نشان مي‌دهد كه دقت و انعطاف‌پذيري درون‌يابي KNNGI بيشتر از روش FI است.
چكيده لاتين :
Hidden Markov Model is a popular statisical method that is used in continious and discrete speech recognition. The probability density function of observation vectors in each state is estimated with discrete density or continious density modeling. The performance (in correct word recognition rate) of continious density is higher than discrete density HMM, but its computation complexity is very high, especially in very large discrete utterance recognition problems. For real time implementation of very large discrete utterance recognition, we must use discrete density HMM (DDHMM). To increase the performance of DDHMM, one usual solution is fuzzy interpolation. In this study, we present a new method named Gaussian interpolation. We implemented and compared the performance of two types of interpolation methods for 1500 Persian speech command words. Results show that precision and flexibility of Gaussian interpolation is better thanthose of the fuzzy interpolation.
سال انتشار :
1383
عنوان نشريه :
روشهاي عددي در مهندسي
فايل PDF :
7452648
عنوان نشريه :
روشهاي عددي در مهندسي
لينک به اين مدرک :
بازگشت