عنوان مقاله :
ارائه درونيابي KNNGI و مقايسه آن با درونيابي FI در بازشناسي گفتار
عنوان به زبان ديگر :
Presentation of K Nearest Neighbor Gaussian Interpolation and comparing it with Fuzzy Interpolation in Speech Recognition
پديد آورندگان :
صياديان، ابوالقاسم دانشگاه صنعتي اميركبير - دانشكده برق , بديع، كامبيز دانشگاه صنعتي اميركبير - دانشكده برق , شهرام معين، محمد مركز تحقيقات مخابرات ايران , مقدم، نصراله دانشگاه تربيت مدرس - دانشكده فني و مهندسي
كليدواژه :
بازشناسي تلفظ گسسته , مدل ماركف مخفي چگالي گسسته , درونيابي فازي , درونيابي گوسي
چكيده فارسي :
مدلسازي آماري HMM رويكردي پركاربرد در سيستمهاي بازشناسي گفتار پيوسته و گسسته است. توزيع احتمال بردارهاي مشاهدات هر حالت پنهان مدل، به دو روش پيوسته يا گسسته تخمين زده ميشوند. عملكرد توزيع احتمال پيوسته (با مدلسازي GMM5) بالاتر از عملكرد توزيع احتمال گسسته (با مدلسازي VQ6) است. ولي چنانچه بخواهيم از رويكرد HMM براي بازشناسي گفتار گسسته با دايره لغات وسيع استفاده كنيم، هزينه محاسباتي مرحله بازشناسي با افزايش تعداد لغات، به نحو چشمگيري افزايش مييابد. بدين لحاظ در بازشناسي گفتار گسسته با دايره لغات وسيع، از توزيع احتمال گسسته به منظور كاهش هزينه محاسباتي و امكان پيادهسازي بي درنگ استفاده ميشود. براي جبران كاهش دقت و عملكرد مدلسازي DD-HMM، استفاده از درونيابي فازي FI مرسوم است. در اين تحقيق روش درونيابي گوسي كه داراي پشتوانه نظري قويتر نسبت به FI است ارائه كردهايم. كارايي دو روش درونيابي KNNGI و FI در بازشناسي 1500 كلمه فارسي مورد تحقيق و بررسي قرار داديم. نتايج اين تحقيق نشان ميدهد كه دقت و انعطافپذيري درونيابي KNNGI بيشتر از روش FI است.
چكيده لاتين :
Hidden Markov Model is a popular statisical method that is used in continious and discrete speech recognition. The probability density function of observation vectors in each state is estimated with discrete density or continious density modeling. The performance (in correct word recognition rate) of continious density is higher than discrete density HMM, but its computation complexity is very high, especially in very large discrete utterance recognition problems. For real time implementation of very large discrete utterance recognition, we must use discrete density HMM (DDHMM). To increase the performance of DDHMM, one usual solution is fuzzy interpolation. In this study, we present a new method named Gaussian interpolation. We implemented and compared the performance of two types of interpolation methods for 1500 Persian speech command words. Results show that precision and flexibility of Gaussian interpolation is better thanthose of the fuzzy interpolation.
عنوان نشريه :
روشهاي عددي در مهندسي
عنوان نشريه :
روشهاي عددي در مهندسي