شماره ركورد كنفرانس :
3704
عنوان مقاله :
ارائه روشي جهت بهبود كارايي سيستم هاي بازشناسي گويندگان بر اساس هم افزايي الگوريتم ژنتيك با دسته بند مدل مخلوط گوسي به منظور انتخاب ويژگي هاي مؤثر گفتار
عنوان به زبان ديگر :
A Method for Improving the Performance of Speech Recognition Systems Based on the Synergy of Genetic Algorithms with the Gaussian Mixture Model Classifier in order to select the effective features of speech
پديدآورندگان :
بهاري پور هستي baharipour@gmail.com دانشگاه آزاد اسلامي واحد دزفول;
تعداد صفحه :
12
كليدواژه :
شناسايي گوينده , مستقل از متن , مدل مخلوط گوسي , انتخاب ويژگي , الگوريتم ژنتيك
سال انتشار :
1396
عنوان كنفرانس :
پنجمين كنفرانس بين المللي در مهندسي برق و كامپيوتر با تاكيد بر دانش بومي
زبان مدرك :
فارسي
چكيده فارسي :
يكي از روش هاي شناسايي گويندگان بر اساس ويژگي هاي گفتار است. معمولاً تمام ويژگي هاي گفتار انسان مفيد و مؤثر نيستند. وجود ويژگي هاي زياد، تكراري و نامناسب باعث بالا رفتن هزينه مدل سازي و كاهش دقت در شناسايي گوينده مي شود. هدف از انتخاب ويژگي، كاهش هزينه هاي محاسباتي و اقتصادي، حداقل كردن ابعاد فضاي ويژگي و افزايش دقت دسته بند است. در اين مقاله، ابتدا يك روش مبتني بر هم افزايي الگوريتم تكاملي ژنتيك با مدل مخلوط گوسي (GMM-GA) به منظور شناسايي هويت گويندگان مستقل از متن، بر اساس انتخاب ويژگي هاي مناسب گفتار ارائه شده است؛ سپس روش پيشنهادي بر روي دو گروه 40 و 60 نفري از گويندگان پايگاه داده فارس دات مورد آزمايش قرار گرفت؛ و روش پيشنهادي GMM-GA با روش شناسايي گويندگان مبتني بر دسته بند مدل مخلوط گوسي مقايسه شد. نتايج آزمايشات دو گروه نشان دادند كه در روش پيشنهادي، الگوريتم ژنتيك با انتخاب مناسب ويژگي هاي گفتار گوينده، متوسط دقت شناسايي گويندگان مستقل از متن را نسبت به مدل مخلوط گوسي پايه به ترتيب %11/37 و%8/33 افزايش داد. همچنين تعداد ويژگي هاي انتخابي در اين روش به ترتيب %53/84 و %48/7نسبت به مدل مخلوط گوسي پايه كاهش يافت.
چكيده لاتين :
One of the methods for identifying speakers is based on speech features. Usually all human speech features are not useful and effective. numerous, repetitive and inadequate features increase the cost of modeling and reduce the accuracy of the speaker identification. The purpose of the feature selection is to reduce the computational and economic costs, minimize the dimensions of the feature space, and increase the accuracy of the classification. In this paper, a synthetic method based on Genetic Algorithm with a Gaussian Mixture Model GMM-GA is designed to identify the identity of speech independent speakers based on the selection of appropriate speech features. The proposed method was then tested on two groups of 40 and 60 Farsdat database speakers. The proposed GMM-GA method was compared with the methodology used to identify the speakers based on the Gaussian mixture model. The results of the experiments in the two groups showed that in the proposed method, the genetic algorithm with an appropriate selection of speaker speech features increased the mean accuracy of the text independent speakers compared to the basic gaussian mixture model of 11.37% and 8.33%, respectively. Also, the number of selected features in this method decreased 53.84% and 48.7%, respectively, compared to the base Gaussian mix model.
كشور :
ايران
لينک به اين مدرک :
بازگشت