عنوان مقاله :
طبقهبندي شورايي تطبيقي براي تصديق گوينده مستقل از متن
عنوان به زبان ديگر :
Adaptive Ensemble Classification for Speaker Verification
پديد آورندگان :
هاشمي نژاد، محمد دانشگاه بيرجند - دانشكده مهندسي برق و كامپيوتر , فرسي، حسن دانشگاه بيرجند - دانشكده مهندسي برق و كامپيوتر , مهرشاد، ناصر دانشگاه بيرجند - دانشكده مهندسي برق و كامپيوتر
كليدواژه :
بازشناسي گوينده , تصديق گوينده , طبقهبندي شورايي , طبقهبندي شورايي تطبيقي , رگرسيون لجستيك
چكيده فارسي :
اين مقاله مسئله طبقهبندي شورايي را براي تصديق گوينده مستقل از متن بررسي ميكند. ازآنجاكه ممكن است يك طبقهبند از اطلاعات مختلف سيگنال گفتار بهره نبرد، استفاده از يك طبقهبند براي تصديق گوينده ممكن است منجر به تصميم قابلاعتمادي نشود. بنابراين بهترين سامانههاي تصديق گوينده از مجموعهاي از طبقهبندهاي مكمل براي رسيدن به تصميمات قابل اعتماد استفاده ميكنند. در اكثر مطالعات اخير كه روي تركيب طبقهبندها براي تصديق گوينده انجام شده است، تركيب خطي وزنداري از امتياز طبقهبندهاي خبره پايه براي رسيدن به امتياز نهايي تصديق استفاده ميشود كه وزنهاي اين تركيب با استفاده از روشي مانند رگرسيون لجستيك و در زمان آموزش به دست ميآيند. در اين تحقيقات مسائلي از قبيل همبستگي بين طبقهبندها و برتري برخي طبقهبندها براي برخي داده آزمون به خوبي در نظر گرفته نشده است. در اين مقاله با استفاده از فرايند طراحي شورا و قاعده تركيب بر اساس داده آزمون براي هر دو مسئله راهحلي ارائه ميشود. بررسيهاي انجامشده ما روي دادگان ارزيابي تصديق گوينده NIST 2004 نشان ميدهد روش پيشنهادي در مقايسه با روش مبناي تركيب تنك طبقهبندها كارايي مناسبي را دارد.
چكيده لاتين :
This paper considers the ensemble classification for the text independent speaker verification issue. Using one classifier for the speaker verification may not result in dependable decision, because it may not exploit different characteristics of speech signal. Therefore, state-of-the-art speaker verification systems use an ensemble of classifiers for the verification. Most of the ensemble speaker verification systems use a weighted summation of the score of the individual expert classifiers to calculate the final score of the verification. The weights of this score fusion is obtained using a method, e.g. logistic regression, in the training phase. These works do not efficiently take into account issues such as correlation of classifiers and instance specific behavior of the base classifiers into account. In this paper a new solution is proposed for these two issues by using the process of ensemble design and combination rule based on training data. The obtained results on NIST 2004 speaker evaluation corpus show the effectiveness of the proposed methods in comparison to the sparse classifier fusion, as a baseline method.
عنوان نشريه :
مهندسي برق دانشگاه تبريز
عنوان نشريه :
مهندسي برق دانشگاه تبريز