عنوان مقاله :
تشخيص حالت احساسي از سيگنال گفتار در حالت مستقل از گوينده با استفاده از آنتروپي بسته موجك
عنوان فرعي :
Wavelet Packet Entropy in Speaker-Independent Emotional State Detection from Speech Signal
پديد آورندگان :
كدخدايي اليادراني، مينا نويسنده كارشناس ارشد گروه برق، موسسه آموزش عالي بنيان، شاهين شهر، اصفهان، ايران Kadkhodaei Elyaderani, MIna , محموديان، سيد حميد نويسنده , , شيخي، غزال نويسنده دانشجوي دكتري- دانشكده مهندسي كامپيوتر، دانشگاه مديترانه شرقي، تركيه Sheikhi, Ghazaal
اطلاعات موجودي :
فصلنامه سال 1393 شماره 20
رتبه نشريه :
فاقد درجه علمي
كليدواژه :
ماشين بردار پشتيبان , بسته موجك , تشخيص احساسات از گفتار , ضرايب آنتروپي شانون
چكيده فارسي :
در اين مقاله آنتروپي بسته موجك براي بازشناسي احساسات از گفتار در حالت مستقل از گوينده پيشنهاد شده است. پس از پيشپردازش، بسته موجكِ db3 سطح 4 در هر فريم محاسبه شده است و آنتروپي شانون در گرههاي آن به عنوان ويژگي در نظر گرفته شده است. ضمناً ويژگيهاي نواييِ گفتار شامل فركانس چهار فرمنت اول، جيتر يا دامنه تغييرات فركانس گام و شيمر يا دامنه تغييرات انرژي به عنوان ويژگيهاي پركاربرد در حوزه تشخيص احساسات در كنار ضرايب فركانسي كپسترال مل (MFCC) براي تكميل بردار ويژگي مورد استفاده قرار گرفتهاند. طبقهبندي با استفاده از ماشين بردار پشتيبان (SVM) انجام شده است و تركيبهاي مختلفي از بردار ويژگي در حالت چند دستهاي براي همه احساسات و دودستهاي نسبت به حالت طبيعي مورد بررسي قرار گرفتهاند. 46 بيانِ مختلف از جمله واحد در دادگان احساسي دانشگاه برلين به زبان آلماني انتخاب شده كه توسط 10 گوينده مختلف با حالتهاي احساسي ناراحتي، خوشحالي، ترس، ملالت، خشم و حالت طبيعي بيان شدهاند. نتايج نشان ميدهند استفاده از ضرايب آنتروپي به عنوان بردار ويژگي نرخ بازشناسي را در حالت چند دستهاي بهبود ميبخشد. علاوه بر آن ويژگيهاي پيشنهادي در تركيب با ساير ويژگيها باعث بهبود نرخ تشخيص احساس خشم، ترس و خوشحالي نسبت به حالت طبيعي ميشوند.
چكيده لاتين :
In this paper, wavelet packet entropy is proposed for speaker-independent emotion detection from speech. After pre-processing, wavelet packet decomposition using wavelet type db3 at level 4 is calculated and Shannon entropy in its nodes is calculated to be used as feature. In addition, prosodic features such as first four formants, jitter or pitch deviation amplitude, and shimmer or energy variation amplitude besides MFCC features are applied to complete the feature vector. Then, Support Vector Machine (SVM) is used to classify the vectors in multi-class (all emotions) or two-class (each emotion versus normal state) format. 46 different utterances of a single sentence from Berlin Emotional Speech Dataset are selected. These are uttered by 10 speakers in sadness, happiness, fear, boredom, anger, and normal emotional state. Experimental results show that proposed features can improve emotional state detection accuracy in multi-class situation. Furthermore, adding to other features wavelet entropy coefficients increase the accuracy of two-class detection for anger, fear, and happiness.
عنوان نشريه :
روشهاي هوشمند در صنعت برق
عنوان نشريه :
روشهاي هوشمند در صنعت برق
اطلاعات موجودي :
فصلنامه با شماره پیاپی 20 سال 1393
كلمات كليدي :
#تست#آزمون###امتحان