شماره ركورد كنفرانس :
4180
عنوان مقاله :
روشي جديد براي استخراج ويژگيصحبت مبتني بر استفاده از ويژگي طيفي دلتا و Invariant-integration
پديدآورندگان :
فرسي حسن Hs_farsi@yahoo.co.uk دانشگاه آزاد واحد بيرجند
كليدواژه :
بازشناسيصحبت , vocal-tract length , پوشش موقتي , فيلترغيرخطينامتقارن , ويژگيهاي كپسترالدلتا , Invariant-integration
عنوان كنفرانس :
اولين كنفرانس ملي فناوري هاي نوين در علوم مهندسي
چكيده فارسي :
در اين مقاله يك الگوريتماستخراجويژگيجديد مقاومبهنويز را پيشنهاد ميدهيم . در اين الگوريتماستخراجويژگي از يك فيلتر غيرخطي و پوششموقتي استفاده ميكنيم و با بهرهگيري از ويژگي دلتا-طيفي بجاي ويژگي دلتا-كپسترال دقت بازشناسيصحبت را بطور مطلوبي افزايش ميدهيم. تقريبا همهي سيستمهاي ASR كنوني از ويژگيهاي كپسترال دلتا و دلتا-دلتا براي استخراج ويژگي صحبت استفاده ميكنند. از جمله عواملي غيرمحيطي كه باعث كاهش دقت بازشناسي ميشود ميتوان به vocal-tract length اشاره كرد كه منجر به عدم تطبيق ميان داده ي training و testing ميشود. براي كاهش تأثيرات VTL ميتوان از ايده ي IIF استفاده نمود. در اين مقاله هدف، رسيدن به ويژگيهاي مقاومي است كه علاوه بر اينكه در شرايط مختلف نويزي بهبودهايي را فراهم كند در مقابل تغييرات تأثيرات VTL نيز مقاوم باشد. نتايج نشان ميدهد كه دقتبازشناسي درمقايسه با MFCC و PLPدر حضور انواع مختلفي از نويز و همچنين در دو سناريوي مختلف VTL بهبود يافته است.