شماره ركورد كنفرانس :
4330
عنوان مقاله :
استفاده از شبكهي عصبي پرسپترون چند لايه جهت بهبود كارآيي سيستم تصديق هويت گوينده
پديدآورندگان :
تهجدي زينب سادات Z_tahajjodi@shahroodut.ac.ir دانشگاه صنعتي شاهرود , مروي حسين H.marvi@shahroodut.ac.ir دانشگاه صنعتي شاهرود
كليدواژه :
تصديق هويت گوينده , شبكهي عصبي پرسپترون چند لايه , ويژگي MFCC , ويژگي PLP.
عنوان كنفرانس :
هفدهمين كنفررانس ملي سيستم هاي فازي، پانزدهمين كنفرانس ملي سيستم هاي هوشمند و ششمين كنگره ملي مشترك سيستم هاي فازي و هوشمند ايران
چكيده فارسي :
سيستم تصديق هويت گوينده، گويندهي ورودي را با مدل گويندهاي كه وي ادعا ميكند، تطبيق داده و با توجه به ميزان مطابقت، وي را قبول يا رد ميكند. در اين مقاله با استفاده از شبكهي عصبي پرسپترون چند لايه، سيگنال گفتار گويندگان مدل ميشود. براي ساخت مدل بخشي از دادگان Timitو ويژگيهاي MFCC و PLP به كار رفته است. نتايج حاصل از عملكرد MLP با كارآبي روشهاي تمايزي SVM، LLR و RBF مقايسه شده و نتايج نشان ميدهد استفاده از MLP براي مدل كردن صداي گويندگان، حداقل 23/ 9% با ويژگي MFCC و 92/ 5% با ويژگي PLP بهتر از ساير روشهاي تمايزي در محيط بدون نويز عمل ميكند. در محيط نويزي نيز، MLP پايدارتر از ساير روشها عمل كرده و حداقل1 /5% با ويژگي MFCC و 58/ 6% با ويژگي PLP بهتر از ساير روشها تصديق هويت گوينده را انجام ميدهد.