شماره ركورد :
1343574
عنوان مقاله :
تشخيص خودكار گوينده مبتني بر ويژگي هاي استخراج شده از بانك فيلتر گابور و شبكه هاي عصبي كانولوشنال
پديد آورندگان :
رشنو ، عبدالرضا دانشگاه لرستان - دانشكده مهندسي , فدايي ، صادق دانشگاه ياسوج - دانشكده مهندسي , حميدي ، عبدالصمد دانشگاه لرستان - دانشكده مهندسي
از صفحه :
49
تا صفحه :
67
كليدواژه :
بانك فيلتر گابور , اسپكتروگرام , تشخيص گوينده , شبكه ي عصبي كانولوشنال
چكيده فارسي :
صداي يك انسان حاوي خصوصياتي از قبيل: قوميت، جنسيت، احساس، سن و اطلاعات ديگري از فرد است و موضوع تشخيص گوينده به شناسايي هويت افراد بر اساس صداي آنها مي‌پردازد. اگرچه محققان در طول سال‌هاي گذشته در اين زمينه فعاليت داشته‌اند و روش‌هايي براي بهبود دقت تشخيص گوينده پيشنهاد داده‌اند اما هنوز چالش‌هايي در اين زمينه وجود دارد. در اين مقاله يك روش جديد تشخيص گوينده مبتني بر فيلترهاي گابور و شبكه‌هاي عصبي كانولوشنال ارايه شده است. در روش پيشنهادي، ابتدا اسپكتروگرام سيگنال صحبت فرد تشكيل مي‌شود. سپس با طراحي موثر فيلترهاي گابور، بانك فيلتر گابور ايجاد مي‌گردد. در مرحله‌ي بعد اسپكتروگرام سيگنال از بانك فيلتر گابور عبور داده شده و ويژگي‌هاي سيگنال صحبت استخراج مي‌شود. در مرحله‌ي آخر با استفاده از يك شبكه‌ي عصبي كانولوشنال، گوينده شناسايي مي‌شود. براي ارزيابي روش پيشنهادي از دو پايگاه داده‌ي Aurora2 و TIMIT استفاده شده است. نتايج نشان مي‌دهد كه روش پيشنهادي دقت بهتري نسبت به روش‌هاي پيشين دارد.
عنوان نشريه :
مدل سازي در مهندسي
عنوان نشريه :
مدل سازي در مهندسي
لينک به اين مدرک :
بازگشت