شماره ركورد كنفرانس :
3752
عنوان مقاله :
مقاوم سازي سيستم هاي تشخيص گفتار در برابر اعوجاج غيرخطي
پديدآورندگان :
خدادوستان فريناز Kh4618@yahoo.com دانشگاه آزاد اسلامي نجف آباد , جباري مسعود jabbari.masoud@gmail.com دانشگاه آزاد اسلامي نجف آباد
كليدواژه :
تشخيص گفتار , فشرده سازي محدوده ديناميكي غيرخطي , روش هاي يادگيري عميق
عنوان كنفرانس :
اولين كنفرانس بين المللي مهندسي و علوم كامپيوتر
چكيده فارسي :
درخصوص سيستم هاي تشخيص گفتار خودكار ،عملكرد، قابليت اطمينان وحضور در همه جا در سال هاي اخير رونق گرفته است و اين به دليل افزايش قدرت محاسباتي و نوآوري هاي تكنولوژيك مانند مدلهاي پنهان ماركوف، وزن گيري حالت محدود و روش هاي يادگيري عميق است . يكي از مشكلاتي كه آفت سيستم تشخيص گفتار مي باشد ، به ويژه كساني كه كارآفلاين انجام مي دهند و با داده هاي خاص آموزش داده شده اند ، اثر مخرب نويز در دقت تشخيص گفتار است .
هدف اين مقاله بررسي اثرات فشرده سازي محدوده ديناميكي غيرخطي در تشخيص گفتار خودكار و توسعه تعدادي از تكنيك هاي جديد براي توصيف و مقابله با آن است .اين مقاله مشكل فشرده سازي محدوده ديناميكي را در سه روش انجام مي دهد.1 -روش دامنه بليند عادي، كه با فشرده سازي محدوده ديناميكي مقابله ميكند زمانيكه كه مقادير پارامتر آن اجازه مي دهد كه تابع به صورت رياضي معكوس باشد.2 -تكنيك هاي بازسازي دامنه بليند، به عنوان مثال، declipping ،كه تالش براي بازسازي بخش هاي كوتاه از سيگنال گفتار كه از طريق فشرده سازي محدوده ديناميكي غير معكوس از درست رفته اند،را مي كند.3 -تكنيك آموزش همسان، كه تالش براي انتخاب مدل آكوستيك از قبل آموزش ديده با نزديك ترين مجموعه اي از پارامترهاي فشرده سازي انجام مي دهد.
هر سه اين روش ها برتخمين مقاوم از محدوده ديناميكي پارامترهاي اعوجاج فشرده سازي تكيه مي كنند .الگوريتم هاي جديد براي پيش بيني بليند از اين پارامترها نيز معرفي شده اند .كيفيت الگوريتم از نظر درجه اي كه باعث كاهش ميزان خطا تشخيص گفتار كلمه، و همچنين از نظر درجه اي كه آنها نسبت سيگنال به نويز يك سيگنال سخنراني را افزايش دهد مورد بررسي قرار گرفته است.