شماره ركورد كنفرانس :
4418
عنوان مقاله :
باز شناسي مقاوم گفتار فارسي با استفاده از ضرايب مل-كپستروم بهبود يافته و شبكه عصبي
پديدآورندگان :
مروي حسين دانشگاه صنعتي شاهرود , دارابيان دانيال دانشگاه صنعتي شاهرود , شريف نوقابي مجتبي دانشگاه صنعتي شاهرود
كليدواژه :
بازشناسي گفتار , ضرايب مل-كپستروم , شبكه پرسپترون , فيلتربانك گوسي , ضرايب خودهمبستگي
عنوان كنفرانس :
يازدهمين كنفرانس سراسري سيستم هاي هوشمند
چكيده فارسي :
ضرايب مل-كپستروم يكي از فراگيرترين ويژگي هاي مورد استفاده در سيستم هاي تشخيص گفتار است. اساسي ترين مشكل اين ضرايب ، آسيب پذيري و حساسيت زياد آن ها در برابر نويز مي باشد . در اين مقاله براي دست يابي به يك عملكرد رضايت بخش تحت شرايط نويزي در سيستم هاي تشخيص گفتار يك الگوريتم جديد مصون در برابر نويز ، جهت محاسبه ي بردار ويژگي ضرايب مل- كپستروم معرفي شده است. در روش پيشنهادي ابتدا سيگنال پيش تاكيد شده را فريم بندي مي كنيم و سپس از يك پنجره ي بهبود يافته عبور مي دهيم ، در گام بعدي ضرايب خودهمبستگي سيگنال ورودي محاسبه مي شود و پس از حذف ضرايب مرتبه پايين، وارد بلوك FFT مي گردد.حاصل تبديل فوريه به يك فيلتر بانك گوسي داده مي شود و بعد از محاسبه طيف توان خروجي فيلتربانك ،به ترتيب با اعمال لگاريتم و تبديل كسينوسي برروي خروجي طيف ،ضرايب جديد به دست ميآيد .براي طبقه بندي و تست داده ها از يك شبكه عصبي پرسپترون چند لايه استفاده شده است .نتايج آزمايش براي شش نرخ سيگنال به نويز متفاوت ، نشانگر بهبود نرخ تشخيص سيگنال نويزي توسط الگوريتم پيشنهادي است