شماره ركورد كنفرانس :
4747
عنوان مقاله :
تأثير نوع نوفه در قابليت فهم گفتار و نسبت سيگنال به نوفهي مناسب جهت استفاده از الگوريتمهاي بهبود گفتار
پديدآورندگان :
مهديان راهيل دانشگاه صداوسيماي جمهوري اسلامي ايران , صحت محمدمهدي دانشگاه صداوسيماي جمهوري اسلامي ايران
كليدواژه :
قابليت فهم گفتار , سيستم ASR , الگوريتمهاي بهبود گفتار , كيفيت گفتار.
عنوان كنفرانس :
اجلاس فناوري رسانه
چكيده فارسي :
گفتار سادهترين و معمولترين ارتباط بين انسانها است. امروزه الگوريتمهاي حذف نوفه ي زيادي بهمنظور بهبود قابليت فهم گفتار پيشنهاد ميشوند و سازندگان اين الگوريتمها براي نمايش كارايي الگوريتم پيشنهادي خود از معيارهاي ارزيابي كيفيت صدا استفاده ميكنند. آن چه باعث فهميده شدن گفتار ميشود؛ قابليت فهم است نه كيفيت، چون ممكن است يك گفتار باكيفيت باشد، اما قابليت فهم كافي نداشته باشد. اندازهگيري قابليت فهم گفتار، جز از طريق ارزيابيهاي ذهني يا استفاده از نتايج سيستم ASR ممكن نيست. در اين تحقيق فرض شده نتايج سيستم ASR، نماد قابليت فهم گفتار بوده و اين نتايج با استفاده از مدل آوايي SAT و پايگاه دادهي timit بهدستآمده است. در ادامهي تحقيق سه نوآوري ارائه گرديده: 1- با استفاده از پايگاه دادهي timit كه سيستم ASR قبلاً براي آن setup شده؛ عملكرد 17 الگوريتم حذف نوفهي مختلف در حذف 120 نوفهي متفاوت، از نظر WER ، بررسي گرديده. 2- با استفاده از 120 نوفهي متفاوت تأثير نوع نوفههاي متفاوت روي قابليت فهم گفتار مشخصشده است؛ تا بتوان با شناخت نوع نوفه در مورد قابليت فهم اظهارنظر كرد. 3- در اين تحقيق زمان استفاده از الگوريتمهاي حذف نوفهي متفاوت برحسب نسبت سيگنال به نوفههاي متفاوت مشخصشده است.