مرکز منطقه ای اطلاع رساني علوم و فناوري - مروري بر روشهاي نوين بازشناس گفتار

شماره ركورد :

1323346

عنوان مقاله :

مروري بر روشهاي نوين بازشناس گفتار

پديد آورندگان :

هاديان ، حسين دانشگاه صنعتي شريف - دانشكده مهندسي كامپيوتر - آزمايشگاه پردازش گفتار و زبان طبيعي , گوران ، سروش دانشگاه صنعتي شريف - دانشكده مهندسي كامپيوتر - آزمايشگاه پردازش گفتار و زبان طبيعي , صبوري ، صدرا دانشگاه صنعتي شريف - دانشكده مهندسي كامپيوتر - آزمايشگاه پردازش گفتار و زبان طبيعي , صادقي ، سارا دانشگاه صنعتي شريف - دانشكده مهندسي كامپيوتر - آزمايشگاه پردازش گفتار و زبان طبيعي , اميني ، ياسين دانشگاه صنعتي شريف - دانشكده مهندسي كامپيوتر - آزمايشگاه پردازش گفتار و زبان طبيعي , صامتي ، حسين دانشگاه صنعتي شريف دانشگاه صنعتي شريف - دانشكده مهندسي كامپيوتر - آزمايشگاه پردازش گفتار و زبان طبيعي

از صفحه :

125

تا صفحه :

154

كليدواژه :

بازشناسي گفتار , مدل مخفي ماركوف , شبكه‌هاي عصبي ژرف , مبدل‌ها , مدل‌هاي از پيش آموزش ديده

چكيده فارسي :

اين مقاله مروري‌است بر روش‌ها‌ي سنتي و نيز روش‌هاي نوين بازشناسي گفتار. بازشناسي گفتار سابقه‌اي در حدود چندين دهه دارد و با روش‌هاي مبتني بر پردازش سيگنال و پيچش زماني پويا آغاز شده است. روش‌هاي آماري در دهه ۱۹۸۰ به بعد مورد توجه و استقبال قرار گرفت و روش‌هاي مبتني بر مدل مخفي ماركوف به‌عنوان سرآمد اين روش‌ها شناخته مي‌شد. ولي از دهه ۲۰۰۰ ميلادي به بعد روش‌هاي آماري كم‌كم جاي خود را به مدل‌هاي مبتني بر شبكه‌هاي عصبي دادند و با روي‌ كار آمدن شبكه‌هاي عصبي ژرف، نتايج بهتري از اين مدل‌ها نسبت به مدل مخفي ماركوف به‌دست آمد. مدل‌هاي مبتني بر شبكه‌هاي عصبي ژرف نيز دچار تحول شدند و انواع مختلفي از آنها ابداع گرديد. سپس مدل‌هاي مبتني بر مبدل‌ها و مدل‌هاي از پيش‌ آموزش ديده جاي آنها را گرفتند و به دقت‌هاي بالاتري دست يافتند. در اين مقاله بعد از مروري بر روش‌هاي مبتني بر مدل مخفي ماركوف به روش‌هاي مبتني بر شبكه‌هاي عصبي ژرف و ساختارهاي متنوع آنها پرداخته مي‌شود و در نهايت روش‌هاي مبتني بر مدل‌هاي از پيش آموزش ديده تشريح مي‌شود و آخرين روش‌هاي از اين دست مورد بررسي قرار مي‌گيرد. در انتها نيز نتايج به‌دست آمده از روش‌هاي تشريح شده براساس نرخ خطاي كلمه ارائه مي‌شود و مقايسه بين آنها صورت مي‌گيرد.

عنوان نشريه :

صوت و ارتعاش

عنوان نشريه :

صوت و ارتعاش

لينک به اين مدرک :

https://search.ricest.ac.ir/dl/search/defaultta.aspx?DTC=8&DC=1323346