شماره ركورد :
1323346
عنوان مقاله :
مروري بر روشهاي نوين بازشناس گفتار
پديد آورندگان :
هاديان ، حسين دانشگاه صنعتي شريف - دانشكده مهندسي كامپيوتر - آزمايشگاه پردازش گفتار و زبان طبيعي , گوران ، سروش دانشگاه صنعتي شريف - دانشكده مهندسي كامپيوتر - آزمايشگاه پردازش گفتار و زبان طبيعي , صبوري ، صدرا دانشگاه صنعتي شريف - دانشكده مهندسي كامپيوتر - آزمايشگاه پردازش گفتار و زبان طبيعي , صادقي ، سارا دانشگاه صنعتي شريف - دانشكده مهندسي كامپيوتر - آزمايشگاه پردازش گفتار و زبان طبيعي , اميني ، ياسين دانشگاه صنعتي شريف - دانشكده مهندسي كامپيوتر - آزمايشگاه پردازش گفتار و زبان طبيعي , صامتي ، حسين دانشگاه صنعتي شريف دانشگاه صنعتي شريف - دانشكده مهندسي كامپيوتر - آزمايشگاه پردازش گفتار و زبان طبيعي
از صفحه :
125
تا صفحه :
154
كليدواژه :
بازشناسي گفتار , مدل مخفي ماركوف , شبكه‌هاي عصبي ژرف , مبدل‌ها , مدل‌هاي از پيش آموزش ديده
چكيده فارسي :
اين مقاله مروري‌است بر روش‌ها‌ي سنتي و نيز روش‌هاي نوين بازشناسي گفتار. بازشناسي گفتار سابقه‌اي در حدود چندين دهه دارد و با روش‌هاي مبتني بر پردازش سيگنال و پيچش زماني پويا آغاز شده است. روش‌هاي آماري در دهه ۱۹۸۰ به بعد مورد توجه و استقبال قرار گرفت و روش‌هاي مبتني بر مدل مخفي ماركوف به‌عنوان سرآمد اين روش‌ها شناخته مي‌شد. ولي از دهه ۲۰۰۰ ميلادي به بعد روش‌هاي آماري كم‌كم جاي خود را به مدل‌هاي مبتني بر شبكه‌هاي عصبي دادند و با روي‌ كار آمدن شبكه‌هاي عصبي ژرف، نتايج بهتري از اين مدل‌ها نسبت به مدل مخفي ماركوف به‌دست آمد. مدل‌هاي مبتني بر شبكه‌هاي عصبي ژرف نيز دچار تحول شدند و انواع مختلفي از آنها ابداع گرديد. سپس مدل‌هاي مبتني بر مبدل‌ها و مدل‌هاي از پيش‌ آموزش ديده جاي آنها را گرفتند و به دقت‌هاي بالاتري دست يافتند. در اين مقاله بعد از مروري بر روش‌هاي مبتني بر مدل مخفي ماركوف به روش‌هاي مبتني بر شبكه‌هاي عصبي ژرف و ساختارهاي متنوع آنها پرداخته مي‌شود و در نهايت روش‌هاي مبتني بر مدل‌هاي از پيش آموزش ديده تشريح مي‌شود و آخرين روش‌هاي از اين دست مورد بررسي قرار مي‌گيرد. در انتها نيز نتايج به‌دست آمده از روش‌هاي تشريح شده براساس نرخ خطاي كلمه ارائه مي‌شود و مقايسه بين آنها صورت مي‌گيرد.
عنوان نشريه :
صوت و ارتعاش
عنوان نشريه :
صوت و ارتعاش
لينک به اين مدرک :
بازگشت