عنوان مقاله :
مروري بر روشهاي نوين بازشناس گفتار
پديد آورندگان :
هاديان ، حسين دانشگاه صنعتي شريف - دانشكده مهندسي كامپيوتر - آزمايشگاه پردازش گفتار و زبان طبيعي , گوران ، سروش دانشگاه صنعتي شريف - دانشكده مهندسي كامپيوتر - آزمايشگاه پردازش گفتار و زبان طبيعي , صبوري ، صدرا دانشگاه صنعتي شريف - دانشكده مهندسي كامپيوتر - آزمايشگاه پردازش گفتار و زبان طبيعي , صادقي ، سارا دانشگاه صنعتي شريف - دانشكده مهندسي كامپيوتر - آزمايشگاه پردازش گفتار و زبان طبيعي , اميني ، ياسين دانشگاه صنعتي شريف - دانشكده مهندسي كامپيوتر - آزمايشگاه پردازش گفتار و زبان طبيعي , صامتي ، حسين دانشگاه صنعتي شريف دانشگاه صنعتي شريف - دانشكده مهندسي كامپيوتر - آزمايشگاه پردازش گفتار و زبان طبيعي
كليدواژه :
بازشناسي گفتار , مدل مخفي ماركوف , شبكههاي عصبي ژرف , مبدلها , مدلهاي از پيش آموزش ديده
چكيده فارسي :
اين مقاله مرورياست بر روشهاي سنتي و نيز روشهاي نوين بازشناسي گفتار. بازشناسي گفتار سابقهاي در حدود چندين دهه دارد و با روشهاي مبتني بر پردازش سيگنال و پيچش زماني پويا آغاز شده است. روشهاي آماري در دهه ۱۹۸۰ به بعد مورد توجه و استقبال قرار گرفت و روشهاي مبتني بر مدل مخفي ماركوف بهعنوان سرآمد اين روشها شناخته ميشد. ولي از دهه ۲۰۰۰ ميلادي به بعد روشهاي آماري كمكم جاي خود را به مدلهاي مبتني بر شبكههاي عصبي دادند و با روي كار آمدن شبكههاي عصبي ژرف، نتايج بهتري از اين مدلها نسبت به مدل مخفي ماركوف بهدست آمد. مدلهاي مبتني بر شبكههاي عصبي ژرف نيز دچار تحول شدند و انواع مختلفي از آنها ابداع گرديد. سپس مدلهاي مبتني بر مبدلها و مدلهاي از پيش آموزش ديده جاي آنها را گرفتند و به دقتهاي بالاتري دست يافتند. در اين مقاله بعد از مروري بر روشهاي مبتني بر مدل مخفي ماركوف به روشهاي مبتني بر شبكههاي عصبي ژرف و ساختارهاي متنوع آنها پرداخته ميشود و در نهايت روشهاي مبتني بر مدلهاي از پيش آموزش ديده تشريح ميشود و آخرين روشهاي از اين دست مورد بررسي قرار ميگيرد. در انتها نيز نتايج بهدست آمده از روشهاي تشريح شده براساس نرخ خطاي كلمه ارائه ميشود و مقايسه بين آنها صورت ميگيرد.
عنوان نشريه :
صوت و ارتعاش
عنوان نشريه :
صوت و ارتعاش