شماره ركورد كنفرانس :
3835
عنوان مقاله :
شناسايي گفتار با استفاده از شبكه عصبي مصنوعي بازگشتي المان و با كمك كدينگ پيش
پديدآورندگان :
صفايي محمدرضا دانشجوي كارشناسي ارشد دانشگاه آزاد اسلامي واحد سيرجان , دهيادگاري لوئيزا عضو هيئت علمي دانشگاه صنعتي سيرجان
كليدواژه :
شناسايي گفتار , اطلاعات گفتاري , كدينگ خطي , شبكه عصبي حافظه دار المان , يادگيري ماشين.
عنوان كنفرانس :
اولين كنفرانس بين المللي مديريت، نوآوري و توليد ملي
چكيده فارسي :
امروزه نياز به سيستمهاي خودكار هوشمند باعث توجه روزافزون به تكنيكهاي مدرن تعامل ميان انسان و ماشين گشته است كه اين
تكنيكها بطور كلي شامل: دو دسته روشهاي ديداري و شنيداري ميباشند. در اين ميان نياز به توسعه الگوريتمهائي كه شناسائي گفتار
انسان را براي ماشين ممكن سازند از اهميت اساسي برخوردار است و اين موضوع بطور مكرر مورد بحث و بررسي محققين قرارگرفته است.
در اغلب موارد استفاده از روشهاي هوش مصنوعي منجر به اخذ نتايج بهتري شده اند ولي مشكل اساسي در اين زمينه عدم ارائه راهكار
مناسبي براي برگزيدن ديتاي شناسائي از ميان حجم وسيع اطلاعات گفتاري است كه عملا كار را براي اغلب الگوريتمهاي موجود ناممكن
ميسازند. در اين مقاله براي رفع اين مشكل از روش استخراج ضرايب پيشبيني كدينگ خطي براي خلاصه كردن ديتاي مربوط به تلفظ
ارقام انگليسي استفاده شده است و بعد از استخراج بانك اطلاعاتي از آن براي آموزش يك شبكه عصبي حافظه دار المان بهره برداري شده
است تا اين شبكه بتواند با داشتن ضرايب كدينگ خطي يك فايل صوتي ارتباط آنرا با رقم تلفظ شده شناسائي كند.