شماره ركورد :
32746
عنوان :
تاثير روشهاي متعدد استخراج مشخصه هاي سيگنال صحبت در بازشناسي گفتار گسسته زبان فارسي با استفاده از شبكه هاي عصبي
پديدآورندگان :
مسندي شيرازي محمدعلي نويسنده , حسن حسيني سعيد نويسنده
نام دانشگاه :
دانشگاه شيراز
رشته :
فوق ليسانس
تعداد صفحه :
96
سال انتشار :
1377
كليدواژه زبان طبيعي :
مخابرات , گفتار گسسته زبان فارسي , بازشناسي , برق , شبكه هاي عصبي , سيگنال صحبت
دامنه موضوعي :
فني و مهندسي
چكيده :
بحث تشخيص گفتار ساليان درازي است كه توسط محققين و پژوهندگان مورد بررسي قرار گرفته است و هدف از آن ساخت سيستمي با نرم افزار و سخت افزار مناسب است كه بتواند كلام ادا شده توسط انسان را بصورت كلمات گسسته يا پيوسته تشخيص دهد. هر چند تاكنون روشهاي متعددي براي رسيدن به اين هدف ارايه شده است ولي هنوز سيستمي كه بتواند به تشخيص دقيقي از گفتار بپردازد، عملي نشده است . استفاده از شبكه هاي عصبي با ساختارهاي مختلف يكي از روشهايي است كه بدليل توانايي اين شبكه ها در يادگيري توابع غيرخطي ، تقسيم فضاي برداري و دسته بندي الگوهاي ناشناس مورد توجه قرار گرفته است . همچنين در راستاي كاهش نرخ پردازش سيگنال صحبت نيز روشهاي متعددي در كد كردن سيگنال صحبت ارايه شده است كه مي توان از ضرايب پيش گويي خطي LPC ضرايب كپستروم و ضرايب دلتا كپستروم نام برد. استفاده از اين مشخصه ها علاوه بر محفوظ نگاه داشتن مشخصات فركانسي سيگنال ، در كاهش نرخ محاسبات شبكه هاي عصبي تاثير بسزايي دارد. در اين پايان نامه با در نظر گرفتن تعدادي از كلمات كليدي ، ابتدا به پياده سازي دو شبكه عصبي پرسپترون چند لايه MLP و شبكه تقسيم كننده فضاي برداري LVQ پرداخته و عملكرد اين دو شبكه را نسبت به چگونگي كد كردن سيگنال و استخراج مشخصه هاي سيگنال صحبت ، در راستاي تشخيص كلمات مجزاي فارسي مورد بررسي قرار داده ايم .
يادداشت :
دانشگاه شيراز
زبان :
فارسي
لينک به اين مدرک :
بازگشت