شماره ركورد كنفرانس :
4615
عنوان مقاله :
بررسي الگوريتم هاي تشخيص نواحي گفتار از لحاظ مشخصات ويژگي مورد استفاده و توان محاسباتي مورد نياز
پديدآورندگان :
معيني جهرمي محمد moeini.jahromi@ut.ac.ir هيئت علمي دانشگاه پيام نور، گروه مهندسي و فناوري اطلاعات , هادي محمد mhadi@ee.sharif.edu دانشجو دكتري دانشگاه صنعتي شريف، دانشكده مهندسي برق و مخابرات , صمصامي خداداد فرشيد farshid.samsam@gmail.com دانشجو دكتري دانشگاه فردوسي مشهد، دانشكده مهندسي
كليدواژه :
تشخيص گفتار , نويز گوسي , نويز همهمه , كنترل خودكار بهره , پيچيدگي محاسباتي
عنوان كنفرانس :
چهارمين كنفرانس ملي تحقيقات كاربردي در مهندسي برق، مكانيك، كامپيوتر و فناوري اطلاعات
چكيده فارسي :
الگوريتمهاي تشخيص نواحي يا فعاليت گفتاري، براي شناسايي بخشهاي مشتمل بر گفتار يك سيگنال صوتي داده شده به كار مي روند. اين الگوريتمها كاربردهاي زيادي در پردازش گفتار، كدينگ گفتار، ادوات بي سيم، سامانههاي نرمافزاري مبتني بر گفتار و ... دارند. در يك الگوريتم تشخيص نواحي گفتار نوعي، يك يا چند ويژگي از سيگنال داده شده استخراج و محاسبه مي شود و بر مبناي آن، بخش هاي سيگنال گفتار از قسمت هاي نويز تفكيك مي گردد. ويژگي هاي متفاوتي از سيگنال براي جداسازي قسمت گفتار در مقالات مختلف ارائه شده است كه هر كدام از آنها قابليت ها و ويژگي هاي متفاوتي دارند و در شرايط نويزي متفاوت، رفتار متفاوتي از خود نشان مي دهند. همچنين، توان پردازشي مورد نياز براي استخراج هر كدام از اين ويژگي ها از سيگنال داده شده متفاوت است. در اين مقاله، ويژگيها و شيوههاي تصميمگيري به كار گرفته شده در شناسايي گفتار در مقالات ارائه شده را معرفي كرده و نتايج حاصل از اين بررسي را به طور مجمل در جدولي ارائه ميكنيم. همچنان كه خواهيم ديد، نحوه عملكرد ويژگيهاي معرفي شده ميتواند به نوع نويز محيط، توان نويز، توان سيگنال و توان پردازشي مصرف شده وابستگي داشته باشد.