مرکز منطقه ای اطلاع رساني علوم و فناوري - تحليل صداي گريه نوزاد با استفاده از طبقه بند بازنمايي تنك مبتني بر هسته

شماره ركورد :

953278

عنوان مقاله :

تحليل صداي گريه نوزاد با استفاده از طبقه بند بازنمايي تنك مبتني بر هسته

عنوان فرعي :

Analysis of infants cry sound using kernel sparse representation-based classifier

پديد آورنده :

اخوان امير

پديد آورندگان :

مرادي محمد حسن نويسنده بانكداري از موسسه عالي آموزش بانكداري

سازمان :

گروه مهندسي بيوالكتريك، دانشكده مهندسي پزشكي، دانشگاه صنعتي اميركبير

تعداد صفحه :

از صفحه :

تا صفحه :

كليدواژه :

Infant cry sound , Mel Frequency Cepstrum Coefficient , Sparse Representation Classifier , Sparse Representation Model , الگوي هسته-پايه , صداي گريه نوزاد , الگوي بازنمايي تنك , ضرايب كپستروم , طبقه بند بازنمايي تنك , Kernel-based model

چكيده فارسي :

پردازش صداي گريه نوزاد اطلاعات مفيدي در مورد وضعيت نوزاد در اختيار قرار مي دهد. اين اطلاعات مي تواند به منظور تشخيص بيماري و يا درك نياز نوزاد استفاده شود. اين مقاله به تحليل صداي گريه نوزاد با روي‌كرد تفكيك دو نوع منشا درد و گرسنگي در صداي گريه پرداخته است. الگوهاي بازنمايي تنك علامت (سيگنال) يكي از جديدترين ابزار هاي پردازش در حوزه بازشناختي الگو است. از اين‌ رو، در مقاله جاري چارچوبي جديد براي استفاده از اين الگو ها در طبقه بندي انواع صداي گريه نوزاد ارايه مي شود. به منظور طراحي ديكشنري در الگوي تنك پيشنهادي از اطلاعات طيفي با تفكيك‌پذيريي (رزولوشني) مشابه سامانه شنوايي انسان (ضرايب كِپستروم بسامد مِل) استفاده شده است. ديكشنري نهايي از انتقال اين اطلاعات به فضاي هسته تشكيل مي‌شود. بررسي هاي انجام شده نشان مي دهند كه طبقه بند بازنمايي تنك مبتني بر هسته عملكرد قابل قبولي در تفكيك دو نوع صداي گريه نوزاد دارد. به منظور مقايسه، خروجي روش پيشنهادي به همراه نتايج تعدادي از طبقه‌بند‌هاي معروف اين حوزه و طبقه بند بازنمايي تنك متداول ارايه شده است. نتايج نشان مي دهند كه الگوي بازنمايي تنك مبتني بر هسته به طور كلي عملكرد بهتري نسبت به ساير طبقه‌بند‌هاي ارايه شده دارد. الگوي تنك پيشنهادي علامت‌هاي گريه دو رده داده‌ها را به ازاي روش اعتبارسنجي 6- لايه با دقتي بيش از 93 درصد تفكيك مي نمايد. علامت‌هاي بكار برده شده در اين مقاله در مجموع از 51 نوزاد سالم (19 نوزاد پسر و 32 نوزاد دختر) ثبت گرديده‌اند.

چكيده لاتين :

Processing of infant cry sound provides useful information about his/her condition. This information can be used to establish a diagnostic method to determine the infantʹs needs. This paper addresses the analysis of newborn babies cry sound in order to discriminate crying associated with hunger from that originating from pain. Sparse representation models are one of the state of the art processing tools in pattern recognition and machine learning. In this work a novel framework is proposed in order to deal with sparsity-based approach in a classification task. The dictionary atoms of the sparse model are designed using Mel Frequency Cepstrum Coefficient in kernel space. Performance assessment of kernel sparse representation model shows the discriminative power of this model in classifying different types of infant cry sound. In order to compare, the results of conventional sparse representation model and some other well-known classifiers (Hidden Markov Model and Support Vector Machine) are also presented. The results show that the proposed model has better performance in comparison with the other presented classifiers. Using 6-fold cross validation the kernel sparse model can distinguish two types of infant cry with more than 93% accuracy. The pain and hunger databases are recorded from 51 (19 male and 32 female) 2-3 day old healthy infants.

سال انتشار :

1394

عنوان نشريه :

مجله انجمن مهندسي صوتيات ايران

عنوان نشريه :

مجله انجمن مهندسي صوتيات ايران

لينک به اين مدرک :

https://search.ricest.ac.ir/dl/search/defaultta.aspx?DTC=8&DC=953278