عنوان مقاله :
تحليل صداي گريه نوزاد با استفاده از طبقه بند بازنمايي تنك مبتني بر هسته
عنوان فرعي :
Analysis of infants cry sound using kernel sparse representation-based classifier
پديد آورندگان :
مرادي محمد حسن نويسنده بانكداري از موسسه عالي آموزش بانكداري
سازمان :
گروه مهندسي بيوالكتريك، دانشكده مهندسي پزشكي، دانشگاه صنعتي اميركبير
كليدواژه :
Infant cry sound , Mel Frequency Cepstrum Coefficient , Sparse Representation Classifier , Sparse Representation Model , الگوي هسته-پايه , صداي گريه نوزاد , الگوي بازنمايي تنك , ضرايب كپستروم , طبقه بند بازنمايي تنك , Kernel-based model
چكيده فارسي :
پردازش صداي گريه نوزاد اطلاعات مفيدي در مورد وضعيت نوزاد در اختيار قرار مي دهد. اين اطلاعات مي تواند به منظور تشخيص بيماري و يا درك نياز نوزاد استفاده شود. اين مقاله به تحليل صداي گريه نوزاد با رويكرد تفكيك دو نوع منشا درد و گرسنگي در صداي گريه پرداخته است. الگوهاي بازنمايي تنك علامت (سيگنال) يكي از جديدترين ابزار هاي پردازش در حوزه بازشناختي الگو است. از اين رو، در مقاله جاري چارچوبي جديد براي استفاده از اين الگو ها در طبقه بندي انواع صداي گريه نوزاد ارايه مي شود. به منظور طراحي ديكشنري در الگوي تنك پيشنهادي از اطلاعات طيفي با تفكيكپذيريي (رزولوشني) مشابه سامانه شنوايي انسان (ضرايب كِپستروم بسامد مِل) استفاده شده است. ديكشنري نهايي از انتقال اين اطلاعات به فضاي هسته تشكيل ميشود. بررسي هاي انجام شده نشان مي دهند كه طبقه بند بازنمايي تنك مبتني بر هسته عملكرد قابل قبولي در تفكيك دو نوع صداي گريه نوزاد دارد. به منظور مقايسه، خروجي روش پيشنهادي به همراه نتايج تعدادي از طبقهبندهاي معروف اين حوزه و طبقه بند بازنمايي تنك متداول ارايه شده است. نتايج نشان مي دهند كه الگوي بازنمايي تنك مبتني بر هسته به طور كلي عملكرد بهتري نسبت به ساير طبقهبندهاي ارايه شده دارد. الگوي تنك پيشنهادي علامتهاي گريه دو رده دادهها را به ازاي روش اعتبارسنجي 6- لايه با دقتي بيش از 93 درصد تفكيك مي نمايد. علامتهاي بكار برده شده در اين مقاله در مجموع از 51 نوزاد سالم (19 نوزاد پسر و 32 نوزاد دختر) ثبت گرديدهاند.
چكيده لاتين :
Processing of infant cry sound provides useful information about his/her condition. This information can be used to establish a diagnostic method to determine the infantʹs needs. This paper addresses the analysis of newborn babies cry sound in order to discriminate crying associated with hunger from that originating from pain. Sparse representation models are one of the state of the art processing tools in pattern recognition and machine learning. In this work a novel framework is proposed in order to deal with sparsity-based approach in a classification task. The dictionary atoms of the sparse model are designed using Mel Frequency Cepstrum Coefficient in kernel space. Performance assessment of kernel sparse representation model shows the discriminative power of this model in classifying different types of infant cry sound. In order to compare, the results of conventional sparse representation model and some other well-known classifiers (Hidden Markov Model and Support Vector Machine) are also presented. The results show that the proposed model has better performance in comparison with the other presented classifiers. Using 6-fold cross validation the kernel sparse model can distinguish two types of infant cry with more than 93% accuracy. The pain and hunger databases are recorded from 51 (19 male and 32 female) 2-3 day old healthy infants.
عنوان نشريه :
مجله انجمن مهندسي صوتيات ايران
عنوان نشريه :
مجله انجمن مهندسي صوتيات ايران