عنوان مقاله :
شناسايي هيجان در متن فارسي با استفاده از مدل يادگيري ماشيني
پديد آورندگان :
خسروي، علي موسسه آموزش عالي علوم شناختي، پرديس , كلارستاقي، منوچهر دانشگاه خوارزمي - گروه برق و مهندسي كامپيوتر، تهران , پورمحمد، مهدي موسسه آموزش عالي علوم شناختي، پرديس
كليدواژه :
شناسايي هيجان , تحليل متن , يادگيري ماشيني
چكيده فارسي :
پژوهش حاضر بهمنظور ارائهي يك مدل محاسباتي براي بازشناسي هيجان در متن فارسي صورت گرفته است. در مدل پيشنهادي تحقيق، گروهبندي هشتگانهي پلاچيك در هيجانها بهعنوان مبناي يادگيري نظارتشده، ويژگيهاي بافتي متن فارسي و ليست واژگان هيجاني برچسبدار بهعنوان عناصر و اجزاي مدل تعيين شدهاند. براي آزمون مدل (شرايط واقعي) از صد متن منتخب شامل سرمقالهي روزنامههاي سياسي- اجتماعي استفاده شده است. همچنين در اين تحقيق از الگوريتم «ماشين بردار پشتيبان» بهعنوان طبقهبند يادگيرنده استفاده گرديده و چهار شاخص دقت، درستي، ضريب f و بازخواني براي ارزيابي مدل بكار گرفته شدهاند. نتايج تحقيق نشان ميدهند كه كارايي مدل (دقت) در شناسايي هيجانهاي مختلف از 79 درصد تا 98 درصد متغير بوده و در ارزيابي كلي مدل، ميانگين دقت مدل معادل 84 درصد است. بر اساس ساير شاخصها، ميتوان گفت كه بيشترين نرخ درستي مربوط به هيجان خوشي و كمترين آن مربوط به هيجان خشم است. همچنين تطبيق قابلتوجهي ميان شاخص f با شاخص «بازخواني» وجود دارد و بيشترين مقدار آن در گروه هيجان شادي ديده ميشود. نتايج اين تحقيق نشان ميدهد استفاده از رهيافت مبتني بر گروهبندي هيجانها، يادگيري نظارتشده و نيز ويژگيهاي بافتي حداقلي در متن ميتواند كارايي مناسبي در شناسايي خودكار هيجانها داشته و ميتوان تلفيقي از گروههاي اصلي هيجان را بهمنظور افزايش كارايي مدل يادگيري بكار گرفت.
چكيده لاتين :
This study aimed to develop a computational model for recognition of emotion in Persian text as a supervised machine learning problem. We considered Pluthchik emotion model as supervised learning criteria and Support Vector Machine (SVM) as baseline classifier. We also used NRC lexicon and contextual features as training data and components of the model. One hundred selected texts including political-social newspaper editorials were used to test the model (real terms). Also in this study, the "support vector machine" algorithm was used as the learning classifier and four indicators of accuracy, accuracy, f-score and recall were used to evaluate the model. The results show that the efficiency of the model in detecting different emotions varies from 79% to 98% and mean presision of the model for all classes was 84%. Using all indexes, the classifier showed more performance in joy category than other 7 types. The results of this study show that using emotion-based approach, supervised learning and minimal contextual features can be useful in automatic identification of emotions. It also showed that a combination of lexical resource and contextual features can be used as learning base for a SVM model.
عنوان نشريه :
روانشناسي معاصر