شماره ركورد :
1138848
عنوان مقاله :
شناسايي هيجان در متن فارسي با استفاده از مدل يادگيري ماشيني
پديد آورندگان :
خسروي، علي موسسه آموزش عالي علوم شناختي، پرديس , كلارستاقي، منوچهر دانشگاه خوارزمي - گروه برق و مهندسي كامپيوتر، تهران , پورمحمد، مهدي موسسه آموزش عالي علوم شناختي، پرديس
تعداد صفحه :
7
از صفحه :
42
تا صفحه :
48
كليدواژه :
شناسايي هيجان , تحليل متن , يادگيري ماشيني
چكيده فارسي :
پژوهش حاضر به‌منظور ارائه‌ي يك مدل محاسباتي براي بازشناسي هيجان در متن فارسي صورت گرفته است. در مدل پيشنهادي تحقيق، گروه‌بندي هشت‌گانه‌ي پلاچيك در هيجان‌ها به‌عنوان مبناي يادگيري نظارت‌شده، ويژگي‌هاي بافتي متن فارسي و ليست واژگان هيجاني برچسب‌دار به‌عنوان عناصر و اجزاي مدل تعيين شده‌اند. براي آزمون مدل (شرايط واقعي) از صد متن منتخب شامل سرمقاله‌ي روزنامه‌هاي سياسي- اجتماعي استفاده شده است. همچنين در اين تحقيق از الگوريتم «ماشين بردار پشتيبان» به‌عنوان طبقه‌بند يادگيرنده استفاده گرديده و چهار شاخص دقت، درستي، ضريب f و بازخواني براي ارزيابي مدل بكار گرفته شده‌اند. نتايج تحقيق نشان مي‌دهند كه كارايي مدل (دقت) در شناسايي هيجان‌هاي مختلف از 79 درصد تا 98 درصد متغير بوده و در ارزيابي كلي مدل، ميانگين دقت مدل معادل 84 درصد است. بر اساس ساير شاخص‌ها، مي‌توان گفت كه بيشترين نرخ درستي مربوط به هيجان خوشي و كمترين آن مربوط به هيجان خشم است. همچنين تطبيق قابل‌توجهي ميان شاخص f با شاخص «بازخواني» وجود دارد و بيشترين مقدار آن در گروه هيجان شادي ديده مي‌شود. نتايج اين تحقيق نشان مي‌دهد استفاده از رهيافت مبتني بر گروه‌بندي هيجان‌ها، يادگيري نظارت‌شده و نيز ويژگي‌هاي بافتي حداقلي در متن مي‌تواند كارايي مناسبي در شناسايي خودكار هيجان‌ها داشته و مي‌توان تلفيقي از گروه‌هاي اصلي هيجان را به‌منظور افزايش كارايي مدل يادگيري بكار گرفت.
چكيده لاتين :
This study aimed to develop a computational model for recognition of emotion in Persian text as a supervised machine learning problem. We considered Pluthchik emotion model as supervised learning criteria and Support Vector Machine (SVM) as baseline classifier. We also used NRC lexicon and contextual features as training data and components of the model. One hundred selected texts including political-social newspaper editorials were used to test the model (real terms). Also in this study, the "support vector machine" algorithm was used as the learning classifier and four indicators of accuracy, accuracy, f-score and recall were used to evaluate the model. The results show that the efficiency of the model in detecting different emotions varies from 79% to 98% and mean presision of the model for all classes was 84%. Using all indexes, the classifier showed more performance in joy category than other 7 types. The results of this study show that using emotion-based approach, supervised learning and minimal contextual features can be useful in automatic identification of emotions. It also showed that a combination of lexical resource and contextual features can be used as learning base for a SVM model.
سال انتشار :
1398
عنوان نشريه :
روانشناسي معاصر
فايل PDF :
8085030
لينک به اين مدرک :
بازگشت