شماره ركورد كنفرانس :
4163
عنوان مقاله :
نظركاوي خودكار نقد فيلم‌ها با رويكرد مقاوم‌سازي ماشين بردار پشتيبان
عنوان به زبان ديگر :
Automatic Opinion Mining of Movie Reviews using Robust Support Vector Machine
پديدآورندگان :
مير اميرمحمود mir-am@hotmail.com دانشگاه آزاد اسلامي، واحد تهران شمال , نصيري جلال‌الدين j.nasiri@irandoc.ac.ir پژوهشگاه علوم و فناوري اطلاعات ايران
تعداد صفحه :
20
كليدواژه :
نظركاوي , تحليل احساس , نقد فيلم‌ها , ماشين بردار پشتيبان.
سال انتشار :
1396
عنوان كنفرانس :
چهارمين همايش ملي زبان شناسي رايانشي
زبان مدرك :
فارسي
چكيده فارسي :
امروزه مردم نظرات و عقايد خود را دربارة كالاها، خدمات و رويدادهاي اجتماعي و سياسي در شبكه‌هاي اجتماعي به اشتراك مي‌گذارند. نظرات و نقدهاي زيادي دربارة فيلم‌ها توسط كاربران در اينترنت منتشر شده‌است كه خواندن تمام آنها براي تصميم‌گيري درمورد تماشاي يك فيلم، زمان زيادي از يك شخص مي‌گيرد. تحقيقات پيشين اين مسئله را با ارائة روش‌هاي خلاصه‌سازي حل كرده‌اند. در اين مقاله، مسئلة نظركاوي خودكار نقد فيلم‌ها با رويكرد مقاوم‌سازي ماشين بردار پشتيبان در برابر داده‌هاي نويزي بررسي شده‌است. مجموعه‌داده از وبگاه (سايت) IMDb جمع‌آوري شده و شامل 2000 نقد فيلم است. 2500 كلمه كه بيشترين فراواني را در متن‌ها داشته‌اند، به‌عنوان ويژگي جهت دسته‌بندي نقدهاي مثبت و منفي انتخاب شده‌است. وزن هر نمونه با روش نزديك‌ترين همسايه براي مقابله با داده‌هاي نويزي محاسبه شده و در فرمول دسته‌بند ماشين بردار پشتيبان دوقلو لحاظ شده‌است. نتايج نشان مي‌دهد كه روش پيشنهادي نسبت به پژوهش‌هاي پيشين و ساير روش‌هاي يادگيري دقت بهتري در تشخيص مثبت يا منفي بودن نقد فيلم‌ها دارد.
چكيده لاتين :
Nowadays, people share their opinions regarding products, services, social events and political eventson the social networks. Numerous reviews on movies have been published by users on the internet but reading all the reviews takes significant amount of time. Previous studies proposedsummarizing methods to solve this problem. In this paper, the problem of automatic opinion mining of movie reviews addressed using robust support vector machine. The dataset collected from IMDb website and it contains 2000 movie reviews. 2500 most frequently used words in texts selected as features for classification of positive and negative movie reviews. The weight of each sample calculated using nearest neighbor method for overcoming noisy data and the sample weights added to the optimization problem of twin support vector machine. The result reveals that proposed method has better classification accuracy compared toprevious study and other learning methods.
كشور :
ايران
لينک به اين مدرک :
بازگشت