شماره ركورد كنفرانس
4163
عنوان مقاله
نظركاوي خودكار نقد فيلمها با رويكرد مقاومسازي ماشين بردار پشتيبان
عنوان به زبان ديگر
Automatic Opinion Mining of Movie Reviews using Robust Support Vector Machine
پديدآورندگان
مير اميرمحمود mir-am@hotmail.com دانشگاه آزاد اسلامي، واحد تهران شمال , نصيري جلالالدين j.nasiri@irandoc.ac.ir پژوهشگاه علوم و فناوري اطلاعات ايران
تعداد صفحه
20
كليدواژه
نظركاوي , تحليل احساس , نقد فيلمها , ماشين بردار پشتيبان.
سال انتشار
1396
عنوان كنفرانس
چهارمين همايش ملي زبان شناسي رايانشي
زبان مدرك
فارسي
چكيده فارسي
امروزه مردم نظرات و عقايد خود را دربارة كالاها، خدمات و رويدادهاي اجتماعي و سياسي در شبكههاي اجتماعي به اشتراك ميگذارند. نظرات و نقدهاي زيادي دربارة فيلمها توسط كاربران در اينترنت منتشر شدهاست كه خواندن تمام آنها براي تصميمگيري درمورد تماشاي يك فيلم، زمان زيادي از يك شخص ميگيرد. تحقيقات پيشين اين مسئله را با ارائة روشهاي خلاصهسازي حل كردهاند. در اين مقاله، مسئلة نظركاوي خودكار نقد فيلمها با رويكرد مقاومسازي ماشين بردار پشتيبان در برابر دادههاي نويزي بررسي شدهاست. مجموعهداده از وبگاه (سايت) IMDb جمعآوري شده و شامل 2000 نقد فيلم است. 2500 كلمه كه بيشترين فراواني را در متنها داشتهاند، بهعنوان ويژگي جهت دستهبندي نقدهاي مثبت و منفي انتخاب شدهاست. وزن هر نمونه با روش نزديكترين همسايه براي مقابله با دادههاي نويزي محاسبه شده و در فرمول دستهبند ماشين بردار پشتيبان دوقلو لحاظ شدهاست. نتايج نشان ميدهد كه روش پيشنهادي نسبت به پژوهشهاي پيشين و ساير روشهاي يادگيري دقت بهتري در تشخيص مثبت يا منفي بودن نقد فيلمها دارد.
چكيده لاتين
Nowadays, people share their opinions regarding products, services, social events and political eventson the social networks. Numerous reviews on movies have been published by users on the internet but reading all the reviews takes significant amount of time. Previous studies proposedsummarizing methods to solve this problem. In this paper, the problem of automatic opinion mining of movie reviews addressed using robust support vector machine. The dataset collected from IMDb website and it contains 2000 movie reviews. 2500 most frequently used words in texts selected as features for classification of positive and negative movie reviews. The weight of each sample calculated using nearest neighbor method for overcoming noisy data and the sample weights added to the optimization problem of twin support vector machine. The result reveals that proposed method has better classification accuracy compared toprevious study and other learning methods.
كشور
ايران
لينک به اين مدرک