شماره ركورد كنفرانس :
4163
عنوان مقاله :
نظركاوي خودكار نقد فيلمها با رويكرد مقاومسازي ماشين بردار پشتيبان
عنوان به زبان ديگر :
Automatic Opinion Mining of Movie Reviews using Robust Support Vector Machine
پديدآورندگان :
مير اميرمحمود mir-am@hotmail.com دانشگاه آزاد اسلامي، واحد تهران شمال , نصيري جلالالدين j.nasiri@irandoc.ac.ir پژوهشگاه علوم و فناوري اطلاعات ايران
كليدواژه :
نظركاوي , تحليل احساس , نقد فيلمها , ماشين بردار پشتيبان.
عنوان كنفرانس :
چهارمين همايش ملي زبان شناسي رايانشي
چكيده فارسي :
امروزه مردم نظرات و عقايد خود را دربارة كالاها، خدمات و رويدادهاي اجتماعي و سياسي در شبكههاي اجتماعي به اشتراك ميگذارند. نظرات و نقدهاي زيادي دربارة فيلمها توسط كاربران در اينترنت منتشر شدهاست كه خواندن تمام آنها براي تصميمگيري درمورد تماشاي يك فيلم، زمان زيادي از يك شخص ميگيرد. تحقيقات پيشين اين مسئله را با ارائة روشهاي خلاصهسازي حل كردهاند. در اين مقاله، مسئلة نظركاوي خودكار نقد فيلمها با رويكرد مقاومسازي ماشين بردار پشتيبان در برابر دادههاي نويزي بررسي شدهاست. مجموعهداده از وبگاه (سايت) IMDb جمعآوري شده و شامل 2000 نقد فيلم است. 2500 كلمه كه بيشترين فراواني را در متنها داشتهاند، بهعنوان ويژگي جهت دستهبندي نقدهاي مثبت و منفي انتخاب شدهاست. وزن هر نمونه با روش نزديكترين همسايه براي مقابله با دادههاي نويزي محاسبه شده و در فرمول دستهبند ماشين بردار پشتيبان دوقلو لحاظ شدهاست. نتايج نشان ميدهد كه روش پيشنهادي نسبت به پژوهشهاي پيشين و ساير روشهاي يادگيري دقت بهتري در تشخيص مثبت يا منفي بودن نقد فيلمها دارد.
چكيده لاتين :
Nowadays, people share their opinions regarding products, services, social events and political eventson the social networks. Numerous reviews on movies have been published by users on the internet but reading all the reviews takes significant amount of time. Previous studies proposedsummarizing methods to solve this problem. In this paper, the problem of automatic opinion mining of movie reviews addressed using robust support vector machine. The dataset collected from IMDb website and it contains 2000 movie reviews. 2500 most frequently used words in texts selected as features for classification of positive and negative movie reviews. The weight of each sample calculated using nearest neighbor method for overcoming noisy data and the sample weights added to the optimization problem of twin support vector machine. The result reveals that proposed method has better classification accuracy compared toprevious study and other learning methods.