Title of article :
Feature extraction in opinion mining through Persian reviews
Author/Authors :
Golpar-Rabooki، E نويسنده Department of Mathematics, University of Qom, Qom, Iran , , Zarghamifar، S نويسنده Department of Computer Engineering, University of Qom, Qom, Iran , , Rezaeenour ، J نويسنده Department of Industrial Engineering, University of Qom, Qom, Iran ,
Issue Information :
دوفصلنامه با شماره پیاپی 0 سال 2015
Abstract :
انديشه كاوي به تحليل اظهار نظرات كاربران جهت استخراج نظرات، احساسات و خواستههاي كاربران در يك حوزه خاص ميپردازد. دانستن نظرات افراد در يك حوزه خاص ميتواند نقش مهمي در تصميمگيريهاي كلان آن حوزه ايفا كند. به طور كلي انديشه كاوي در سه سطح سند، جمله و ويژگي به استخراج نظرات كاربران ميپردازد. انديشه كاوي در سطح ويژگي به دليل تحليل جهتگيري جنبههاي مختلف يك حوزه از دو سطح ديگر بيشتر مورد توجه قرار دارد. در اين مقاله، دو روش به منظور استخراج ويژگيها ارايه شده است. روش پيشنهادي شامل چهار گام اصلي است. در گام نخست لغتنامه انديشهكاوي براي زبان فارسي ايجاد ميشود. اين لغتنامه به منظور تعيين جهتگيري نظرات كاربران مورد استفاده قرار ميگيرد. گام دوم مرحله پيشپردازش شامل يكسان سازي نگارشي، تقطيع، ايجاد برچسبهاي ادات سخن و برچسب وابستگي نحوي اسناد است. گام سوم استخراج ويژگيها با استفاده از دو روش استخراج ويژگي بر مبناي تكرار و استخراج ويژگي بر اساس قوانين وابستگي است و در گام چهارم ويژگيها و قطبيت كلمات حاوي نظر استخراج شده در مرحله قبلي اصلاح شده و در نهايت قطبيت ويژگيها تعيين ميگردد. براي ارزيابي روشهاي پيشنهادي، مجموعه عقايد كاربران در دو حوزه دانشگاه و تلفن همراه جمعآوري شده و نتايج حاصل از دو روش با يكديگر مقايسه ميشوند.
Abstract :
Opinion mining deals with an analysis of user reviews for extracting their opinions, sentiments and demands in a specific area, which plays an important role in making major decisions in such areas. In general, opinion mining extracts user reviews at three levels of document, sentence and feature. Opinion mining at the feature level is taken into consideration more than the other two levels due to orientation analysis of different aspects of an area. In this paper, two methods are introduced for a feature extraction. The recommended methods consist of four main stages. First, opinion-mining lexicon for Persian is created. This lexicon is used to determine the orientation of users’ reviews. Second, the preprocessing stage includes unification of writing, tokenization, creating parts-of-speech tagging and syntactic dependency parsing for documents. Third, the extraction of features uses two methods including frequency-based feature extraction and dependency grammar based feature extraction. Fourth, the features and polarities of the word reviews extracted in the previous stage are modified and the final featuresʹ polarity is determined. To assess the suggested techniques, a set of user reviews in both scopes of university and cell phone areas were collected and the results of the two methods were compared.
Journal title :
Journal of Artificial Intelligence and Data Mining
Journal title :
Journal of Artificial Intelligence and Data Mining