عنوان مقاله :
رتبه بندي ويژگيها در تشخيص نظرات اسپم فارسي
پديد آورندگان :
صفريان ، نشاط - دانشكده مهندسي برق و كامپيوتر , بصيري ، محمد احسان - دانشكده فني و مهندسي , خسروي ، هادي - دانشكده فني و مهندسي
كليدواژه :
نظرات اسپم فارسي , نظرات جعلي , نظركاوي , تحليل احساسات , دستهبندي متن , رتبهبندي ويژگيها
چكيده فارسي :
يكي از عوامل اصلي در تصميمگيري مشتريان براي خريد يك محصول يا استفاده از خدماتي خاص، استفاده از نظرات برخط است. اينگونه از نظرات منابعي ارزشمند از اطلاعات هستند كه براي تشخيص افكار عمومي در مورد محصول يا خدمات استفاده ميشوند. اگرچه نظرات برخط ميتوانند مفيد باشند اما اعتماد كوركورانه به آنها، هم براي فروشنده و هم براي خريدار خطرناك است زيرا ممكن است براي بهدست آوردن سود، دستكاري شده باشند كه اصطلاحاً به اين گونه نظرات « نظرات اسپم» گفته ميشود. پژوهش حاضر روي نظرات فارسي ثبتشده در مورد تلفن همراه در وبسايت ديجيكالا انجام شده و از ميان انواع اسپم، اسپم نوع يك و دو بررسي شدهاند كه نوع اول نظرات جعلي و نوع دوم نظراتي هستند كه تنها در رابطه با مدل كالا نوشته شدهاند. ويژگيهاي مورد استفاده در اين پژوهش به علت كارا بودن آنها در دستهبندي، شامل ويژگيهاي مبتني بر نظر و ويژگيهاي فراداده است. اين ويژگيها و نيز تركيبهاي متفاوت از آنها در تشخيص نظرات اسپم فارسي و تأثير آنها روي دقت دستهبند بررسي شده است. دستهبندي توسط درخت تصميم، دستهبند ماشين بردار پشتيبان و دستهبند نايو بيز انجام شده و در نهايت دقت آنها روي تركيبهاي مختلف اين ويژگيها با هم مقايسه گرديده است. بالاترين ميزان دقت بهدست آمده از سه دستهبند توسط درخت تصميم حاصل ميشود كه برابر با با 0.778 براساس معيار اِف است. در رتبهدهي به ويژگيها باز هم درخت تصميم با دقت 0.824 و با تركيب سه ويژگي بازخوردهاي مثبت، امتياز كلي كالا و قطبيت نظر رتبهي برتر را به خود اختصاص ميدهد.
عنوان نشريه :
رايانش نرم و فناوري اطلاعات
عنوان نشريه :
رايانش نرم و فناوري اطلاعات