شماره ركورد :
1056647
عنوان مقاله :
رتبه‏ بندي ويژگي‏‌ها در تشخيص نظرات اسپم فارسي
پديد آورندگان :
صفريان ، نشاط - دانشكده مهندسي برق و كامپيوتر , بصيري ، محمد احسان - دانشكده فني و مهندسي , خسروي ، هادي - دانشكده فني و مهندسي
تعداد صفحه :
16
از صفحه :
1
تا صفحه :
16
كليدواژه :
نظرات اسپم فارسي , نظرات جعلي , نظركاوي , تحليل احساسات , دسته‏بندي متن , رتبه‌بندي ويژگي‌ها
چكيده فارسي :
يكي از عوامل اصلي در تصميم‌گيري مشتريان براي خريد يك محصول يا استفاده از خدماتي خاص، استفاده از نظرات برخط است. اين‌گونه از نظرات منابعي ارزشمند از اطلاعات هستند كه براي تشخيص افكار عمومي در مورد محصول يا خدمات استفاده مي‏شوند. اگرچه نظرات برخط مي‌توانند مفيد باشند اما اعتماد كوركورانه به آن‏ها، هم براي فروشنده و هم براي خريدار خطرناك است زيرا ممكن است براي به‌دست آوردن سود، دستكاري شده باشند كه اصطلاحاً به اين گونه نظرات « نظرات اسپم» گفته مي‌شود. پژوهش حاضر روي نظرات فارسي ثبت‌شده در مورد تلفن همراه در وب‌سايت ديجي‌كالا انجام شده و از ميان انواع اسپم، اسپم نوع يك و دو بررسي شده‌اند كه نوع اول نظرات جعلي و نوع دوم نظراتي هستند كه تنها در رابطه با مدل كالا نوشته شده‏اند. ويژگي‌هاي مورد استفاده در اين پژوهش به علت كارا بودن آن‏ها در دسته‌بندي، شامل ويژگي‌هاي مبتني بر نظر و ويژگي‌هاي فراداده است. اين ويژگي‌ها و نيز تركيب‌هاي متفاوت از آن‏ها در تشخيص نظرات اسپم فارسي و تأثير آن‏ها روي دقت دسته‌بند بررسي شده ‌است. دسته‌بندي توسط درخت تصميم، دسته‌بند ماشين بردار پشتيبان و دسته‌بند نايو بيز انجام شده و در نهايت دقت آن‏ها روي تركيب‌هاي مختلف اين ويژگي‌ها با هم مقايسه گرديده است. بالاترين ميزان دقت به‌دست آمده از سه دسته‌بند توسط درخت تصميم حاصل مي‏شود كه برابر با با 0.778 براساس معيار اِف است. در رتبه‎دهي به ويژ‌گي‌ها باز هم درخت تصميم با دقت 0.824 و با تركيب سه ويژگي بازخوردهاي مثبت، امتياز كلي كالا و قطبيت نظر رتبه‌ي برتر را به خود اختصاص مي‌دهد.
سال انتشار :
1398
عنوان نشريه :
رايانش نرم و فناوري اطلاعات
عنوان نشريه :
رايانش نرم و فناوري اطلاعات
لينک به اين مدرک :
بازگشت