• شماره ركورد كنفرانس
    5206
  • عنوان مقاله

    تحليل احساسات كاربران در زبان فارسي مبتني بر تركيب روابط معنايي و جنگل تصادفي

  • عنوان به زبان ديگر
    Sentiment Analysis of Users in Persian Based on The Combination of Semantic Relationships and Random Forest
  • پديدآورندگان

    روستائي محمد دانشگاه جامع امام حسين (ع) , جوادزاده محمدعلي دانشگاه جامع امام حسين (ع)

  • تعداد صفحه
    8
  • كليدواژه
    تجزيه و تحليل احساسات , استخراج ويژگي , كاهش ويژگي , شبكه‌هاي يادگيري عميق , طبقه‌بندي
  • سال انتشار
    1401
  • عنوان كنفرانس
    هشتمين همايش ملي مطالعات و تحقيقات نوين در حوزه علوم كامپيوتر، برق و مكانيك ايران
  • زبان مدرك
    فارسي
  • چكيده فارسي
    امروزه، اگر شركت‌ها و فروشگاه‌ها براي ارائه خدمات و محصولات بهتر نياز به دانستن نظرات مشتريان داشته باشند، مي‌توانند به نظرات ثبت‌شده افراد در وب سايت‌هاي اينترنتي يا انجمن‌ها مراجعه كنند. بنابراين، بررسي‌ نظرات كاربران نقش مهمي در آگاهي مشتري از محصولات دارد. با توجه به رواجِ عاميانه و محاوره‌اي نوشتن در زبان فارسي و در نتيجه، فقدان ساختار مشخص در متون، مرحله پيش‌پردازش براي متن، مشكلِ اصليِ تجزيه‌و‌تحليل احساسات به زبان فارسي محسوب مي‌شود. آنچه اين مشكل را تشديد مي‌كند، نبود كتابخانه‌هاي مناسب براي پيش پردازش زبان فارسي است. از همين رو در اين پژوهش جهت تشخيص احساسات كاربرانِ سايت ديجي‌كالا، از نظرات ثبت شده در اين سايت استفاده شده است. در تحليل نظر، از يك فرآيند چند مرحله‌اي بهره گرفته شده است. در مرحله‌ي نخست عمليات پاك‌سازي داده‌ها صورت مي‌گيرد و سپس عمليات استخراج ويژگي براساس روابط معنايي FastText انجام مي‌پذيرد. در بخش سوم، عمليات كاهش‌ويژگي توسط شبكه‌هاي يادگيري عميق انجام شده است. در بخش پاياني طبقه‌بندي نظرات با استفاده از الگوريتم جنگل تصادفي انجام گرديده است. معيارهاي ارزيابي مورد استفاده در اين پژوهش دقت، صحت، فراخوان و معيار F بوده كه از نتايج آزمايشات به ترتيب مقادير 98.5، 97، 98 و 97 به دست آمده است.
  • كشور
    ايران