• شماره ركورد
    1352380
  • عنوان مقاله

    بهينه‌سازي سازماندهي اسناد متني فارسي با استفاده از تكنيك خوشه‌بندي

  • پديد آورندگان

    يلوه ، الهام دانشگاه قم , نوروزي ، يعقوب دانشگاه قم - گروه علم اطلاعات و دانش شناسي , خطير ، اشكان پژوهشگاه علوم و فناوري اطلاعات ايران (ايرانداك)

  • از صفحه
    981
  • تا صفحه
    1010
  • كليدواژه
    سازماندهي اسناد متني , تكنيك خوشه‌بندي , متن‌كاوي , تجزيه و تحليل هوشمند متن
  • چكيده فارسي
    پژوهش حاضر با هدف ارائه‌ روشي براي سازماندهي اسناد متني فارسي با استفاده از تكنيك خوشه‌بندي انجام شد. مجموعه داده‌هاي مربوط به پايان‌نامه‌ها و رساله‌ها شامل 2943 تحقيق به‌عنوان جامعه‌ آماري در نظر گرفته شد. جمع‌آوري داده‌ها از مجموعه داده‌هاي‌ مربوط به تحقيقات علمي كه شامل 5000 ‌پژوهش در قالب فايل اكسل بود، انجام شد. در اين پژوهش پس از تبديل داده‌هـا به قالب ساخت‌يافتـه، عمليات پردازش با استفاده از اعمال پيش‌پردازش صورت گرفت. در مرحله‌ پردازش از تكنيك خوشه‌بندي براي ارائه‌ الگوريتم پيشنهادي در راستاي سازماندهي اسناد متني فارسي بهره گرفته شد. اين الگوريتم با بهبود الگوريتم K-means در جهت خوشه‌بندي اسناد ارائه شد. نتايج حاصل از ارزيابي نشان داد كه الگوريتم پيشنهادي بر اساس معيارهاي خارجي نسبت به دو الگوريتم K-means و K-means++ در كيفيت خوشه‌بندي اسناد تأثير مثبتي داشت؛ به‌طوري كه تحقيقات هر رده‌ تعيين شده در خوشه‌ موضوعي مرتبط داراي توزيع يكنواختي شد، و به حصول هدف پژوهش حاضر منجر گرديد. در جداول رده/ خوشه‌ حاصل از دو الگوريتم K-means‌ و K-means++ توزيع غيريكنواخت تحقيقات در خوشه‌ها مشاهده شد. بنابراين، ارزيابي بر اساس معيار‌هاي داخلي متأثر از تراكم متفاوت خوشه‌ها و شباهت بين خوشه‌اي بود. حجم ديتاسِت نيز متأثر از راهكارهاي‌ پيشنهادي براي انتخاب ديتاسِت نهايي و فرايند پژوهش نبود. بنابراين، الگوريتم پيشنهادي براي ابعاد بالاي ويژگي نيز مناسب عمل مي‌كند.
  • عنوان نشريه
    پژوهش نامه پردازش و مديريت اطلاعات
  • عنوان نشريه
    پژوهش نامه پردازش و مديريت اطلاعات