• شماره ركورد كنفرانس
    248
  • عنوان مقاله

    ايجاد يك طبقه بند خودكار متون زبان فارسي به منظور استفاده در كتابخانه هاي ديجيتال شهر الكترونيك

  • پديدآورندگان

    باشباغي سامان نويسنده , پرچمي مصطفي نويسنده , ختن لو حسن نويسنده , بشيري حسن نويسنده مربي گروه مهندسي كامپيوتر و فناوري اطلاعات

  • تعداد صفحه
    5
  • كليدواژه
    دسته بندي متن , شاخص گذاري متن , شهر الكترونيك
  • عنوان كنفرانس
    همايش ملي شهر الكترونيك
  • زبان مدرك
    فارسی
  • چكيده فارسي
    دسته بندي یا طبقه بندي متون، برچسب زدن متون زبان طبیعی با توجه به طبقهبنديهاي موضوعیِ حاصل از مجموعه هاي از قبل مشخص شده میباشد. دسته بندي خودكار متون و انتساب اسناد به دسته هاي از پیش تعیین شده، در ده سال اخیر توجهات زیادي را به سوي خود جلب كرده است. این مسأله به خاطر رشد سریع متون الكترونیكی و مسأله نیاز به دسترسی اسناد، مد ارك و مقالات علمی، صفحات وب، نامه هاي الكترونیكی و كتابخانه هاي دیجیتال بوده است. در این تحقیق براي پیاده سازي دسته بند خودكار براي متون فارسی،از الگوریتم K-NN كه از روش های یادگیری با ناظر است به منظور دسته بندی متون و اسناد شهر الكترونیك استفاده شده است. به منظور ارزیابی نتایج حاصل از دستهبندي، مجموعه اسناد فارسی پیكره همشهري به عنوان مجموعه هاي آموزشی و آزمایشی بكار رفته است. نتایج آزمایشات كه با استفاده از توابع مشابهت مختلف به دست آمده است، نشان از دقت بسیار بالاي روش دارد.
  • شماره مدرك كنفرانس
    1821839
  • سال انتشار
    1390
  • از صفحه
    1
  • تا صفحه
    5
  • سال انتشار
    0