شماره ركورد كنفرانس
720
عنوان مقاله
ايجاد يك طبقه بند خودكار متون زبان فارسي به منظور استفاده در كتابخانه هاي ديجيتال شهر الكترونيك
پديدآورندگان
باشباغي سامان نويسنده , پرچمي مصطفي نويسنده , ختنلو حسن نويسنده , بشيري حسن نويسنده مربي گروه مهندسي كامپيوتر و فناوري اطلاعات
تعداد صفحه
5
كليدواژه
دسته بندي متن , شاخص گذاري متن , شهر الكترونيك و الگوريتم K نزديك ترين همسايه
عنوان كنفرانس
مجموعه مقالات اولين همايش ملي انجير ديم
زبان مدرك
فارسی
چكيده فارسي
دسته بندي یا طبقه بندي متون، برچسب زدن متون زبان طبیعی با توجه به طبقه بنديهاي موضوعیِ حاصل از مجموعه هاي از قبل مشخص شده میباشد. دسته بندي خودكار متون و انتساب اسناد به دسته هاي از پیش تعیین شده، در ده سال اخیر توجهات زیادي را به سوي خود جلب كرده است. این مسأله به خاطر رشد سریع متون الكترونیكی و مسأله نیاز به دسترسی اسناد، مد ارك و مقالات علمی، صفحات وب، نامه هاي الكترونیكی و كتابخانه هاي دیجیتال بوده است. در این تحقیق براي پیاده سازي دسته بند خودكار براي متون فارسی، از الگوریتم K-NN كه از روشهاي یادگیري با ناظر است به منظور دسته بندي متون و اسناد شهر الكترونیك استفاده شده است. به منظور ارزیابی نتایج حاصل از دسته بندي، مجموعه اسناد فارسی پیكره همشهري به عنوان مجموعه هاي آموزشی و آزمایشی بكار رفته است. نتایج آزمایشات كه با استفاده از توابع مشابهت مختلف به دست آمده است، نشان از دقت بسیار بالاي روش دارد.
شماره مدرك كنفرانس
3608842
سال انتشار
1393
از صفحه
1
تا صفحه
5
سال انتشار
0
لينک به اين مدرک