ايجاد يك طبقه بند خودكار متون زبان فارسي به منظور استفاده در كتابخانه هاي ديجيتال شهر الكترونيك

پديدآورندگان

باشباغي سامان نويسنده , پرچمي مصطفي نويسنده , ختنلو حسن نويسنده , بشيري حسن نويسنده مربي گروه مهندسي كامپيوتر و فناوري اطلاعات

تعداد صفحه

كليدواژه

دسته بندي متن , شاخص گذاري متن , شهر الكترونيك و الگوريتم K نزديك ترين همسايه

عنوان كنفرانس

مجموعه مقالات اولين همايش ملي انجير ديم

زبان مدرك

فارسی

چكيده فارسي

دسته بندي یا طبقه بندي متون، برچسب زدن متون زبان طبیعی با توجه به طبقه بنديهاي موضوعیِ حاصل از مجموعه هاي از قبل مشخص شده میباشد. دسته بندي خودكار متون و انتساب اسناد به دسته هاي از پیش تعیین شده، در ده سال اخیر توجهات زیادي را به سوي خود جلب كرده است. این مسأله به خاطر رشد سریع متون الكترونیكی و مسأله نیاز به دسترسی اسناد، مد ارك و مقالات علمی، صفحات وب، نامه هاي الكترونیكی و كتابخانه هاي دیجیتال بوده است. در این تحقیق براي پیاده سازي دسته بند خودكار براي متون فارسی، از الگوریتم K-NN كه از روشهاي یادگیري با ناظر است به منظور دسته بندي متون و اسناد شهر الكترونیك استفاده شده است. به منظور ارزیابی نتایج حاصل از دسته بندي، مجموعه اسناد فارسی پیكره همشهري به عنوان مجموعه هاي آموزشی و آزمایشی بكار رفته است. نتایج آزمایشات كه با استفاده از توابع مشابهت مختلف به دست آمده است، نشان از دقت بسیار بالاي روش دارد.

شماره مدرك كنفرانس

3608842

سال انتشار

1393

از صفحه

تا صفحه

سال انتشار

لينک به اين مدرک

https://search.isc.ac/dl/search/defaultta.aspx?DTC=36&DC=70075