شماره ركورد كنفرانس :
2139
عنوان مقاله :
بهبود دسته بندي متون فارسي در روش همسايگي وزن دار
پديدآورندگان :
يغمايي فرزين نويسنده , تعبدي سعيد نويسنده
تعداد صفحه :
5
كليدواژه :
وزن دهي , نزديكترين همسايگي , دسته بندي متن , تفكيك كننده WKNN
سال انتشار :
1391
عنوان كنفرانس :
نخستين كنفرانس بين المللي پردازش خط و زبان فارسي
زبان مدرك :
فارسی
چكيده فارسي :
با رشد روز افزون منابع اطلاعاتی و حجم مقالات و مطالب تولید شده در زمینه های مختلف و به شكل های متنوع از رسانه های مختلف دیجیتال نیاز به دسترسی آسان اطلاعات نیز افزایش می یابد. یكی از نیازهای اولیه در بالا بردن سرعت دسترسی به اطلاعات و پردازش این مطالب كه غالباً دارای حجم بالایی نیز می باشند، دسته بندی این اطلاعات در طبقات مختلف می باشد. دسته بندی متون به عمل برچسب زدن یا تفكیك یك متن در قالب یكی از دسته های از پیش تعیین شده گفته می شود. در این مقاله به بررسی عملكرد الگوریتم WKNN با استفاده از معیار وزن دهی tf-idf می پردازیم. همچنین برای بالا بردن دقت در انتخاب طبقه صحیح و به منظور افزایش كارایی الگوریتم از روش میانگین گیری از داده ها به عنوان معیار ارزیابی استفاده می كنیم. نتایج به دست آمده از تفكیك متون فارسی با استفاده از روش های فوق نشان دهنده دقت 89 درصد می باشد.
شماره مدرك كنفرانس :
4474716
سال انتشار :
1391
از صفحه :
1
تا صفحه :
5
سال انتشار :
1391
لينک به اين مدرک :
بازگشت