شماره ركورد كنفرانس :
2139
عنوان مقاله :
بهبود دسته بندي متون فارسي در روش همسايگي وزن دار
پديدآورندگان :
يغمايي فرزين نويسنده , تعبدي سعيد نويسنده
كليدواژه :
وزن دهي , نزديكترين همسايگي , دسته بندي متن , تفكيك كننده WKNN
عنوان كنفرانس :
نخستين كنفرانس بين المللي پردازش خط و زبان فارسي
چكيده فارسي :
با رشد روز افزون منابع اطلاعاتی و حجم مقالات و مطالب تولید شده در زمینه های مختلف و به شكل های متنوع از رسانه های مختلف دیجیتال نیاز به دسترسی آسان اطلاعات نیز افزایش می یابد. یكی از نیازهای اولیه در بالا بردن سرعت دسترسی به اطلاعات و پردازش این مطالب كه غالباً دارای حجم بالایی نیز می باشند، دسته بندی این اطلاعات در طبقات مختلف می باشد. دسته بندی متون به عمل برچسب زدن یا تفكیك یك متن در قالب یكی از دسته های از پیش تعیین شده گفته می شود. در این مقاله به بررسی عملكرد الگوریتم WKNN با استفاده از معیار وزن دهی tf-idf می پردازیم. همچنین برای بالا بردن دقت در انتخاب طبقه صحیح و به منظور افزایش كارایی الگوریتم از روش میانگین گیری از داده ها به عنوان معیار ارزیابی استفاده می كنیم. نتایج به دست آمده از تفكیك متون فارسی با استفاده از روش های فوق نشان دهنده دقت 89 درصد می باشد.
شماره مدرك كنفرانس :
4474716