شماره ركورد كنفرانس :
3787
عنوان مقاله :
خوشه‌‌بندي اسناد با استفاده از روش كارا مبتني بر افرازداده‌ها
پديدآورندگان :
آخوندي سيده نوشين N_akhondy@yahoo.com دانشگاه آزاد اسلامي علوم و تحقيقات تهران(البرز) , خليليان مجيد Ma_khalilian@yahoo.com دانشگاه آزاد اسلامي كرج
تعداد صفحه :
8
كليدواژه :
الگوريتمk-means , خوشه‌بندي , روش تقسيم و غلبه , روش افرازبندي , مدل فضاي‌برداري
سال انتشار :
1395
عنوان كنفرانس :
اولين همايش ملي فناوري اطلاعات، ارتباطات و محاسبات نرم
زبان مدرك :
فارسي
چكيده فارسي :
بازيابي متون به فن‌آوري جستجو و استخراج اطلاعات از مجموعه اسناد متني گفته مي‌شود. طبقه‌بندي داده‌هاي متني به‌عنوان يكي از روش‌ها در اين راستا مي‌باشد كه همراه با چالش‌هايي از قبيل پيچيدگي داده‌ها، بزرگي چه از نظر تعداد چه از نظر ابعاد و همچنين وجود ساختار سلسله مراتبي براي اكثر داده‌هاي متني مي‌باشد. بدين منظور براي غلبه بر اين مشكلات نياز به روش‌هايي است كه ضمن برطرف نمودن مشكلات مذكور دقت طبقه‌بندي را نيز افزايش دهد در اين تحقيق ضمن پيش پردازش داده‌هاي متني و تبديل آن به ماتريس‌هاي عددي از يك روش دو مرحله‌اي مبتني بر افرازبندي براي غلبه بر مشكلات مذكور در داده‌هاي متني استفاده شده است. نتايج بدست آمده از اجراي اين روش بر روي مجموعه داده متني در مقايسه با روش‌هاي افرازبندي و سلسله مراتبي اجرا شده بر روي داده‌هاي متني، حاكي از آن است كه دقت طبقه‌بندي متون نسبت به الگوريتم‌هاي مورد مقايسه، افزايش يافته است. همچنين سرعت روش مذكور بر روي داده‌هاي متني به مراتب بالاتر از روش عمومي K-means براي داده‌هاي متني است.
كشور :
ايران
لينک به اين مدرک :
بازگشت