شماره ركورد كنفرانس :
3787
عنوان مقاله :
خوشهبندي اسناد با استفاده از روش كارا مبتني بر افرازدادهها
پديدآورندگان :
آخوندي سيده نوشين N_akhondy@yahoo.com دانشگاه آزاد اسلامي علوم و تحقيقات تهران(البرز) , خليليان مجيد Ma_khalilian@yahoo.com دانشگاه آزاد اسلامي كرج
كليدواژه :
الگوريتمk-means , خوشهبندي , روش تقسيم و غلبه , روش افرازبندي , مدل فضايبرداري
عنوان كنفرانس :
اولين همايش ملي فناوري اطلاعات، ارتباطات و محاسبات نرم
چكيده فارسي :
بازيابي متون به فنآوري جستجو و استخراج اطلاعات از مجموعه اسناد متني گفته ميشود. طبقهبندي دادههاي متني بهعنوان يكي از روشها در اين راستا ميباشد كه همراه با چالشهايي از قبيل پيچيدگي دادهها، بزرگي چه از نظر تعداد چه از نظر ابعاد و همچنين وجود ساختار سلسله مراتبي براي اكثر دادههاي متني ميباشد. بدين منظور براي غلبه بر اين مشكلات نياز به روشهايي است كه ضمن برطرف نمودن مشكلات مذكور دقت طبقهبندي را نيز افزايش دهد در اين تحقيق ضمن پيش پردازش دادههاي متني و تبديل آن به ماتريسهاي عددي از يك روش دو مرحلهاي مبتني بر افرازبندي براي غلبه بر مشكلات مذكور در دادههاي متني استفاده شده است. نتايج بدست آمده از اجراي اين روش بر روي مجموعه داده متني در مقايسه با روشهاي افرازبندي و سلسله مراتبي اجرا شده بر روي دادههاي متني، حاكي از آن است كه دقت طبقهبندي متون نسبت به الگوريتمهاي مورد مقايسه، افزايش يافته است. همچنين سرعت روش مذكور بر روي دادههاي متني به مراتب بالاتر از روش عمومي K-means براي دادههاي متني است.