شماره ركورد كنفرانس
5286
عنوان مقاله
انتخاب ويژگي گروهي با رويكرد تصميمگيري چندمعياره به منظور دستهبندي متون
عنوان به زبان ديگر
Ensemble Feature Selection using Multi-Attribute Decision Making for Text Classification
پديدآورندگان
زريسفي كرماني فاطمه fzarisfi.k@gmail.com دانشگاه جيرفت
تعداد صفحه
10
كليدواژه
دستهبندي متن , انتخاب ويژگي گروهي , تصميمگيري چندمعياره , دستهبند بيزين ساده چندجملهاي , دستهبند k , همسايه نزديك
سال انتشار
1402
عنوان كنفرانس
پنجمين كنفرانس بينالمللي محاسبات نرم
زبان مدرك
فارسي
چكيده فارسي
دستهبندي متن از ابعاد بالا و پراكندگي زياد فضاي ويژگي رنج ميبرد. به همين دليل، انتخاب ويژگي به عنوان مرحله مهمي از پيش پردازش در حوزه متن كاوي و بهويژه دستهبندي متن شناخته ميشود. اخيراً رويكرد جديدي به نام انتخاب ويژگي گروهي معرفي شدهاست كه در آن، خروجي چندين روش انتخاب ويژگي براي به دست آوردن زيرمجموعهي نهايي از ويژگيها تجميع ميشوند. ادعا ميشود كه اصل خرد جمعي در بحث انتخاب ويژگي نيز ميتواند منجربه انتخاب ويژگي قويتر و پايدارتر هنگام برخورد با داده هايي با ابعاد بالا گردد. بنابراين در اينكار، براي اولين بار از رويكرد انتخاب ويژگي گروهي در فاز آمادهسازي دادههاي متني، بهمنظور دستهبندي دقيقتر اسناد استفاده شدهاست. بطوريكه ابتدا مجموعهي ويژگيها با استفاده از 4 روش انتخاب ويژگي مبتني بر فيلتر بصورت جداگانه رتبهبندي شده، سپس فرآيند تجميع نتايج حاصله و رتبهبندي نهايي ويژگيها بعنوان يك مسئلهي تصميمگيري چندمعياره فرموله و به كمك تكنيك بيشترين بيشترينها حل ميشود. به منظور اثبات ادعا، كارآمدي روش انتخاب ويژگي پيشنهادي در دستهبندي موضوعي مجموعه داده متني رويترز، با استفاده از الگوريتمهاي دستهبندي بيزين ساده چندجملهاي و k-همسايه نزديك براساس معيارهاي دقت و F-score مورد ارزيابي قرار گرفتهاست. مقايسهي نتايج، نشاندهندهي افزايش حداقل 1درصدي و حداكثر 10 درصدي دقت دستهبندي نسبت به 4روش انتخاب ويژگي مبتني بر فيلتر و 3 روش ساده تجميع در استراتژي ناهمگن ميباشد.
كشور
ايران
لينک به اين مدرک