شماره ركورد كنفرانس
4214
عنوان مقاله
بكارگيري الگوريتم هاي تكاملي در انتخاب ويژگي چندگانه درحوزه متن كاوي
پديدآورندگان
طاهري سيد حسن دانشگاه خيام , قاسمي پور سميه دانشگاه خيام
تعداد صفحه
8
كليدواژه
متنكاوي , طبقهبندي , انتخاب ويژگي , بهينهسازي چندهدفه , الگوريتم تكاملي
سال انتشار
1396
عنوان كنفرانس
دهمين كنفرانس بين المللي تحقيق در عمليات
زبان مدرك
فارسي
چكيده فارسي
در انتخاب ويژگي يكي از مهمترين بخشهاي پيش پردازش در حوزهي متنكاوي و طبقه بندي متن ميباشد. معيارهاي فراواني براي انتخاب ويژگي وجود دارد كه اين معيارها ميتواند در قالب يك مساله بهينه سازي ارائه شود. در اين تحقيق، مدلي براي انتخاب ويژگي در قالب بهينه سازي همزمان چند هدفه به صورت تكاملي پيشنهاد شده است. اهداف مورد بررسي در اين مدل شامل دو هدف با رابطه اي متقابل است كه به صورت همزمان مينيمم سازي ميشود. اولين هدف انتخاب زيرمجموعهاي از كلمات با كمترين طول و دومين هدف انتخاب زيرمجموعهاي از كلمات با بيشترين حجم اطلاعاتي است. در تحقيقي ديگر، دومين هدف يعني هدف بيشترين حجم اطلاهاتي را با معيار ديگري به نام CHI جايگزين كرده و عملكرد آن را نيز در مدل پيشنهادي، بررسي مي نماييم. مدل پيشنهادي با نام MOFS را با ديتاست شامل 20000 سند در 20 كلاس بررسي نموده ايم. در نهايت به منظور ارزيابي مدل پيشنهادي بعد از اينكه داده ها را به دو بخش آموزشي و تست تقسيم كرده و الگوريتم انتخاب ويژگي را براي داده اي آموزشي اعمال مي نماييم، از داده هاي تست براي بدست آوردن ميزان دقت در طبقه بندي استفاده نموده ايم. در آزمايشات انجام شده، از سه مدل طبقه بند مختلف ماشين بردار پشتيبان خطي، درخت تصميم و شبكه بيزين، براي ارزيابي عملكرد مدل بهره برده ايم. بررسيها حاكي از ميزان دقت بالاتر و بدست آوردن تعداد زيادي زيرمجموعه با طول هاي مختلف در يك تكرار اجرا است.
كشور
ايران
لينک به اين مدرک