عنوان مقاله :
طبقه بندي داده هاي نامتعادل با تركيب منحني اصلي و smote بهبود يافته درجه پشتيبان
پديد آورندگان :
كمال پور، ريحانه دانشگاه بين المللي امام رضا (ع) مشهد - گروه مهندسي كامپيوتر , قاضي خاني، عادل دانشگاه بين المللي امام رضا (ع) مشهد - گروه مهندسي كامپيوتر
كليدواژه :
طبقه بندي , داده هاي نامتعادل , نمونه افزايي , منحني اصلي , حد آستانه عضويت
چكيده فارسي :
مسئله طبقه بندي داده هاي نامتعادل به عنوان يكي از چالش هاي اصلي در حوزه داده كاوي است. در مجموعه داده هاي نامتعادل، تعداد نمونه ها در كلاسهاي گوناگون اختلاف بسياري دارند. در داده هاي نامتعادل هدف اصلي شناسايي صحيح نمونه هاي كلاس اقليت است. به عنوان مثال در حوزه پزشكي، تعداد نمونه هاي مثبت از يك بيماري در مقابل تعداد نمونه هاي منفي بسيار كمتر است. در حاليكه براي اين مسئله ارائه ،SdCurveSmote اهميت شناسايي نمونه هاي مربوط به دسته مثبت، بسيار زياد است. در اين مقاله الگوريتمي بانام شده است. اين الگوريتم شامل سه بخش كلي است بخش اول محاسبه پارامتري بنام درجه پشتيباني براي انتخاب نمونه هاي مناسبب ر روي اين نمونه هاي مناسب با درجه پشتيبان بالا و توليد نمونه جديد است Smote و بخش دوم انجام عمل Smote مرزي براي عمل و در بخش آخر محاسبات منحني اصلي و حد آستانه و بررسي نمونه هاي توليد شده ميباشد. در اين مقاله از 5 مجموعه داده نامتعادل، استفاده شده است كه ميزان عدم تعادل متفاوت دارند. الگوريتم پيشنهادي نسبت به الگوريتم هاي مشابه، KEEL و UCI برگرفته از سايت نشان ميدهد كه در آن تفاوت معنادار بسيار مطلوبي بين Adaboost با آزمون فريدمن نتايج بهتري داشت در اين آزمون براي طبقه بند وجود دارد
عنوان نشريه :
فناوري اطلاعات در طراحي مهندسي