شماره ركورد كنفرانس :
4605
عنوان مقاله :
بهبود نرخ صحت در طبقهبندي داده هاي نامتوازن با استفاده از تابع باور
پديدآورندگان :
رشيدي محمودي محمدعلي ma.rashidi191@sadjad.ac.ir دانشكده مهندسي كامپيوتر و فناوري اطلاعات، دانشگاه صنعتي سجاد، مشهد، ايران؛
, حميدزاده جواد j_hamidzadeh@sadjad.ac.ir دانشكده مهندسي كامپيوتر و فناوري اطلاعات، دانشگاه صنعتي سجاد، مشهد، ايران؛
كليدواژه :
داده نامتوازن , تابع باور , تابع جرم , همسايه متقابل , نمونه افزايي
عنوان كنفرانس :
بيست و ششمين كنفرانس مهندسي برق ايران
چكيده فارسي :
در حوزه طبقه بندي داده هاي نامتوازن روشهاي مختلفي ارائهشده، ازجمله كارآمدترين و اساسي ترين اين روش ها SMOTE است. گرچه اين روش بسيار مؤثر است، اما از كارايي كافي برخوردار نبود. به دنبال آن روش هاي جديدي ازجمله SMOTE-DGC ارائه شد كه نتايج حاصل را بهبود دادند، اما همچنان يك نكته مهم وجود داشت و آن اين بود كه تمركز كليه روش هاي مبتني بر SMOTE بر روي نحوه نمونه افزايي قرار دارد؛ درحالي كه ممكن است نمونه افزايي بر روي داده هاي نامطمئن صورت گيرد. داده نامطمئن به داده اي گفته ميشود كه در محدوده مرز كلاس يا طبقه اكثريت باشد. در اين مقاله، الگوريتم جديدي به نام MNOS براي متوازن سازي ارائه شده كه در آن ابتدا با استفاده از تابع باور داده هاي مطمئن انتخاب مي شوند و سپس عمليات نمونه افزايي بر روي داده هاي تائيد شده بهصورت دوبهدو و با روش همسايه متقابل صورت مي پذيرد سپس نمونه ها با تابع باور بررسي مي شود. نتايج بهدستآمده نشان دهنده برتري الگوريتم پيشنهادي از لحاظ صحت در مقايسه با ساير روش ها است.