عنوان مقاله :
تشخيص داده پرت در دادگان با ابعاد بالا با استفاده از انتخاب زيرفضاي مرتبط محلي مبتني بر آنتروپي
پديد آورندگان :
رياحي مدوار ، محبوبه دانشگاه علم و صنعت - دانشكده مهندسي كامپيوتر , اكبري ازيراني ، احمد دانشگاه علم و صنعت ايران - دانشكده مهندسي كامپيوتر , ناصرشريف ، بابك دانشگاه صنعتي خواجه نصيرالدين طوسي - دانشكده مهندسي كامپيوتر
كليدواژه :
تشخيص داده پرت , دادههاي با ابعاد بالا , انتخاب زيرفضاي مرتبط محلي , آنتروپي محلي
چكيده فارسي :
يكي از چالشهاي مسئله تشخيص داده پرت با ابعاد بالا، طلسم بعد است كه در آن برخي ابعاد (ويژگيها) منجر به پنهانشدن دادههاي پرت ميگردند. براي حل اين مسئله، ابعادي كه حاوي اطلاعات ارزشمندي در دادگان با ابعاد بالا جهت تشخيص داده پرت هستند، جستجو ميشوند تا با نگاشت دادگان به زيرفضاي متشكل از اين ابعاد مرتبط، دادههاي پرت برجستهتر و قابل شناسايي شوند. اين مقاله با معرفي يك روش جديد انتخاب زيرفضاي مرتبط محلي و توسعه يك رويكرد امتيازدهي داده پرت مبتني بر چگالي محلي، امكان تشخيص داده پرت در دادگان با ابعاد بالا را فراهم مينمايد. در ابتدا، يك الگوريتم براي انتخاب زيرفضاي مرتبط محلي بر اساس آنتروپي محلي ارائه ميشود تا بتواند براي هر نقطه داده با توجه به دادههاي همسايهاش يك زيرفضاي مرتبط انتخاب كند. سپس هر نقطه داده در زيرفضاي انتخابي متناظرش با يك روش امتيازدهي پرت محلي مبتني بر چگالي امتيازدهي ميشود، به طوري كه با در نظر گرفتن يك پهناي باند تطبيقي جهت تخمين چگالي هسته سعي ميشود كه اختلاف جزئي بين چگالي يك نقطه داده نرمال با همسايههايش از بين رفته و به اشتباه به عنوان داده پرت تشخيص داده نشود و در عين حال، تخمين كمتر از مقدار واقعي چگالي در نقاط داده پرت، منجر به برجستهشدن اين نقاط داده گردد. در پايان با آزمايشهاي تجربي روي چندين دادگان دنياي واقعي، الگوريتم پيشنهادي تشخيص داده پرت زيرفضاي مبتني بر آنتروپي محلي با چند تكنيك تشخيص داده پرت بر حسب دقت تشخيص مقايسه شده است. نتايج تجربي نشان ميدهد كه الگوريتم پيشنهادي مبتني بر معيار آنتروپي محلي و روش پيشنهادي امتيازدهي داده پرت توانسته است به دقت بالايي جهت تشخيص داده پرت دست يابند.
عنوان نشريه :
مهندسي برق و مهندسي كامپيوتر ايران
عنوان نشريه :
مهندسي برق و مهندسي كامپيوتر ايران