عنوان مقاله :
بهبود كارايي معيار طبقهبند چيرنف بهكمك الگوريتم تابع پركننده
پديد آورندگان :
حميدزاده ، جواد دانشگاه سجاد - دانشكده مهندسي كامپيوتر و فناوري اطلاعات , مرادي ، منا دانشگاه سجاد - دانشكده مهندسي كامپيوتر و فناوري اطلاعات
كليدواژه :
طبقهبندي دادهها , معيار چيرنف , حاشيه حداكثري , تابع پركننده
چكيده فارسي :
تحليل تفكيككننده خطي يكي از روشهاي پركاربرد در حوزه كاهش ابعاد فضاي ويژگي و طبقهبندي دادهها بهوسيله بيشينهسازي نسبت پراكندگي بين طبقهها به پراكندگي درون طبقهها است. اين روش مبتني بر معيار فيشر بوده و از تحليل واريانس براي بيان تفكيكپذيري طبقهها استفاده ميكند. مهمترين محدوديت اين معيار در مواجهه با دادههاي ناهمگن است. براي رفع اين محدوديت، استفاده از فواصل توزيعي نظير معيار چيرنف پيشنهاد شده است. معيار چيرنف با درنظرگرفتن فاصله چيرنف ميان دو توزيع داده، قادر به اندازهگيري فواصل ميان توابع چگالي احتمال و استخراج ويژگيهايي با بيشترين قابليت تفكيككنندگي است؛ اما ايراد اين روش آن است كه چنانچه دو توزيع طبقه دادههاي ناهمگن از يكديگر فاصله كمي داشته باشند، موجب همپوشاني طبقهها در فضاي نگاشت شده و باعث افزايش خطاي طبقهبندي ميشود. اين مقاله، با معرفي روش انتخاب نمونه با نام حاشيه بيشينهاي به شناسايي نمونههاي مرزي و غيرمرزي پرداخته و با بهرهگيري از نمونههاي مرزي، ماتريس پراكندگي مطلوبي براي افزايش كارايي تحليل تفكيككننده خطي ايجاد ميكند. در روش پيشنهادي، فرايند انتخاب نمونه همانند يك مسأله بهينهسازي مقيد دودويي در نظر گرفته شده و جوابهاي مسأله با استفاده از تابع پركننده بهدست ميآيند. عملكرد روش پيشنهادي بر روي دادههاي برگرفتهشده از پايگاه داده UCI بهوسيله روش اعتبارسنجي ضربدري دهتايي ارزيابي و با طبقه بندهاي سنتي و مرز دانش مقايسه شده است. آزمايشها نشاندهنده برتري روش پيشنهادي از نظر صحت طبقهبندي و زمان محاسبه است.
عنوان نشريه :
پردازش علائم و داده ها
عنوان نشريه :
پردازش علائم و داده ها