عنوان مقاله :
يك روش تركيبي براي يافتن زيرمجموعه ويژگي مؤثر در دادههاي چند برچسبي
عنوان به زبان ديگر :
A Hybrid Method to Find Effective Subset of Features in Multi-label Datasets
پديد آورندگان :
كاشف، شيما دانشگاه شهيد باهنر كرمان - دانشكده فني مهندسي , نظامآباديپور، حسين دانشگاه شهيد باهنر كرمان - دانشكده فني مهندسي
كليدواژه :
الگوريتمهاي تكاملي , روشهاي پيچشي , دادههاي چند بر چسبي , انتخاب ويژگي , روشهاي تركيبي , روشهاي فيلتري
چكيده فارسي :
دادههاي چند برچسبي به دادههايي گفته ميشود كه در آن بر خلاف دادههاي تك برچسبي، هر نمونه ميتواند متعلق به چند كلاس باشد. در سالهاي اخير، به دليل رشد روز افزون كاربردهاي اين دادهها، طبقهبندي دادههاي چند برچسبي توجه بسياري از محققان را به خود جلب كرده است. مشابه طبقهبندي دادههاي تك برچسبي، در دادههاي چند برچسبي نيز حذف ويژگيهاي زائد و تكراري ميتواند تأثير زيادي در بهبود عملكرد طبقهبند داشته باشد. در اين مقاله، يك روش تركيبي براي انتخاب ويژگي در دادههاي چند برچسبي ارائه شده است. روش پيشنهادي بر پايه تركيب يك روش فيلتري و يك روش پيچشي است كه در روش پيچشي از الگوريتمهاي فرا ابتكاري استفاده شده است. از آنجا كه معمولاً تعداد ويژگيهاي دادههاي چند برچسبي زياد است، استفاده مستقيم از روشهاي جستجو، براي كشف زيرمجموعه ويژگي بهينه، هزينه محاسباتي بالايي دارد و ممكن است با شكست روبه رو شود. از اين رو، ابتدا با استفاده از يك روش فيلتري، ويژگيهاي نامرتبط با كلاسها حذف ميشوند. سپس، از الگوريتمهاي تكاملي براي انتخاب برجستهترين ويژگيها استفاده ميشود. در بخش آزمايشها، تعداد قابل توجهي از الگوريتمهاي فرا ابتكاري مشهور بكار گرفته شده و جايگزين روش پيچشي در سامانه پيشنهادي شده است. نتايج به دست آمده نشان ميدهند كه روش پيشنهادي در برابر ساير روشهاي مورد مقايسه، دقت بالاتري دارند و در مواردي كه دست يابي به دقت بالاتر، اهميت بيشتري نسبت به زمان داشته باشد، استفاده از اين روش مناسبتر است
چكيده لاتين :
n multi-label data, each instance is associated with a set of labels, instead of one label. Due to the increasing number of modern applications associated with multi-label data, multi-label classification has gained significant attention during recent years. As in single-label data, eliminating redundant and/or irrelevant features plays an important role in improving classification performance. In this paper, a hybrid method for multi-label feature selection problem based on combing filter and wrapper methods is proposed, where meta-heuristic algorithms are employed as the wrapper method. Since, the number of features in multi-label data is usually high, solely employing search algorithms for finding the optimal feature subsets has high computational burden, and is very possible to fail. Hence, irrelevant features are first detected and removed by a filter method. Then, salient features are found among the remained features by the help of meta-heuristic algorithms. A significant number of well-known meta-heuristic algorithms are employed as the wrapper method, in the proposed system. Experiments show that the proposed method obtains better classification results, compared to other algorithms.
عنوان نشريه :
مهندسي برق دانشگاه تبريز
عنوان نشريه :
مهندسي برق دانشگاه تبريز