شماره ركورد :
997163
عنوان مقاله :
يادگيري نيمه نظارتي كرنل مركب با استفاده از تكنيك‌هاي يادگيري معيار فاصله
عنوان به زبان ديگر :
Semi Supervised Multiple Kernel Learning using Distance Metric Learning Techniques
پديد آورندگان :
زارع بيدكي، طاهره دانشگاه يزد - دانشكده مهندسي برق - گروه تحقيقاتي پردازش سيگنال , صادقي، محمد تقي دانشگاه يزد - دانشكده مهندسي برق - گروه تحقيقاتي پردازش سيگنال , ابوطالبي، حميدرضا دانشگاه يزد - دانشكده مهندسي برق - گروه تحقيقاتي پردازش سيگنال
تعداد صفحه :
18
از صفحه :
53
تا صفحه :
70
كليدواژه :
يادگيري معيار فاصله , يادگيري كرنل‌ مركب , زوج‌هاي مشابه , زوج‌هاي نامشابه , يادگيري نيمه‌ نظارتي
چكيده فارسي :
معيار فاصله، نقشي كليدي در بسياري از الگوريتم‌هاي آموزش ماشين و شناسايي آماري الگو دارد؛ به‌گونه‌اي كه انتخاب تابع فاصله مناسب، تأثير مستقيمي بر عملكرد اين الگوريتم‌ها دارد. در سال­هاي اخير، آموزش معيار فاصله با استفاده از نمونه‌هاي برچسب‌دار و يا ديگر اطلاعات موجود، يكي از حوزه‌هاي بسيار فعال در حوزه آموزش ماشين شده است. پژوهش‌ها در اين راستا، نشان داده است كه معيارهاي سنجش فاصله مبتني بر يادگيري، عملكرد بسيار بهتري در مقايسه با معيارهاي فاصله مرسوم از قبيل فاصله اقليدسي دارند. با گسترش اين الگوريتم‌ها، نوع مبتني بر كرنل برخي از اين الگوريتم‌ها نيز ارائه شده كه در آنها با استفاده از تابع كرنل، نمونه‌ها به‌طور غير صريح به فضاي ويژگي جديدي با ابعاد بالاتر نگاشت يافته و سپس در اين فضاي ويژگي جديد، معيار فاصله براي كاربرد مورد نظر آموزش داده مي‌شود. برخلاف عملكرد بسيار خوب توابع كرنل در الگوريتم‌هاي مختلف، يكي از مسائلي كه در اين الگوريتم‌ها وجود دارد، انتخاب كرنل مناسب و يا پارامترهاي مناسب براي يك كرنل مشخص است. استفاده از كرنل مركب به جاي استفاده از يك كرنل به‌تنهايي، بهترين راه حلي است كه تاكنون براي اين مسئله ارائه شده است. در فرآيند دست‌يابي به كرنل مركب بهينه نيز، استفاده از الگوريتم‌هاي يادگيري اهميت دارد. در اين پژوهش، با ادغام اين دو فرآيند يادگيري، ساختارهاي نيمه نظارتي متفاوتي براي تعيين وزن كرنل‌ها در يك تركيب كرنلي ارائه مي‌شود. كرنل مركب نهايي براي سنجش فاصله داده‌ها در كاربرد خوشه‌بندي مورد استفاده واقع مي‌شود. در ساختارهاي نيمه نظارتي بررسي‌شده، سعي بر آن است كه در فرآيند بهينه‌سازي با تعيين تابع هدف مناسب، وزن كرنل‌ها به‌گونه‌اي تعيين شود كه فاصله زوج‌هاي مشابه كمينه و فاصله زوج‌هاي نامشابه بيشينه شود. بررسي عملكرد اين ساختارهاي پيشنهادي بر روي داده مصنوعي XOR و همچنين مجموعه داده‌هاي پايگاه داده UCI نشان دهنده مؤثر بودن ساختارهاي پيشنهادي است.
چكيده لاتين :
Distance metric has a key role in many machine learning and computer vision algorithms so that choosing an appropriate distance metric has a direct effect on the performance of such algorithms. Recently, distance metric learning using labeled data or other available supervisory information has become a very active research area in machine learning applications. Studies in this area have shown that distance metric learning-based algorithms considerably outperform the commonly used distance metrics such as Euclidean distance. In the kernelized version of the metric learning algorithms, the data points are implicitly mapped into a new feature space using a non-linear kernel function. The associated distance metric is then learned in this new feature space. Utilizing kernel function improves the performance of pattern recognition algorithms, however choosing a proper kernel and tuning its parameter(s) are the main issues in such methods. Using of an appropriate composite kernel instead of a single kernel is one of the best solutions to this problem. In this research study, a multiple kernel is constructed using the weighted sum of a set of basis kernels. In this framework, we propose different learning approaches to determine the kernels weights. The proposed learning techniques arise from the distance metric learning concepts. These methods are performed within a semi supervised framework where different cost functions are considered and the learning process is performed using a limited amount of supervisory information. The supervisory information is in the form of a small set of similarity and/or dissimilarity pairs. We define four distance metric based cost functions in order to optimize the multiple kernel weight. In the first structure, the average distance between the similarity pairs is considered as the cost function. The cost function is minimized subject to maximizing of the average distance between the dissimilarity pairs. This is in fact, a commonly used goal in the distance metric learning problem. In the next structure, it is tried to preserve the topological structure of the data by using of the idea of graph Laplacian. For this purpose, we add a penalty term to the cost function which preserves the topological structure of the data. This penalty term is also used in the other two structures. In the third arrangement, the effect of each dissimilarity pair is considered as an independent constraint. Finally, in the last structure, maximization of the distance between the dissimilarity pairs is considered within the cost function not as a constraint. The proposed methods are examined in the clustering application using the kernel k-means clustering algorithm. Both synthetic (a XOR data set) and real data sets (the UCI data) used in the experiments and the performance of the clustering algorithm using single kernels, are considered as the baseline. Our experimental results confirm that using the multiple kernel not only improves the clustering result but also makes the algorithm independent of choosing the best kernel. The results also show that increasing of the number of constraints, as in the third structures, leads to instability of the algorithm which is expected.
سال انتشار :
1396
عنوان نشريه :
پردازش علائم و داده ها
فايل PDF :
7329126
عنوان نشريه :
پردازش علائم و داده ها
لينک به اين مدرک :
بازگشت