شماره ركورد :
1125883
عنوان مقاله :
يادگيري متريك بر اساس فاصله χ2 سريع براي دسته‌بندي داده‌هاي هيستوگرامي با دسته‌بندي كننده KNN
عنوان به زبان ديگر :
Metric Learning based on Fast χ2 Distance for Histogram Data Classification via KNN Classifier
پديد آورندگان :
صادقي، حميد دانشگاه صنعتي اميركبير - دانشكده مهندسي برق، تهران , اسدالله راعي، ابوالقاسم دانشگاه صنعتي اميركبير - دانشكده مهندسي برق، تهران
تعداد صفحه :
12
از صفحه :
657
تا صفحه :
668
كليدواژه :
يادگيري متريك , فاصله مربع كاي سريع , دسته‌بندي هيستوگرام , دسته‌بندي كننده KNN
چكيده فارسي :
مقايسه داده‌ها يك مسأله بنيادي و پركاربرد در يادگيري ماشين است. در دهه گذشته تحقيقات فراواني در زمينه يادگيري متريك انجام شده است؛ از كاربردهاي يادگيري متريك مي‌توان به خوشه‌بندي و دسته‌بندي داده‌ها اشاره كرد. در اين مقاله يك روش يادگيري متريك مناسب براي استفاده در مسائل بينايي ماشين ارائه مي‌شود. اكثر ويژگي‌هايي كه در بينايي ماشين استفاده مي‌شوند، هيستوگرامي هستند؛ اما روش‌هاي يادگيري متريك اغلب بر مبناي فاصله ماهالانوبيس طراحي شده‌اند كه در ويژگي‌هاي هيستوگرامي كارايي مناسبي ندارد. در اين تحقيق يك روش جديد يادگيري متريك براي داده‌هاي هيستوگرامي بر مبناي فاصله مربع كاي (χ2) اصلاح شده ارائه مي‌شود. فاصله χ2 در دسته‌بندي داده‌هاي هيستوگرامي داراي دقت بالاتري نسبت به فاصله اقليدسي است، اما هزينه محاسباتي آن نيز بالاتر است. در اين مقاله يك رابطه تقريبي براي فاصله χ2 پيشنهاد مي‌شود و بخشي از محاسبات را به مرحله استخراج ويژگي (كه به‌صورت غيربرخط قابل محاسبه است) منتقل مي‌كند؛ به اين ترتيب سرعت مقايسه ويژگي‌ها افزايش مي‌يابد. آزمايش‌ها بر روي پايگاه‌هاي داده مختلف نشان مي‌دهد كه روش يادگيري متريك پيشنهادي داراي دقت بالايي در دسته‌بندي داده‌هاي هيستوگرامي مختلف نسبت به روش‌هاي موجود است. همچنين معيار تقريبي براي فاصله χ2، با حفظ دقت، سرعت مقايسه داده‌ها را 2.5 برابر افزايش مي‌دهد.
چكيده لاتين :
Data comparison is a fundamental problem in machine learning research. Since, metric learning has various applications in clustering and classification problems, it is attracted much attention in the last decades. In this paper, an appropriate metric learning method is presented to utilize in machine vision problems. Common features in machine vision are often histogram; however, metric learning methods are usually designed based on Mahalanobis distance which is not applicable in histogram features. In this study, a new metric learning method based on modified chi-squared distance (χ2) for histogram data is presented. In histogram data classification, χ2 distance is more accurate than Euclidean one; however, its computational cost is higher than Euclidean distance. In this paper, a χ2 distance approximated formulation where a part of its computations is moved into the feature extraction step in offline phase is proposed. Consequently, computational cost of feature comparison is reduced. Experiments on different datasets show that the proposed metric learning method is more accurate than the existing ones in histogram data classification. Moreover, the approximated χ2 distance increases feature comparison speed about 2.5 times without loss of accuracy.
سال انتشار :
1398
عنوان نشريه :
مهندسي برق دانشگاه تبريز
فايل PDF :
7758818
لينک به اين مدرک :
بازگشت