عنوان مقاله :
يادگيري متريك بر اساس فاصله χ2 سريع براي دستهبندي دادههاي هيستوگرامي با دستهبندي كننده KNN
عنوان به زبان ديگر :
Metric Learning based on Fast χ2 Distance for Histogram Data Classification via KNN Classifier
پديد آورندگان :
صادقي، حميد دانشگاه صنعتي اميركبير - دانشكده مهندسي برق، تهران , اسدالله راعي، ابوالقاسم دانشگاه صنعتي اميركبير - دانشكده مهندسي برق، تهران
كليدواژه :
يادگيري متريك , فاصله مربع كاي سريع , دستهبندي هيستوگرام , دستهبندي كننده KNN
چكيده فارسي :
مقايسه دادهها يك مسأله بنيادي و پركاربرد در يادگيري ماشين است. در دهه گذشته تحقيقات فراواني در زمينه يادگيري متريك انجام شده است؛ از كاربردهاي يادگيري متريك ميتوان به خوشهبندي و دستهبندي دادهها اشاره كرد. در اين مقاله يك روش يادگيري متريك مناسب براي استفاده در مسائل بينايي ماشين ارائه ميشود. اكثر ويژگيهايي كه در بينايي ماشين استفاده ميشوند، هيستوگرامي هستند؛ اما روشهاي يادگيري متريك اغلب بر مبناي فاصله ماهالانوبيس طراحي شدهاند كه در ويژگيهاي هيستوگرامي كارايي مناسبي ندارد. در اين تحقيق يك روش جديد يادگيري متريك براي دادههاي هيستوگرامي بر مبناي فاصله مربع كاي (χ2) اصلاح شده ارائه ميشود. فاصله χ2 در دستهبندي دادههاي هيستوگرامي داراي دقت بالاتري نسبت به فاصله اقليدسي است، اما هزينه محاسباتي آن نيز بالاتر است. در اين مقاله يك رابطه تقريبي براي فاصله χ2 پيشنهاد ميشود و بخشي از محاسبات را به مرحله استخراج ويژگي (كه بهصورت غيربرخط قابل محاسبه است) منتقل ميكند؛ به اين ترتيب سرعت مقايسه ويژگيها افزايش مييابد. آزمايشها بر روي پايگاههاي داده مختلف نشان ميدهد كه روش يادگيري متريك پيشنهادي داراي دقت بالايي در دستهبندي دادههاي هيستوگرامي مختلف نسبت به روشهاي موجود است. همچنين معيار تقريبي براي فاصله χ2، با حفظ دقت، سرعت مقايسه دادهها را 2.5 برابر افزايش ميدهد.
چكيده لاتين :
Data comparison is a fundamental problem in machine learning research. Since, metric learning has various applications in clustering and classification problems, it is attracted much attention in the last decades. In this paper, an appropriate metric learning method is presented to utilize in machine vision problems. Common features in machine vision are often histogram; however, metric learning methods are usually designed based on Mahalanobis distance which is not applicable in histogram features. In this study, a new metric learning method based on modified chi-squared distance (χ2) for histogram data is presented. In histogram data classification, χ2 distance is more accurate than Euclidean one; however, its computational cost is higher than Euclidean distance. In this paper, a χ2 distance approximated formulation where a part of its computations is moved into the feature extraction step in offline phase is proposed. Consequently, computational cost of feature comparison is reduced. Experiments on different datasets show that the proposed metric learning method is more accurate than the existing ones in histogram data classification. Moreover, the approximated χ2 distance increases feature comparison speed about 2.5 times without loss of accuracy.
عنوان نشريه :
مهندسي برق دانشگاه تبريز