شماره ركورد كنفرانس :
5286
عنوان مقاله :
مروري بر الگوريتم هاي مختلف KNN توسعه يافته
پديدآورندگان :
محمدي هادي h.mohammadi@pnu.ac.ir دانشگاه پيام نور , عمراني فاطمه f.omrani@pnu.ac.ir دانشگاه پيام نور , رضائي فرشته f.rezaei@pnu.ac.ir دانشگاه پيام نور
تعداد صفحه :
8
كليدواژه :
الگوريتم KNN توسعه يافته , الگوريتم وزن دهي hubness و فازي , الگوريتم خوشه بندي تك گذر مقيد , سناريوي چند برچسبي با انتخاب نمونه اوليه براي الگوريتم KNN
سال انتشار :
1402
عنوان كنفرانس :
پنجمين كنفرانس بين‌المللي محاسبات نرم
زبان مدرك :
فارسي
چكيده فارسي :
در دنياي امروزي در كاربردهايي مانند دسته‌بندي متن يا پيش‌بيني بارش در پيش‌بيني وضعيت شيء جديد، تشخيص اينكه با توجه به داده‌هاي بزرگ فعلي داده ورودي جديد چه وضعيتي خواهد داشت، بسيار مهم است. بدين منظور يكي از تكنيك‌هاي مهم داده‌كاوي به نام دسته‌بندي (classification) استفاده مي‌شود. در اين مقاله الگوريتم KNN (K نزديك ترين همسايه) مورد بررسي قرار گرفته‌است و مروري كلي از اينكه تاكنون از چه روش‌هايي براي بهبود اين الگوريتم استفاده شده‌است، انجام گرفته‌است. الگوريتم KNN در عين سادگي، بي پارامتر بودن و كارائي دسته‌بندي بالا، داراي اشكالاتي مانند زمان پيچيدگي محاسباتي بالا، نسبتاٌ گران بودن دسته‌بندي شي جديد، حساسيت به انتخاب مقدار K و حساسيت نسبت به نويز است. لذا اين الگوريتم بايد توسعه يابد. الگوريتم‌هاي KNN توسعه‌ يافته مختلف كه در اين مقاله مورد بررسي قرار گرفته‌اند به دو دسته مهم تقسيم مي‌شوند: 1- طراحي الگوريتم‌هاي سريع براي جستجوي k نزديكترين همسايه شي جديد در كوتاه‌ترين زمان. 2- انتخاب برخي نمونه‌هاي نماينده از نمونه هاي يادگيري اوليه يا حذف برخي از نمونه‌هاي يادگيري اوليه. بدين منظور در اين مقاله الگوريتم‌هايي مانند درخت k-d، درخت k-d تصادفي، درخت R-tree ، درهم‌ساز حساس به محل (LSH)، WKNN ، DWKNN ، الگوريتم وزن‌دهي Exponential ، الگوريتم خوشه‌بندي تك گذر مقيد(INNTC) و سناريوي چند برچسبي با استفاده از انتخاب نمونه اوليه پرداخته شده‌است و با يكديگر مقايسه شده‌اند. نتايج حاكي از عملكرد خوب برخي از الگوريتم‌ها است. الگوريتم مبتني بر درخت تصادفي در زمان جستجو بهبود ايجاد مي‌كند. الگوريتم KNN مبتني بر خوشه‌بندي وزن دار، الگوريتم خوشه‌بندي تك گذر مقيد، الگوريتم مبتني بر سناريوي انتخاب نمونه اوليه در دسته بندي چند برچسبي موفق هستند و روش وزن‌دهي Hubness و فازي با كاهش نمونه آزمايشي باعث بهبود الگوريتم KNN مي باشد.
كشور :
ايران
لينک به اين مدرک :
بازگشت