شماره ركورد كنفرانس :
5286
عنوان مقاله :
مروري بر الگوريتم هاي مختلف KNN توسعه يافته
پديدآورندگان :
محمدي هادي h.mohammadi@pnu.ac.ir دانشگاه پيام نور , عمراني فاطمه f.omrani@pnu.ac.ir دانشگاه پيام نور , رضائي فرشته f.rezaei@pnu.ac.ir دانشگاه پيام نور
كليدواژه :
الگوريتم KNN توسعه يافته , الگوريتم وزن دهي hubness و فازي , الگوريتم خوشه بندي تك گذر مقيد , سناريوي چند برچسبي با انتخاب نمونه اوليه براي الگوريتم KNN
عنوان كنفرانس :
پنجمين كنفرانس بينالمللي محاسبات نرم
چكيده فارسي :
در دنياي امروزي در كاربردهايي مانند دستهبندي متن يا پيشبيني بارش در پيشبيني وضعيت شيء جديد، تشخيص اينكه با توجه به دادههاي بزرگ فعلي داده ورودي جديد چه وضعيتي خواهد داشت، بسيار مهم است. بدين منظور يكي از تكنيكهاي مهم دادهكاوي به نام دستهبندي (classification) استفاده ميشود. در اين مقاله الگوريتم KNN (K نزديك ترين همسايه) مورد بررسي قرار گرفتهاست و مروري كلي از اينكه تاكنون از چه روشهايي براي بهبود اين الگوريتم استفاده شدهاست، انجام گرفتهاست. الگوريتم KNN در عين سادگي، بي پارامتر بودن و كارائي دستهبندي بالا، داراي اشكالاتي مانند زمان پيچيدگي محاسباتي بالا، نسبتاٌ گران بودن دستهبندي شي جديد، حساسيت به انتخاب مقدار K و حساسيت نسبت به نويز است. لذا اين الگوريتم بايد توسعه يابد. الگوريتمهاي KNN توسعه يافته مختلف كه در اين مقاله مورد بررسي قرار گرفتهاند به دو دسته مهم تقسيم ميشوند: 1- طراحي الگوريتمهاي سريع براي جستجوي k نزديكترين همسايه شي جديد در كوتاهترين زمان. 2- انتخاب برخي نمونههاي نماينده از نمونه هاي يادگيري اوليه يا حذف برخي از نمونههاي يادگيري اوليه. بدين منظور در اين مقاله الگوريتمهايي مانند درخت k-d، درخت k-d تصادفي، درخت R-tree ، درهمساز حساس به محل (LSH)، WKNN ، DWKNN ، الگوريتم وزندهي Exponential ، الگوريتم خوشهبندي تك گذر مقيد(INNTC) و سناريوي چند برچسبي با استفاده از انتخاب نمونه اوليه پرداخته شدهاست و با يكديگر مقايسه شدهاند. نتايج حاكي از عملكرد خوب برخي از الگوريتمها است. الگوريتم مبتني بر درخت تصادفي در زمان جستجو بهبود ايجاد ميكند. الگوريتم KNN مبتني بر خوشهبندي وزن دار، الگوريتم خوشهبندي تك گذر مقيد، الگوريتم مبتني بر سناريوي انتخاب نمونه اوليه در دسته بندي چند برچسبي موفق هستند و روش وزندهي Hubness و فازي با كاهش نمونه آزمايشي باعث بهبود الگوريتم KNN مي باشد.