شماره ركورد كنفرانس :
4658
عنوان مقاله :
ارائه يك روش تركيبي جديد براي خوشه بندي داده ها
عنوان به زبان ديگر :
A new hybrid method for data clustering
پديدآورندگان :
حيدري حسام آبادي مهندس وحيد heydarii.vahid@gmail.com دانشگاه آزاد اسلامي واحد شيراز; , قهرماني فرزاد Ghahramani@iaushiraz.ac.ir دانشگاه ازاد اسلامي واحد شيراز;
كليدواژه :
خوشه¬بندي , الگوريتم بهينه سازي انبوه ذرات , آشوب , الگوريتم تپه نوردي
عنوان كنفرانس :
دومين كنفرانس بين المللي پژوهش هاي دانش بنيان در كامپيوتر و فن آوري اطلاعات
چكيده فارسي :
خوشه بندي يكي از شاخه هاي يادگيري بدون ناظر است و در زمينه هاي زيادي از جمله مهندسي، پزشكي، زيست شناسي و ... كاربرد دارد. ايده اصلي خوشه بندي تفكيك داده ها در خوشه هاي مختلف، بر اساس شباهت آنها است. رويكردهاي مختلفي براي خوشه بندي وجود دارد كه رويكرد مبتني بر افراز داده ها يكي از آنها است. با توجه به اينكه در اين رويكرد، انتخاب هاي اوليه به عنوان مراكز خوشه ها نقش مهمي در روند خوشه بندي دارند، در اين مقاله براي بهبود پاسخ هاي اوليه، الگوريتم تپه نوردي با الگوريتم PSO آشوبگونه تركيب شده است؛ به اينصورت كه در الگوريتم PSO آشوبگونه، ابتدا اگر نقاط بهينه اي اطراف پاسخ هاي اوليه تصادفي وجود داشته باشد توسط الگوريتم تپه نوردي يافته و جايگزين مي گردد. نتايج پياده سازي و اجرا بر روي چهار مجموعه داده مختلف و مقايسه با تعداد زيادي از الگوريتم هاي معروف خوشه بندي نشان داد كه اين روش ضمن برخورداري از دقت بالا و خطاي كم، از سرعت همگرايي بالايي نيز برخوردار است.
چكيده لاتين :
Clustering is one of the unsupervised learning methods which is utilized in various areas of knowledge such as engineering, medicine, biology, and so on. The main idea of clustering is the separation of data into different clusters that is in turn based on their similarities. There are different approaches to clustering which are based on data partitioning, given that in this approach early choices as centers of clusters play an important role in the process. In this paper, to improve the initial responses, Hill Climbing algorithm is combined with chaotic PSO algorithm. In the chaotic PSO algorithm, the probable optimal points around the initial responses are found and replaced by the Hill Climbing algorithm. The implementation and execution of four different data sets and comparison with a large number of well-known clustering algorithms showed that this method has high convergence speed as well as high accuracy and low error.