عنوان مقاله :
يك الگوريتم خوشه بندي سلسله مراتبي تركيبي برپايه روش مبتني بر تراكم
عنوان به زبان ديگر :
A combinational hierarchical clustering algorithm on the basis of density-based methods
پديد آورندگان :
لطيفي پاكدهي، عليرضا دانشگاه تربيت دبير شهيد رجايي , دانشپور، نگين دانشگاه تربيت دبير شهيد رجايي - دانشكده مهندسي كامپيوتر
كليدواژه :
داده كاوي , خوشه بندي تركيبي , خوشه بندي سلسله مراتبي , خوشه بندي مبتني بر تراكم
چكيده فارسي :
خوشه بندي يكي از شاخه هاي مهم موجود در داده كاوي است كه هدف آن تقسيم داده ها به زيرمجموعه هاي معناداري است كه خوشه ناميده مي شوند. اين تكنيك شامل فرآيند پيدا كردن گروه بندي طبيعي در مجموعه داده ها، بر اساس شباهت و تفاوت است به نحوي كه اطلاعات قبلي كمي در مورد داده ها در دسترس است و يا اصلا اطلاعاتي در دسترس نيست. در طي دهه هاي متمادي الگوريتم هاي فراواني براي خوشه بندي در رويكردهاي مختلف و متفاوت و يا تركيبي از آنها ايجاد شده اند. در اين مقاله الگوريتمي بر پايه رويكردهاي مبني بر تراكم و سلسله مراتبي ارائه مي شود. DBSCANيكي از الگوريتم هاي مطرح شده در رويكرد مبتني بر تراكم است. اين الگوريتم نياز به دو پارامتر دارد كه تعيين آن هنوز يك چالش بزرگ است. در روش پيشنهادي پارامترهاي الگوريتم DBSCANطوري تنظيم مي شود كه بدون نياز به دخالت كاربر، خوشه هاي احتمالي بصورت خودكار يافت شوند. سپس خوشه هاي نزديك به يكديگر به قدري باهم ادغام مي شوند تا كيفيت خوشه هاي نهايي به نحو مطلوبي ارتقا يابد. بدين ترتيب خوشه هاي باكيفيت و دقيقي بدست خواهد آمد. در انتها براي آزمايش اين الگوريتم تركيبي جديد از داده هاي واقعي موجود در پايگاه داده UCIاستفاده شد. نتايج نشان مي دهد كه الگوريتم تركيبي جديد كارايي بيشتر و دقيقتر و سرعت مناسبي نسبت به روش هاي قبلي دارد.
چكيده لاتين :
Clustering is one of the most important field of data mining that aims to divide data into meaningful subsets which are called clusters. This technique involves the process of finding natural groupings in the data set based on the similarities and di similarities which a little or no information about data are available. Over the decades, many clustering algorithms are created in different approaches or a combination of them. In this paper, an algorithm based on density and hierarchical approaches is presented. DBSCAN is one of the algorithms presented in the density-based approach. This algorithm requires two parameters that its determination is a great challenge. In the proposed method, DBSCAN algorithm parameters can be set without user involvement, so that potential clusters are found automatically. The clusters which are so close to each other are merged together until the quality of the final clusters to be enhanced properly. Thus, clusters could be more accurate and high quality. Finally, in order to test the new proposed algorithm, the real dataset in the UCI machine learning repository was used. The results indicate that the new algorithm is more efficient and accurate, and its speed is better than previous methods.
عنوان نشريه :
صنايع الكترونيك
عنوان نشريه :
صنايع الكترونيك