شماره ركورد :
971264
عنوان مقاله :
ارائه يك الگوريتم خوشه بندي مبتني بر چگالي با قابليت كشف خوشه هاي با چگالي متفاوت در پايگاه داده هاي مكاني
عنوان به زبان ديگر :
Proposing a Density-Based Clustering Algorithm with Ability to Discover Multi-Density Clusters in Spatial Databases
پديد آورندگان :
زاده ده بالايي، علي دانشگاه صنعتي اميركبير تهران - دانشكده مهندسي كامپيوتر و فناوري اطلاعات , باقري، عليرضا دانشگاه صنعتي اميركبير تهران - دانشكده مهندسي كامپيوتر و فناوري اطلاعات , افشار، حامد دانشگاه صنعتي اميركبير تهران - دانشكده مهندسي كامپيوتر و فناوري اطلاعات
تعداد صفحه :
16
از صفحه :
171
تا صفحه :
186
كليدواژه :
چگالي متفاوت , خوشه‌بندي مبتني بر چگالي , داده‌كاوي مكاني , DBSCAN
چكيده فارسي :
خوشه بندي يكي از تكنيك هاي مهم كشف دانش در پايگاه داده هاي مكاني است. الگوريتم هاي خوشه بندي مبتني بر چگالي يكي از روش هاي اصلي براي خوشه بندي در داده كاوي هستند. الگوريتم DBSCAN پايه روش هاي خوشه بندي مبتني بر چگالي است كه علي رغم مزايايي كه دارد داراي مشكلاتي نظير سخت بودن تعيين پارامترهاي ورودي و عدم توانايي كشف خوشه هاي با چگالي متفاوت نيز است. در اين مقاله الگوريتمي ارائه شده كه برخلاف الگوريتم DBSCAN، قابليت تشخيص خوشه هاي با چگالي متفاوت را دارد. اين الگوريتم همچنين خوشه هاي تودرتو و چسبيده به هم را نيز به خوبي تشخيص مي دهد. ايده الگوريتم پيشنهادي به اين صورت است كه ابتدا با استفاده از تكنيكي چگالي هاي مختلف مجموعه داده را تشخيص داده و براي هر چگالي يك شعاع Eps تعيين مي كند. سپس الگوريتم DBSCAN جهت اعمال بر روي مجموعه داده، با پارامترهاي به دست آمده تطبيق داده مي شود. الگوريتم پيشنهادي بر روي مجموعه داده هاي استاندارد و مصنوعي تست شده است و نتايج به دست آمده با نتايج حاصل از الگوريتم DBSCAN و پنج بهبود الگوريتم DBSCAN شامل: VDBSCAN، VMDBSCAN، LDBSCAN، DVBSCAN و MDDBSCAN كه همگي براي رفع مشكل تغييرات چگالي الگوريتم DBSCAN ارائه شده اند، بر اساس معيارهاي ارزيابي روش هاي خوشه بندي مقايسه شده اند. نتايج ارزيابي ها نشان مي دهد كه الگوريتم پيشنهادي از دقت بالا و درصد خطاي پاييني برخوردار بوده و نتايج بهتري نسبت به ساير الگوريتم ها داشته است.
چكيده لاتين :
Clustering is one of the important techniques for knowledge discovery in spatial databases. density-based clustering algorithms are one of the main clustering methods in data mining. DBSCAN which is the base of density-based clustering algorithms، besides its benefits suffers from some issues such as difficulty in determining appropriate values for input parameters and inability to detect clusters with different densities. In this paper، we introduce a new clustering algorithm which unlike DBSCAN algorithm، can detect clusters with different densities. This algorithm also detects nested clusters and clusters sticking together. The idea of the proposed algorithm is as follows. First، we detect the different densities of the dataset by using a technique and Eps parameter is computed for each density. Then DBSCAN algorithm is adapted with the computed parameters to apply on the dataset. The experimental results which are obtained by running the suggested algorithm on standard and synthetic datasets by using well-known clustering assessment criteria are compared to the results of DBSCAN algorithm and some of its variants including VDBSCAN، VMDBSCAN، LDBSCAN، DVBSCAN and MDDBSCAN. All these algorithms have been introduced to solve the problem of multi-density data sets. The results show that the suggested algorithm has higher accuracy and lower error rate in comparison to the other algorithms.
سال انتشار :
1396
عنوان نشريه :
مهندسي برق و مهندسي كامپيوتر ايران
فايل PDF :
3681429
عنوان نشريه :
مهندسي برق و مهندسي كامپيوتر ايران
لينک به اين مدرک :
بازگشت