عنوان مقاله :
افزايش كارايي فرايند خوشه بندي K- ميانگين توسط روش هاي سلسله مراتبي
عنوان فرعي :
Adopting Hierarchial Cluster Analysis to Improve The Performance of K-mean Algorithm
پديد آورندگان :
قهرمان، بيژن نويسنده دانشگاه فردوسي مشهد,دانشكده كشاورزي; Ghahraman, B , داوري، كامران نويسنده ,
اطلاعات موجودي :
دو ماهنامه سال 1393 شماره 0
كليدواژه :
تحليل فراواني منطقه اي سيلاب , خوشه بندي , خراسان , گشتاورهاي خطي , ناحيه بندي , هيبريد
چكيده فارسي :
به علت كمبود آمار و اطلاعات هميشه امكان استفاده از تحليل فراواني مكاني جهت تخمين چندك هاي سيلاب وجود ندارد. از آن جاكه استفاده از يك روش واحد براي ناحيه اي كردن معمولاً نتايج قابل قبولي را به دست نمي دهد، لذا معمولاً چندين روش منطقه اي به طور توام مورد استفاده قرار ميگيرد. در اين مطالعه سه الگوريتم خوشهاي هيبريد كه هر يك به طور جداگانه فرايند خوشهاي كردن را براي تعيين نواحي مشابه به كار ميبرند، مورد بررسي قرار گرفت. از الگوريتم هاي خوشه اي سلسله مراتبي متراكمي از روش هاي پيوند تكي، پيوند كامل و وارد، و از الگوريتم خوشه-اي تفكيكي، از الگوريتم K- ميانگين استفاده شد. تاثير تحليل خوشه اي هيبريد در ناحيه اي كردن با استفاده از آمار روزآمد شده ي 68 حوضه ي آبريز استانهاي خراسان مورد بررسي قرار گرفت. از چهار شاخص آزمون خوشه اي شامل ضريب كوفنتيك، متوسط عرض سيلهوت، نمايه هاي دان و ديويس- بولدين جهت تعيين تعداد بهينه ي خوشه ها استفاده گرديد. نتايج نشان داد كه روش هاي پيوند تكي و كامل برپايه ي نمايه هاي اعتبارسنجي ضريب كوفنتيك و متوسط عرض سيلهوت بهتر بودند ولي منجر به تشكيل خوشه هايي نامتجانس (يك خوشه ي بزرگ و تعدادي خوشه ي بسيار كوچك) گرديد كه در تحليل فراواني سيلاب مناسب نمي باشد. گرچه تحليل خوشه اي هيبريد در حداقل سازي تلاش لازم جهت نيل به نواحي همگن موثر بود ولي درجه ي موثر بودن به تعداد خوشه ها بستگي داشت. معيارهاي ناهمگني هاسكينگ منفي بود كه بيانگر همبستگي سيلاب در ايستگاه ها بود. نهايتاً هيبريد الگوريتم وارد و K- ميانگين براي استفاده در ناحيه اي كردن پيشنهاد گرديد. چهار ناحيه همگن تشخيص داده شد.
چكيده لاتين :
Due to inadequate flood data it is not always possible to fit a frequency analysis to at-site stations. Reliable results are not always guaranteed by a single clustering algorithm, so a combination of methods may be used. In this research, we considered three clustering algorithms: single linkge, complete linkage and Ward (as hierarchial clustering methods), and K-mean (as partitional clustering analysis). Hybrid cluster analysis was tested for up-to-dated of floods data in 68 hydrometric stations in East and NE of Iran. Four cluster validity indices were used to find the optimum number of clusters. Based on the Cophenetic coefficient and average Silhouette width, single linkge, and complete linkage methods were performed well, yet they produced non-consistent clusters (one large and numerous small clusters) which are not amenable for flood frequency analysis. It was shown that hybridization was efficient to form homogeneous regions, however, the usefulness was dependent to the number of classes. Heterogeneity measure of Hosking was negative, due to inter-correlation of floods in the clusters. The hybrid of Ward and K-mean was shown to be the best combination for the region under study. Four homogeneous regions were delineated.
اطلاعات موجودي :
دوماهنامه با شماره پیاپی 0 سال 1393
كلمات كليدي :
#تست#آزمون###امتحان