شماره ركورد
1389041
عنوان مقاله
ارائه روشي جديد براي خوشه بندي داده هاي مخلوط بر مبناي تعداد ويژگي مشابه
پديد آورندگان
رضايي ، حميد دانشگاه تربيت دبير شهيد رجايي - دانشكده مهندسي كامپيوتر , دانشپور ، نگين دانشگاه تربيت دبير شهيد رجايي - دانشكده مهندسي كامپيوتر
از صفحه
39
تا صفحه
52
كليدواژه
خوشهبندي , داده مخلوط , فاصله مقادير , تشابه مقادير , مركز خوشه
چكيده فارسي
خوشه بندي عملياتي است كه در آن مجموعه اي از نمونه دادهها، نسبت به ميزان شباهت، دسته بندي مي شوند. نمونه داده هاي خوشه بندي، عددي يا مخلوطي از عددي و غيرعددي (اسمي) هستند. يافتن ميزان شباهت و اندازهگيري فاصله، از چالش هاي خوشه بندي داده هاي مخلوط است. در اين مقاله سعي شده است در محاسبه ميزان شباهت و تعيين فاصله، به پارامتر تعداد ويژگيهاي مشابه توجه شود. در نسبت دادن هر نمونه به خوشه در مواردي كه فاصلهها برابر يا نزديك باشد، تعداد ويژگيهاي مشترك نمونهها تعيين كننده خوشه مناسب خواهد بود. براي محاسبه فاصله در الگوريتم مورد نظر از تفاضل عددي نرمالسازي شده براي ويژگيهاي عددي و از فاصله همينگ براي ويژگيهاي غيرعددي استفاده شده است. تعيين مركز خوشه اوليه نيز مانند بسياري از روشها بصورت تصادفي انجام شده است و در تكرارهاي بعدي الگوريتم، نمونه مناسبتر به عنوان مركز خوشه انتخاب ميشود. الگوريتم مورد نظر با 5 الگوريتم ديگر در 5 مجموعه داده مقايسه شده است. در بررسي نتايج، از سه معيارAccuracy ، RI، F-Measure استفاده شده است. طبق نتايج آزمايشات، در سه مجموعهداده، الگوريتم موردنظر حداقل دو درصد بهتر از دو الگوريتم و يك درصد بهتر از يكي ديگر از الگوريتمها عمل كرده است. در يكي ديگر از مجموعهدادهها الگوريتم موردنظر نتايج برابر يا نزديك به يك درصد دقت بهتر نسبت به الگوريتم برتر داشت. در مجموعهداده آخر نيز الگوريتم مورد نظر در رتبه دوم از بين پنج الگوريتم قرار داشت.
عنوان نشريه
پردازش علائم و داده ها
عنوان نشريه
پردازش علائم و داده ها
لينک به اين مدرک