• شماره ركورد
    1389041
  • عنوان مقاله

    ارائه روشي جديد براي خوشه بندي داده هاي مخلوط بر مبناي تعداد ويژگي مشابه

  • پديد آورندگان

    رضايي ، حميد دانشگاه تربيت دبير شهيد رجايي - دانشكده مهندسي كامپيوتر , دانشپور ، نگين دانشگاه تربيت دبير شهيد رجايي - دانشكده مهندسي كامپيوتر

  • از صفحه
    39
  • تا صفحه
    52
  • كليدواژه
    خوشه‌بندي , داده مخلوط , فاصله مقادير , تشابه مقادير , مركز خوشه
  • چكيده فارسي
    خوشه بندي عملياتي است كه در آن مجموعه اي از نمونه داده‌ها، نسبت به ميزان شباهت، دسته بندي مي شوند. نمونه داده هاي خوشه بندي، عددي يا مخلوطي از عددي و غيرعددي (اسمي) هستند. يافتن ميزان شباهت و اندازه‌گيري فاصله، از چالش هاي خوشه بندي داده هاي مخلوط است. در اين مقاله سعي شده است در محاسبه ميزان شباهت و تعيين فاصله، به پارامتر تعداد ويژگي‌هاي مشابه توجه شود. در نسبت دادن هر نمونه به خوشه در مواردي كه فاصله‌ها برابر يا نزديك باشد، تعداد ويژگي‌هاي مشترك نمونه‌ها تعيين كننده خوشه مناسب خواهد بود. براي محاسبه فاصله در الگوريتم مورد نظر از تفاضل عددي نرمالسازي شده براي ويژگي‌هاي عددي و از فاصله همينگ براي ويژگي‌هاي غيرعددي استفاده شده است. تعيين مركز خوشه اوليه نيز مانند بسياري از روش‌ها بصورت تصادفي انجام شده است و در تكرارهاي بعدي الگوريتم، نمونه مناسب‌تر به عنوان مركز خوشه انتخاب مي‌شود. الگوريتم مورد نظر با 5 الگوريتم ديگر در 5 مجموعه‌ داده مقايسه شده است. در بررسي نتايج، از سه معيارAccuracy ، RI، F-Measure  استفاده شده است. طبق نتايج آزمايشات، در سه مجموعه‌داده، الگوريتم موردنظر حداقل دو درصد بهتر از دو الگوريتم و يك درصد بهتر از يكي ديگر از الگوريتم‌ها عمل كرده است. در يكي ديگر از مجموعه‌داده‌ها الگوريتم موردنظر نتايج برابر يا نزديك به يك درصد دقت بهتر نسبت به الگوريتم برتر داشت. در مجموعه‌داده آخر نيز الگوريتم مورد نظر در رتبه دوم از بين پنج الگوريتم قرار داشت.
  • عنوان نشريه
    پردازش علائم و داده ها
  • عنوان نشريه
    پردازش علائم و داده ها