شماره ركورد كنفرانس :
3926
عنوان مقاله :
ارائه يك شاخص جديد اعتبارسنجي داخلي خوشه بندي
پديدآورندگان :
امامي محسن mo.emami@sutech.ac.ir دانشجوي دكتري، دانش ده مهندسي كامپيوتر و فناوري اطلاعات، دانشگاه صنعتي شيراز , فاروقي آزاده faroughi_a22@yahoo.com دانشجوي دكتري، دانش ده مهندسي كامپيوتر و فناوري اطلاعات، دانشگاه صنعتي شيراز , جاويدان رضا Javidan@sutech.ac.ir استاديار، دانش ده مهندسي كامپيوتر و فناوري اطلاعات، دانشگاه صنعتي شيراز
كليدواژه :
اعتبارسنجي , خوشهبندي , نزديكترين همسايه ها.
عنوان كنفرانس :
بيست و چهارمين كنفرانس مهندسي برق ايران
چكيده فارسي :
يكي از پرچالشترين مسائل در حوزه دادهكاوي خوشهبندي است . هدف از فرايند خوشهبندي تقسيمبندي مجموعه داده به زيرمجموعه ها يا خوشههاست كه درجهي شباهت بين اعضاي هر زير مجموعه بالا باشد. موضوعي كه در خوشهبندي بسيار حائز اهميت است، اعتبارسنجي نتايج خوشهبندي است . اعتبارسنجي مشخص ميكند روش خوشهبندي مورد استفاده به چه ميزان به صورت صحيح دادهها را خوشهبندي كرده است. وقتي نتايج خوشهبندي فقط براساس دادههايي كه خوشهبندي شدهاند مورد ارزيابي قرار گيرد، اعتبارسنجي، داخلي گفته ميشود، اما هنگامي كه از اطلاعات خارجي جهت ارزيابي نتايج خوشهبندي استفاده شود، اعتبار سنجي، بيروني گفته ميشود. شاخص اعتبارسنجي ميتواند در تعيين تعداد صحيح خوشههاي يك مجموعهداده و يا مقايسه و ارزيابي روشهاي گوناگون خوشه بندي مورد استفاده قرار گيرد. در اين مقاله يك شاخص جديد اعتبارسنجي دروني پيشنهاد شده است كه در آن براي بدست آوردن فاصلهي برون خوشه اي و درون خوشهاي از معيار نزديكترين همسايه استفاده شده است. اين امر منجر به كاهش پيچيدگي زماني در بهترين حالت و حالت متوسط ميشود. در محاسبه شاخص پيشنهادي نيازي به محاسبه فاصله تكتك دادهها در يك خوشه يا در خوشههاي مختلف نيست. جهت مقايسه نتايج شاخص پيشنهادي، روشهاي اعتبارسنجي داخلي گوناگوني مورد بررسي قرار گرفتهاند. نتايج آزمايشها نشان ميدهد هر يك از اين روشها محدوديتهاي خاصي روي يك يا چند نمونه از مجموعه داده ها دارند. اين نتايج همچنين نشان ميدهد كه روش پيشنهادي از نظر بهبود عملكرد و پيچيدگي زمان اجرا بهبود خوبي نسبت به روشهاي مشابه روي داده هاي مصنوعي و واقعي دارد.