شماره ركورد كنفرانس :
4398
عنوان مقاله :
دسته بندي داده هاي نامتوازن ريزآرايه DNA مبتني بر يادگيري گروهي و الگوريتم بهينه سازي ازدحام ذرات دودويي
پديدآورندگان :
شريعت پناه داود D.Shariatpanah@mshdiau.ac.ir گروه كامپيوتر، واحد مشهد، دانشگاه آزاد اسلامي، مشهد، ايران , جلالي مهرداد Jalali@mshdiau.ac.ir گروه كامپيوتر، واحد مشهد، دانشگاه آزاد اسلامي، مشهد، ايران , سيدمهدوي چابك سيدجواد Mahdavi@mshdiau.ac.ir گروه كامپيوتر، واحد مشهد، دانشگاه آزاد اسلامي، مشهد، ايران
كليدواژه :
بهينهسازي ازدحام ذرات دودويي , توزيع كلاس نامتوازن , ريزآرايه DNA , يادگيري گروهي
عنوان كنفرانس :
سومين كنگره بين المللي فن آوري، ارتباطات و دانش (ICTCK2016)
چكيده فارسي :
امروزه دستهبندي دادههاي ريزآرايه DNA در زمينه تشخيص مؤثر و پيشبيني درمان انواع بيماريهاي زيستي ازجمله انواع سرطان بسيار پركاربرد است. يكي از ويژگيهاي دادههاي ريزآرايه DNA توزيع نامتوازن تعداد نمونهها در كلاسها است.اين عدم توازنبهشدت عملكرد پيشبيني كلاس اقليت را تحت تأثير قرار ميدهد و موجب ارزيابي نادرست عملكرد دستهبندي ميشود.
در اين مقاله، جهت مواجهه با مشكل عدم توازن دادههاي ريزآرايه، يك روش يادگيري گروهي مبتني بر تركيب روش Bagging و الگوريتم بهينهسازي ازدحام ذرات دودويي ارائهشده است. در روش ارائهشده ابتدا با استفاده از يك روش انتخاب ويژگي سريع و كارآمد تحت عنوان mRMR ويژگيهاي زائد و افزونه را حذف ميكنيم. سپس، با بهكارگيري الگوريتم بهينهسازي ازدحام ذرات دودويي، زيرمجموعههاي نمونه بهينه را از كلاس اكثريت انتخاب ميكنيم و از آنها جهت توليد دستهبندهاي پايه متنوع و دقيق در روش Bagging بهره ميبريم. همچنين جهت اجتناب از مشكل وزن دهي اهداف در مسأله بهينهسازي چندهدفه، با استفاده از يك چهارچوب تصميمگيري فازي، تعريف منعطفتري از اهداف را در روش نمونهبرداري ارائه ميكنيم.
نتايج بهدستآمده از آزمايشهايي كه روي چهار مجموعه داده نامتوازن ريزآرايه DNAانجامشده است نشان ميدهد كه روش ارائهشده در معيارهاي Accuracy، F-measure و G-mean عملكرد بهتري را نسبت به روشهاي پايه از خود نشان ميدهد.