عنوان مقاله :
ارزيابي تأثير انتخاب ويژگي و توابع كرنل مختلف در عملكرد SVM براي تشخيص سرطان پستان
عنوان به زبان ديگر :
Evaluation of the Effect of Feature Selection and Different kernel Functions on SVM Performance for Breast Cancer Diagnosis
پديد آورندگان :
اروجي، اعظم دانشگاه علوم پزشكي ايران - دانشكده مديريت و اطلاع رساني پزشكي - گروه مديريت اطلاعات سلامت , لنگري زاده، مصطفي دانشگاه علوم پزشكي ايران - دانشكده مديريت و اطلاع رساني پزشكي - گروه مديريت اطلاعات سلامت
كليدواژه :
يادگيري ماشين و كاهش بعد , سيستمهاي پشتيبان تصميم باليني , تشخيص زودهنگام سرطان
چكيده فارسي :
سرطان پستان يكي از رايجترين سرطانها در ميان زنان است. در تصاوير ماموگرافي، تشخيص تومورهاي خوشخيم از بدخيم به دليل شباهت ساختاري كاري دشوار و زمانبر است. يادگيري ماشين يك شاخه از هوش مصنوعي است كه ميتواند به صورت ابزاري كمكي در كنار پزشك قرار گيرد و آنها را در تصميمگيري ياري كند. ماشين بردار پشتيبان SVM يكي از رايجترين روشهاي يادگيري ماشين است كه عملكرد آن به نوع تابع كرنل و ويژگيهاي ورودي وابسته است. هدف اين مطالعه، بررسي تأثير انتخاب ويژگي و توابع كرنل مختلف در عملكرد SVM ميباشد.
روش: اين مطالعه از نوع تحليلي بود و با روش مقايسهاي انجام گرفت. انتخاب بهترين ويژگيها توسط الگوريتم ژنتيك انجام شد. سپس SVM با توابع كرنلي مختلف شامل چندجملهاي، خطي، توابع شعاعي پايه، درجه دو و پرسپترون چندلايه ابتدا با تمام ويژگيها و سپس با ويژگيهاي منتخب آموزش و ارزيابي شد. به منظور ارزيابي عملكرد طبقهبندها از مجموعه داده سرطان پستان ويسكانسين و پيادهسازي مدلها در متلب انجام شد.
نتايج: نتايج نشان داد كه بعد از انتخاب ويژگي عملكرد SVM با تابع كرنل پرسپترون چندلايه كاهش و با تابع كرنل درجه دو افزايش يافت. با اين حال، عملكرد توابع كرنل خطي و تابع شعاعي پايه در هر دو حالت مطلوب بود. به طور كلي، بعد از كاهش بعد، بهترين مقدار دقت، ويژگي، حساسيت و صحت به ترتيب به ميزان 0/663، 0/833، 1/077 و 0/138 درصد كاهش يافت.
نتيجهگيري: روشهاي مبتني بر تكنيكهاي يادگيري ماشين ميتوانند پزشكان را در تصميمگيري براي درمان يا تشخيص بيماري ياري كنند.
چكيده لاتين :
Introduction: Breast cancer is one of the most common cancers affecting women. In
mammography, differentiating a malignant tumor from a benign one is a very tedious task due to
their structural similarities. Machine Learning (ML) is a subfield of Artificial Intelligence that can
be used as an effective tool to help physicians to make decisions. Support vector machine (SVM) is
one of the most common ML techniques that its performance depends on kernel parameters tuning
and input features. The aim of this study was to investigate the effect of feature selection and
different kernel functions on SVM performance.
Methods: This analytic study was performed through comparative method. Genetic algorithm was
used for feature selection. SVM models based on different kernel functions, including polynomial,
Linear, Radial Basis Function (RBF), Quadratic and Multi-Layer Perceptron (MLP), were first
performed with all features and then, with the selected features. The Wisconsin original breast
cancer data set was used as a training set to evaluate the performance of the classifiers. All
implementations were done in MATLAB environment.
Results: According to the obtained results, by applying feature selection, the performance of SVM
with MLP kernel function decreased and with quadratic kernel function increased. However, the
performances of the linear and RBF kernels were desirable in both conditions. Generally, after the
dimension reduction, the best accuracy, specificity, sensitivity and accuracy were dropped by 0.663,
0.833, 1.077 and 0.138 percent respectively.
Conclusion: The ML-based methods can help physicians in diagnosis and decision makings for
treatment.
عنوان نشريه :
مجله انفورماتيك سلامت و زيست پزشكي
عنوان نشريه :
مجله انفورماتيك سلامت و زيست پزشكي