عنوان مقاله :
يك مدل طبقه بندي تركيبي براي تشخيص سرطان پستان با استفاده از پشته تعميم يافته
عنوان به زبان ديگر :
An Ensemble Classification Model for the Diagnosis of Breast Cancer Using Stacked Generalization
پديد آورندگان :
عشايري، ماهيار دانشگاه آزاد اسلامي واحد بوشهر - گروه مهندسي كامپيوتر , رضايي پناه، امين مؤسسه آموزش عالي رهجويان دانش برازجان - گروه مهندسي كامپيوتر، بوشهر
كليدواژه :
پشته تعميم يافته , طبقهبندي دادهها , پايگاه داده ويسكانسين , داده كاوي , سرطان پستان
چكيده فارسي :
مقدمه: سرطان پستان يكي از رايجترين انواع سرطانها است و رشد قابل ملاحظهاي از آن در سالهاي اخير گزارش شده است. به منظور تشخيص اين بيماري، پارامترهاي زيادي بايد بررسي گردد كه خطاهاي انساني و يا عوامل محيطي امكان اشتباه را ممكن ميكند. به همين دليل در چند دهه اخير از هوش مصنوعي براي تشخيص اين بيماري در جهت كمك به پزشكان استفاده ميشود.
روش: در اين مطالعه توصيفي-كاربردي، تشخيص بيماري سرطان پستان با استفاده از پشته تعميم يافته در قالب يك مدل تركيبي مبتني بر سه روش شبكه عصبي MLP، درخت تصميم ID3 و ماشين بردار پشتيبان ارائه شد. براي بهبود عملكرد مدل طبقهبندي تركيبي از يك رويكرد جديد تحت عنوان بلاك جداكننده استفاده شد. اين بلاك وظيفه تشخيص نمونههايي را دارد كه باعث ايجاد خطا در مدل طبقهبندي ميشوند.
نتايج: به منظور ارزيابي دقت روش پيشنهادي از پايگاه داده ويسكانسين مرتبط با بيماري سرطان پستان استفاده شد. نتايج آزمايشها برتري روش پيشنهادي را در مقابل ساير روشهاي مشابه نشان داد. دقت مدل طبقهبندي ارائه شده روي مجموعه دادههاي WBCD، WDBC و WPBC از پايگاه داده ويسكانسين به ترتيب 99/54%، 99/58% و 99/84% بود.
نتيجهگيري: با استفاده از الگوريتمهاي دادهكاوي ميتوان سيستمهاي نوين و با صرفهتري در نظام سلامت و درمان ارائه كرد كه با دقت بالايي قادر به تشخيص سرطان پستان باشند. در اين تحقيق ضمن تشخيص بيماري به كمك روشهاي دادهكاوي، توانست با استفاده از تكنيك پشته تعميم يافته به دقت بالايي در تشخيص بيماري دست يابد.
چكيده لاتين :
Introduction: Breast cancer is one of the most common types of cancer whose incidence has
increased dramatically in recent years. In order to diagnose this disease, many parameters must be
taken into consideration and mistakes are possible due to human errors or environmental factors.
For this reason, in recent decades, Artificial Intelligence has been used by medical practitioners to
diagnose this disease.
Method: In this applied-descriptive study, the diagnosis of breast cancer using stacked
generalization was presented in the form of an ensemble model based on MLP neural network, ID3
decision tree, and support vector machine methods. To improve the performance of the ensemble
classification model, a new approach called separator block was used. This block is responsible for
identifying instances that cause errors in the classification model.
Results: In order to evaluate the accuracy of the proposed method, the Wisconsin database for
breast cancer was used. The experimental results showed the superiority of the proposed method
over other similar methods. The accuracy of the classification model presented on the WBCD,
WDBC, and WPBC datasets from the Wisconsin database was 99.54%, 99.58% and 99.84%,
respectively.
Conclusion: Data mining algorithms can provide new and more cost-effective systems in the field
of health and treatment that can diagnose breast cancer with high accuracy. In this study, modeling
based on the stacked generalization technique was of high accuracy in the diagnosis of breast
cancer.
عنوان نشريه :
مجله انفورماتيك سلامت و زيست پزشكي