عنوان مقاله :
تشخيص ابتلا به سرطان پستان با استفاده از رو شهاي درخت تصميم، شبكه عصبي و بيز ساده به منظور ارايه مدل بومي ويژه استان فارس
عنوان به زبان ديگر :
Diagnosis of Breast Cancer Using Decision Tree, Artificial Neural Network and Naive Bayes to Provide a Native Model for Fars Province
پديد آورندگان :
يزداني، آزيتا دانشگاه علوم پزشكي شيراز - دانشكده مديريت و اطلاع رساني پزشكي - گروه فناوري اطلاعات سلامت , صفايي، علي اصغر دانشگاه تربيت مدرس - دانشكده علوم پزشكي - گروه انفورماتيك پزشكي، تهران , صفدري، رضا دانشگاه علوم پزشكي تهران - دانشكده پيراپزشكي - گروه مديريت اطلاعات سلامت , زحمت كشان، مريم دانشگاه علوم پزشكي فسا - مركز تحقيقات بيماري هاي غير واگير
كليدواژه :
سرطان پستان , مدل تشخيص , درخت تصميم , بيز ساده , شبكه عصبي , عوامل خطرزا
چكيده فارسي :
زمينه و هدف: سرطان پستان شايعترين سرطان و اصليترين علت مرگ ناشي از سرطان در زنان سراسر جهان بهشمار ميرود. تكنولوژيهايي مثل داده كاوي، به متخصصان اين حوزه، امكان بهبود تصميمگيري را در زمينهي تشخيص زودهنگام فراهم آوردهاند. هدف از اين پژوهش توسعهي مدل تشخيص خودكار سرطان پستان با بهكارگيري روشهاي داده كاوي و انتخاب مدل بومي ويژه بيماران استان فارس با بالاترين دقت تشخيص ميباشد.
روش بررسي: در اين مطالعه، تعداد 654 پرونده در دسترس از بيماران كلينيك تخصصي سرطان پستان مطهري شيراز بهعنوان نمونه مورد استفاده قرار گرفت كه بعد از عمليات پيش پردازش اين تعداد به 621 پرونده كاهش يافت. براي هر كدام از نمونهها داراي 22 ويژگي در پرونده پزشكي ثبت شده بود كه در نهايت 10 ويژگي تاثيرگذار در ساخت مدل استفاده شد. از سه روش درخت تصميم، بيز ساده و شبكه عصبي مصنوعي بهمنظور تشخيص ابتلا به سرطان پستان و روش 10-fold cross-validation براي ساخت و ارزيابي مدل بر روي مجموعه دادهي جمعآوري شده بهره گرفته شد.
يافتهها: نتايج بهدست آمده از سه تكنيك ذكر شده نشان داد كه هر سه مدل، نتايج اميدبخشي در تشخيص اين سرطان دارند. در نهايت، شبكه عصبي مصنوعي، بالاترين دقت 94/49%(حساسيت 96/19%، ويژگي 86/36%)، در تشخيص ابتلا به سرطان پستان به خود اختصاص داد.
نتيجه گيري: بر طبق نتايج حاصل از درخت تصميم ايجاد شده، ريسك فاكتورهايي چون سن، وزن، سن شروع قاعدگي، يائسگي، مدت زمان مصرف OCP و سن اولين بارداري از جمله عوامل موثر در ابتلاي زنان به سرطان پستان در استان فارس شناخته شدند.
چكيده لاتين :
Background and Aim: Breast cancer is the most common type of cancer and the
main cause of death from cancer in women worldwide. Technologies such as data
mining, have enabled experts in this area to improve decision making in the early
diagnosis of the disease. Therefore, the purpose of this research is to develop an
automatic diagnostic model for Breast cancer by employing data mining methods
and selecting the model with the highest accuracy of diagnosis for Fars province.
Materials and Methods: In this study, 654 available patient records of Motahari
Breast cancer Clinic in Shiraz" were used as the sample. The number of records was
reduced to 621 after the pre-processing operation. These samples had 22 features
that ultimately ten were used as effective features in the design of the model. Three
types of Decision tree, Naive Bayes and Artificial neural network were used for
diagnosis of Breast cancer and 10-fold cross-validation method for constructing
and evaluating the model on the collected data set.
Results: The results of the three techniques mentioned all three models showed
promising results in detecting Breast cancer. Finally, the artificial neural network
accounted for the highest accuracy of 94/49%(sensitivity 96/19%, specificity
86/36%) in the diagnosis of Breast cancer.
Conclusion: Based on the results of the decision tree, the risk factors such as age,
weight, age of menstruation, menopause, duration of OCP usage, and the age of the
first pregnancy were among the factors affecting the incidence of Breast cancer in
women of Fars province.
عنوان نشريه :
پياورد سلامت