عنوان مقاله :
پيش بيني ابتلا به لنف ادم با تركيب الگوريتم هاي منتخب داده كاوي
عنوان به زبان ديگر :
The prediction of lymphedema via the combination of the selected data mining algorithms
پديد آورندگان :
يعقوبي نوتاش، آنارام دانشگاه آزاد اسلامي واحد رشت - دانشكده مهندسي كامپيوتر و نرم افزار - گروه مهندسي كامپيوتر و نرم افزار , بيات، پيمان دانشگاه آزاد اسلامي واحد رشت - دانشكده مهندسي كامپيوتر و نرم افزار - گروه مهندسي كامپيوتر و نرم افزار , حقيقت، شهپر ﭘﮋوﻫﺸﮑﺪه ﺳﺮﻃﺎن ﻣﻌﺘﻤﺪ ﺗﻬﺮان - ﻣﺮﮐﺰ ﺗﺤﻘﯿﻘﺎت ﺳﺮﻃﺎن ﭘﺴﺘﺎن ﺟﻬﺎد داﻧﺸﮕﺎهي , يعقوبي نوتاش، علي دانشگاه آزاد اسلامي واحد رشت - دانشكده مهندسي كامپيوتر و نرم افزار - گروه مهندسي كامپيوتر و نرم افزار
كليدواژه :
لنف ادم سرطان پستان , كلاس بندي , داده كاوي
چكيده فارسي :
سرطان پستان به عنوان دومين عامل مرگ ناشي از سرطان در زنان است. با توجه به اهميت پيش بيني اين عارضه، استفاده از روش هاي داده كاوي مي تواند كمك بزرگي در جلوگيري از بروز عوارض لنف ادم در بيماران باشد. هدف از اين تحقيق تشخيص ابتلا به لنف ادم مي باشد.
روش بررسي
در مطالعه كاربردي توصيفي-تحليلي به صورت گذشته نگر حاضر، عوامل مرتبط با لنف ادم در1117 بيمار مبتلا به سرطان پستان بررسي و احتمال ابتلا به لنف ادم، با به كارگيري الگوريتم هاي يادگيري ماشين پيش بيني شد. به طوري كه پس از جمع آوري داده اي (فروردين 1388 تا خرداد 1397)، احتمال ابتلا به لنف ادم براي بيمار جديد بررسي و عوامل موثر بر بيماري استخراج شد. بدون احتساب زمان جمع آوري داده هاي آماري، مطالعه از شهريور ماه سال 1398 تا اسفند ماه سال 1399 در مركز توانبخشي سيد خندان ادامه داشت.
يافته ها
نتايج الگوريتم ها، در روش وزن دهي يادگيري جمعي داراي صحت 87% و در روش يادگيري جمعي با استخراج ويژگي ها داراي صحت 90% ارزيابي شد و نهايتا بر اساس ارزيابي نهايي تاثيرگذارترين عوامل خطر لنف ادم استخراج شدند.
نتيجه گيري
يكي از مهم ترين عوارض در سرطان پستان، لنف ادم در اندام هاي فوقاني است، كه مي تواند كيفيت زندگي بيماران را تحت تاثير قراردهد. وجود روشي كه بتواند با دقت بالا به پزشك متخصص پيشنهاد بدهد كه آيا بيمار جديد در آينده، مبتلا به لنف ادم مي شود يا خير و يا با چه احتمالي مبتلا مي شود، ضروري است.
چكيده لاتين :
Breast cancer is the second leading cause of cancer death in women, after lung cancer. Due to the importance of predicting this disease, the use of data mining methods in medical research is more significant than before. Data mining algorithms can be a great help in preventing the development of lymphedema in patients. The aim Of this study was to create a diagnosis system that can predict the probability of lymphedema in breast cancer patients.
Methods
In the present study, the factors of lymphedema in 1117 patients with breast cancer have been collected. The likelihood of developing lymphedema is predicted using ensemble learning via 5 heterogeneous classification algorithms, feature selection and the genetic algorithm (The Two-layer Ensemble Feature Selection method). After collecting the data of patients with breast cancer from 2009 to 2018, and data preprocessing using the optimized ensemble learning algorithm and feature selection, we will examine the likelihood of developing lymphedema for the new patient. Finally, the factors affecting the disease have been extracted. Excluding the time of collecting statistical data, the period of the study was from September 2019 to February 2021. This study is performed at Seyed Khandan Rehabilitation Center, Tehran, Iran.
Results
The results of algorithms showed that the accuracy of the ensemble learning method with selected classification algorithms (SVM with RBF kernel) is 87% and the accuracy of the ensemble learning with feature selection method is 90%. According to the final evaluation of the proposed method, the most effective risk factors for lymphedema have been extracted.
Conclusion
Unfortunately, treatment and diagnosis are not without complications, and one of the most important of these complications in breast cancer is lymphedema in the upper extremities, which can affect the quality of life in patients. It is essential to have a method that can accurately suggest to a specialist whether a new patient will develop lymphedema in the future or how likely it is to develop it, using patient’s own clinical and demographic characteristics.
عنوان نشريه :
مجله دانشكده پزشكي دانشگاه علوم پزشكي تهران