شماره ركورد :
744339
عنوان مقاله :
مروري بر 7 الگوريتم برتر داده كاوي در پيش بيني بقا، تشخيص و عود بيماران مبتلا به سرطان پستان
عنوان فرعي :
Review top 7 Algorithms in Data Mining for Prediction Survivability, Diagnosis and Recurrence of Breast Cancer
پديد آورندگان :
قاسم احمد، ليلا نويسنده كارشناس ارشد مديريت فناوري اطلاعات، دانشگاه آزاد اسلامي، واحد علوم و تحقيقات تهران Ghasem Ahmad, Leila
اطلاعات موجودي :
فصلنامه سال 1392 شماره 20
رتبه نشريه :
علمي پژوهشي
تعداد صفحه :
10
از صفحه :
52
تا صفحه :
61
كليدواژه :
شبكه هاي بيزي , شبكه هاي عصبي مصنوعي , بردار پشتيبان ماشين , سرطان پستان , breast cancer , Artificial neural networks , Data mining Algorithms , logistic regression , Naive Bayes , Prediction , Support vector machine , الگوريتم هاي داده كاوي , پيش بيني , درختان تصميم گيري , رگرسيون لجستيك , decision trees
چكيده فارسي :
چكيده مقدمه: پيش بيني تشخيص، بقا و عود بيماران مبتلا به سرطان پستان، همواره از چالش هاي مهم براي محققين و پزشكان بوده است. امروزه به مدد علوم بيوانفورماتيك، امكان رفع اين چالش ها با بهره گيري از اطلاعات قبلي ثبت شده از بيماران تا حدود زيادي محقق گرديده است. با تكنولوژي هاي كم هزينه سخت افزاري و نرم افزاري، داده ها با كيفيت بهتر و در حجم هاي بالاتر به صورت خودكار ذخيره مي گردند و به كمك تجزيه و تحليل بهتر آنها، اين حجم عظيم از داده ها به صورتي كارآمد و موثرتر پردازش مي-شوند. هدف اصلي اين مقاله معرفي تعدادي از الگوريتم هاي پركاربرد و شناخته شده داده كاوي در سرطان پستان است. روش بررسي: الگوريتم هاي داده كاوي، مدل هاي بهينه اي هستند كه در پيش بيني تشخيص، بقا و عود سرطان پستان به كار رفته و دقت قابل توجهي از خود نشان داده اند. نتايج حاصل از اين الگوريتم ها، نه تنها به پزشكان در تصميم گيري بهتر كمك مي كند بلكه باعث آشكار شدن برخي از الگوهاي پنهان و ناشناخته مي شود كه شايد توجه خاصي به آنها معطوف نبوده است. اين الگوريتم ها شامل: شبكه هاي عصبي مصنوعي (Artificial Neural Networks/ANNs)، درختان تصميم گيري(Decision Trees) ، شبكه-هاي بيزي(Bayes Nets) ، بيزي ساده(Naive Bayes) ، رگرسيون لجستيك(Logistic Regression) ، بردار پشتيبان ماشين (Support Vector Machine) و روش هاي تركيبي درختان تصميم و شبكه هاي بيزي(Decision Tree with Naive Bayes) هستند. از اين الگوريتم ها، براي دسته بندي، خوشه بندي، يادگيري آماري كه مهم ترين روش هاي داده كاوي هستند، استفاده مي شود. يافته ها: در اين مقاله، 7 الگوريتم برتر داده كاوي در پيش بيني بقا، تشخيص و عود بيماران مبتلا به سرطان پستان معرفي مي گردند و با معرفي هر الگوريتم، پيشينه اي از تحقيقات صورت گرفته در سرطان پستان به كمك الگوريتم مورد نظر، نتايج حاصل از آن و همچنين تحقيقات فعلي در حال انجام در اين خصوص ارايه مي شود. درختان تصميم و ماشين بردار پشتيبان، در تحقيقات مختلف انجام شده، معمولا نتايج بهتر و دقيق تري در زمينه دقت، حساسيت و ويژگي ارايه كرده اند. نتيجه گيري: موفقيت اين الگوريتم ها، به فاكتورهاي متعددي چون وجود متغيرهاي مورد نياز، بزرگتر بودن پايگاه داده، كم بودن تعداد داده هاي مفقوده و دسترسي به داده هاي صحيح و درست بستگي دارد. واژه هاي كليدي: سرطان پستان، الگوريتم هاي داده كاوي، پيش بيني، شبكه هاي عصبي مصنوعي، درختان تصميم گيري، شبكه هاي بيزي، رگرسيون لجستيك، بردار پشتيبان ماشين.
چكيده لاتين :
Background: The prediction of breast cancer Diagnosis, survivability and Recurrence has been a challenging research problem for many researchers. Thanks to new technologies, better explanatory prognostic factors are being measured and recorded; thanks to low cost computer hardware and software technologies, high volume better quality data is being collected and stored automatically; and finally thanks to better analytical methods, those voluminous data is being processed effectively and efficiently. Materials and Methods: The main objective of this manuscript is introducing some popular and well known data mining algorithms in breast cancer researches. The medical predictive models are designed to aid physicians to overcome health problems, routine classification tasks which should otherwise be referred to the specialist in a particular area of medicine by extracting hidden patterns. We present the top seven common data mining algorithms (Artificial Neural Networks/ANNs. Decision Trees، Bayes Nets, Naive Bayes, Support Vector Machine, Decision Tree with Naive Bayes) besides the most widely used statistical method (Logistic Regression model). Results: These top 7 algorithms are among the most influential data mining algorithms in the research community. With each algorithm, we provide a description of the algorithm, discuss the impact of the algorithm, and review current and further research on the algorithm. Decision Trees and Support Vector Machine are optimal models to prediction, survivability and recurrence of breast cancer and trend to show high accuracy. Conclusion: These algorithms cover classification, clustering, statistical learning, association analysis, and link mining, which are all among the most important topics in data mining research and development. Critical success factors in data mining projects are including: accessing enough data, mining in data and reliable variables, build multiple targeted models, less missing data and other key factors depending specific data mining algorithms. Keywords: Breast Cancer, Data mining Algorithms, Prediction, Artificial Neural Networks, Decision Trees, Naive Bayes, Logistic Regression, Support Vector Machine.
سال انتشار :
1392
عنوان نشريه :
بيماري هاي پستان ايران
عنوان نشريه :
بيماري هاي پستان ايران
اطلاعات موجودي :
فصلنامه با شماره پیاپی 20 سال 1392
كلمات كليدي :
#تست#آزمون###امتحان
لينک به اين مدرک :
بازگشت