عنوان مقاله :
پيش بيني ناحيه تومور سرطان كولور كتال با استفاده از داده كاوي
عنوان به زبان ديگر :
Prediction of Colorectal Cancer Tumor Location Using Data Mining
پديد آورندگان :
خاكشوركامه عليا، محمدمهدي دانشگاه مهندسي فناوريهاي نوين قوچان - دانشكده برق - گروه كنترل , پوربدخشان، كاظم دانشگاه مهندسي فناوريهاي نوين قوچان - دانشكده برق - گروه كنترل , گشايشي، لادن دانشگاه علوم پزشكي مشهد - دانشكده پزشكي - بخش گوارش و كبد
كليدواژه :
سرطان كولوركتال , ناحيه , داده كاوي , درخت تصميم , ماتريس هزينه , پيش بيني
چكيده فارسي :
سرطان كولوركتال يكي از شايع ترين سرطان ها از نظر ابتلا و مرگ و مير در جهان است. تابحال در اين زمينه تحقيقات فراواني مبتني بر بحث هاي آماري و مدلسازي در ايران و جهان صورت گرفته كه نتايج مثبتي نيز در پي داشته است. هدف از اين پژوهش نيز نخست يك بررسي آماري درمورد سرطان كولوركتال در مشهد- ايران و در نهايت پيش بيني ناحيه بروز سرطان با توجه به داده هاي باليني و با استفاده از علم داده كاوي و مدل درخت تصميم است. داده ها شامل 316 بيمار مبتلا به سرطان كولوركتال با 14 ويژگي بوده كه از بيمارستان امام رضا مشهد استخراج شده است. ابزار مورد استفاده اين پژوهش نرم افزار داده كاوي RapidMine است كه با استفاده از آن سعي خواهد شد جزئيات داده هاي مربوطه توسط بررسي هاي آماري استخراج شود و سپس با انجام شبيه سازي هاي اوليه و به كارگيري روش دسته بندي و الگوريتم درخت تصميم بيان دقيق تري از داده ها صورت گرفته و ناحيه بروز سرطان پيش بيني شود. مردان به زنان با تناسب 56 درصد به 44 درصد بود. شباهت هايي با آمار جهاني همچون نسبت ابتلاي مردان به زنان و سابقه فاميلي مشاهده شد. اما تفاوت هايي نيز با آمار جهاني وجود داشت كه ازجمله آنها زياد افراد مبتلا به سرطان ناحيه ديستال اشاره كرد. كارآمدي تكنيك هاي داده كاوي در پيش ًمي توان به جوان تر بودن جمعيت مبتلايان ايران و آمار نسبتا بيني ناحيه بروز سرطان و كاهش هزينه ها نيز اساسي ترين نتيجه پژوهش بود.
چكيده لاتين :
Background: Colorectal cancer is one of the most common cancers in terms of morbidity and mortality worldwide. A lot of research have been done in this field in Iran and worldwide, which have positive results. The aims of this study were firstly doing a statistical study on colorectal cancer in Mashhad, Iran, and finally predicting the colorectal location of cancer based on the clinical data by using data mining science and decision tree model. Materials and Methods: The data of 316 patients with colorectal cancer (including 14 features) were extracted from the archive of Imam Reza Hospital, Mashhad. The instrument used in this research was RapidMiner data mining software that would try to be extract the details of the relevant data by statistical surveys and then would do initial simulations and the use of classification and decision tree method have predicteion the location of cancer. Results: Male to female ratio of 56% to 44%, family history of 37%, more young patients, and relatively more distally located cancers (39%) compared with the proximal (35%), and rectum (26%) were the striking findings of this study. The final and most important stage of research models were presented, which was able to predict the location of the cancerous tumor with 80% accuracy. Conclusion: Similarities with global statistics, such as the ratio of men to women and family history were observed. But there were also differences with global statistics including the Iran’s younger patients and relatively more patients with distal cancers. The efficiency of data mining techniques to predict the location of cancer as well as cost reduction was among the most important results of this study.