عنوان مقاله :
طراحي مدل پيشبيني خطر سرطان كولوركتال مبتني بر تكنيك دادهكاوي رگرسيونلجستيك
عنوان به زبان ديگر :
Designing a model for predicting colorectal cancer risk based on regression-logistic data mining technique
پديد آورندگان :
نوپور، رئوف دانشگاه علوم پزشكي ايلام - دانشكده پيراپزشكي - گروه فناوري اطلاعات سلامت، ايران , كاظمي آرپناهي، هادي دانشگاه علوم پزشكي ايلام - دانشكده پيراپزشكي - گروه فناوري اطلاعات سلامت، ايران , شنبه زاده، مصطفي دانشگاه علوم پزشكي ايلام - دانشكده پيراپزشكي - گروه فناوري اطلاعات سلامت، ايران
كليدواژه :
سرطان كولوركتال , دادهكاوي , يادگيري ماشين , رگرسيون لجستيك , ماتريس آشفتگي , ، ماتريس آشفتگي
چكيده فارسي :
هدف: استفاده از يادگيري ماشين جهت تشخيص زودرس سرطان كولوركتال نقش مهمي در بهبود شاخصهاي بيماري دارد؛ هدف مطالعه حاضر طراحي مدل پيشبيني بيماري براساس تكنيكهاي دادهكاوي ميباشد.
روشها: مطالعه حاضر از نوع توصيفي كاربردي بود كه در سال 1399 انجام گرديد. جامعه پژوهش تمام افرادي (800 نفر) بود كه جهت بررسيهاي تشخيصي به بيمارستان طالقاني شهرستان آبادان مراجعه كرده بودند. دادهها از پرونده الكترونيك بيمار طي سالهاي 1388-1398 استخراج شد. از نرمافزار SPSS براي تحليل اطلاعات استفاده گرديد. از روش همبستگي اسپيرمن براي شناسايي فاكتورهاي مؤثر در تعيين خطر ابتلا به سرطان كولوركتال در سطح آماري 0/05≥P-Value استفاده شد. سپس با استفاده از تحليل رگرسيونلجستيك دودويي و روش Enter فاكتورهاي مؤثر در تعيين خطر ابتلا به سرطان كولوركتال شناسايي شدند و نهايتاً مدل رگرسيون پيشبيني خطر ابتلا به سرطان كولوركتال طراحي گرديد.
نتايج: 11 متغير با استفاده از ضريبهمبستگي اسپيرمن همبستگي معناداري را با كلاس خروجي (ابتلا و عدم ابتلا به سرطان كولوركتال) را نشان دادند. نتايج حاصل از تحليل رگرسيونلجستيك با استفاده از Enter 7 متغير شانس بالاتري نسبت به ساير متغيرها به دسست آوردند. نتايج حاصل از طبقهبندي نمونههاي پژوهش با استفاده از روش Forward LR نشان داد كه با اين مدل با داشتن ميزان صحت، دقت و حساسيت به ترتيب 91 درصد، 93/5 درصد و 94/5 درصد عملكرد بالايي داشته است.
نتيجهگيري: مدل پيشبيني خطر مبتني بر روش رگرسيونلجستيك ميتواند در ارتقاء صحت و دقت تشخيص بيماري و پيشبيني موثر گروههاي پرخطر به متخصصين گوارشي كمككننده باشد.
چكيده لاتين :
Aim: Using machine learning for the early detection of this disease has an important role in improving disease indicators. Therefore, this study aims to design a disease prediction model based on data mining techniques to help in early diagnosis and provide evidence-based services.
Methods: This is an applied descriptive studyconducted in 2020. The study population was all patients (800 people) referred to Taleghani Hospital in Abadan for diagnostic tests. The data were derived from the electronic records of during 2009-2010. The Spearman correlation method was used to identify the effective factors in determining the risk of CRC. Then, Binary Logistic Regression (BLR) analysis and Enter method, effective factors in determining the risk of CRC were identified. Finally, the regression prediction model for CRC was developed. SPSS 17 was used to analyze statistical data. P-value ≥ 0.05 was considered significant.
Results: Eleven variables using the Spearman correlation coefficient showed a significant correlation with the output class (with and without colorectal cancer). The results of regression-logistic analysis using Enter 7 variables obtained a higher chance than other variables. The results of classifying the research samples using the Forward LR method showed that with this model, accuracy, precision, and sensitivity (91%, 93.5%, and 94.5%, respectively) had high performance.
Conclusion: Designing a risk prediction model based on logistic regression plays an important role in rapid, accurate, and timely screening of patients in improving the quality of care and increasing the life expectancy of patients. The proposed model in the present study can help gastroenterologist to improve the diagnosis accuracy, precision, and effective prediction of high-risk groups.
عنوان نشريه :
اطلاع رساني پزشكي نوين