عنوان مقاله :
مقايسه دقت پيشبيني رگرسيون لجستيك و درخت ردهبندي در تعيين عوامل خطر و پيشبيني ابتلا به سرطان پستان
عنوان فرعي :
Comparison of the Logistic Regression and Classification Tree Models in Determining the Risk Factors and Prediction of Breast Cancer
پديد آورندگان :
زایری، فرید نويسنده Associate Professor, Department of Biostatistics, Shahid Beheshti University of Medical Sciences, Tehran, Iran Zayeri, F , سید آقا، سید حسین نويسنده Faculty of Paramedical Sciences, Shahid Beheshti University of Medical Sciences, Students’ Research Committee, Tehran, Iran Seyedagha, SH , آقا مولایی، هاله نويسنده Faculty of Paramedical Sciences, Shahid Beheshti University of Medical Sciences, Tehran, Iran Aghamolaie, H , برومند، فرزانه نويسنده دانشگاه علوم پزشكي اروميه , , ياوري، پروين نويسنده گروه بهداشت و پزشكي اجتماعي-دانشگاه علوم پزشكي شهيد بهشتي-مركز تحقيقات علوم رفتاري Yavari, P
اطلاعات موجودي :
فصلنامه سال 1395 شماره 0
كليدواژه :
classification tree , logistic regression , breast cancer , risk factors , سرطان پستان , عوامل خطر , درخت ردهبندي , رگرسيون لجستيك
چكيده فارسي :
مقدمه و اهداف: سرطان پستان یكی از رایجترین بدخیمیهای زنان است كه بعد از سرطان ریه بیشترین میزان مرگ را به خود اختصاص داده است. هدف این مطالعه، مقایسه دو مدل رگرسیون لجستیك و درخت ردهبندی در تعیین عوامل مؤثر و پیشبینی ابتلا به سرطان پستان است.
روش كار: دادههای مورداستفاده برگرفته از یك مطالعه مورد- شاهدی است كه بر پایه اطلاعات بیمارستانی از 303 بیمار مبتلابه سرطان پستان بهعنوان مورد و همین تعداد افراد غیرمبتلا به این سرطان بهعنوان شاهد بهدستآمده است. ابتدا 16 متغیر بهعنوان عوامل خطر بالقوه در دو مدل درخت ردهبندی و رگرسیون لجستیك وارد و نتایج حاصل با استفاده از سطح زیر منحنی مشخصه عملكرد (ROC) و مقدار حساسیت و ویژگی مقایسه شدند.
نتایج: از 16 متغیر موردبررسی، پنج متغیر در مدل درخت ردهبندی و پنج متغیر در مدل رگرسیون لجستیك معنیدار شدند. پیشبینی بر اساس این متغیرها منجر به حساسیت، ویژگی و سطح زیر منحنی ROC 71 درصد، 69 درصد و 7/74 درصد برای درخت ردهبندی و3/63 درصد، 8/68 درصد و 1/71 درصد بهترتیب برای رگرسیون لجستیك گردید.
نتیجهگیری: با توجه به معیارهای بهدستآمده، مدل درخت ردهبندی از توانایی بالاتری نسبت به رگرسیون لجستیك در تفكیك بیماران از افراد سالم برخوردار بود. نتایج بهدستآمده از مطالعه حاضر نشان داد كه سه متغیر وضعیت یائسگی، تعداد افراد مبتلا به سرطان پستان در خانواده و سن مادر هنگام اولین تولد زنده در هر دو مدل رگرسیون لجستیك و درخت ردهبندی بهطور مشترك معنیدار بودهاند.
چكيده لاتين :
Background and Objectives: Breast cancer is one of the most common malignancies in women which accounts for the highest number of deaths after lung cancer. The aim of the current study was to compare the logistic regression and classification tree models in determining the risk factors and prediction of breast cancer.
Methods: We used from the data of a case-control study conducted on 303 patients with breast cancer and 303 controls. In the first step, we included 16 potential risk factors of breast cancer in both the logistic regression and classification tree models. Then, the area under the ROC curve (AUC), sensitivity, and specificity indexes were used for comparing these models.
Results: From 16 variables included in the models, 5 variables were statistically significant in both models. Sensitivity, specificity, and AUC was 71%, 69%, and 74.7% for the logistic regression and 63.3%, 68.8%, and 71.1% for the classification tree, respectively.
Conclusion: The obtained results suggest that the classification tree has more power for separating patients from healthy people. Menopausal status, number of breast cancer cases in the family, and maternal age at the first live birth were significant indicators in both models.
عنوان نشريه :
اپيدميولوژي ايران
عنوان نشريه :
اپيدميولوژي ايران
اطلاعات موجودي :
فصلنامه با شماره پیاپی 0 سال 1395
كلمات كليدي :
#تست#آزمون###امتحان