كليدواژه :
مالاريا , درخت تصميم , شبكه عصبي , منحني ROC
چكيده فارسي :
مقدمه: مالاريا يك بيماري عفوني است كه سالانه 200 تا 300 ميليون نفر را گرفتار ميسازد. ويژگيهاي محيطي چون بارش، درجه حرارت و رطوبت از جمله عوامل تاثيرگذار بر توزيع جغرافيايي و شيوع اين بيماري هستند. همچنين، شرايط محيطي نيز بر فعاليت و وفور پشه ناقل بيماري مالاريا تاثيرگذار است. پژوهش حاضر با هدف ارائه مدلي براي پيشبيني نوع مالاريا صورت گرفت.
روش كار: پژوهش حاضر به روش توصيفي- مقطعي صورت گرفت. جامعهي پژوهش متشكل از 285 نفر مراجعهكننده به مركز بهداشت سراوان از مرداد 88 تا آذر 95 بود. جهت تحليل دادهها از نرمافزار كلمنتاين 12 (Clementine12.0) استفاده شد. براي مدلسازي از الگوريتمهاي درخت تصميم تقسيم و رگرسيون، آشكارساز تعامل خودكار مجذور كاي، سي پنج و شبكه عصبي استفاده شد.
يافتهها: مقدار صحت بهدست آمده از اجراي الگوريتمهاي درخت تصميم تقسيم و رگرسيون، آشكارساز تعامل خودكار مجذور كاي، سي پنج و شبكه عصبي به ترتيب 0/7217، 0/6698، 0/6840 و 0/6557 بود. مقادير بهدست آمده براي شاخصهاي حساسيت، شفافيت، صحت، دقت و ارزش اخباري منفي و سطح زير منحني مشخصهي عملكرد سيستم براي مدل درخت تصميم تقسيم و رگرسيون نشاندهندهي عملكرد بهتر اين الگوريتم نسبت به ساير الگوريتمها بود. مقادير حساسيت و سطح زير منحني براي مدل درخت تصميم تقسيم و رگرسيون 0/5787 و 0/66 بود.
نتيجهگيري: استفاده از روشهاي نوين دادهكاوي براي تحليل دادههاي مالاريا، نحوهي نگرش مراكز تحقيقات مالاريا را نسبت به شناسايي نوع مالاريا با توجه به گونه حشره تغيير ميدهد. شناسايي سريعتر و دقيقتر نوع مالاريا به تشخيص صحيح روش درمان مناسب كمك نموده، منجر به ارتقاي عملكرد سازمانهاي سلامت ميگردد
چكيده لاتين :
Background: Malaria is an infectious disease infecting 200 - 300 million people annually. Environmental
factors such as precipitation, temperature, and humidity can affect its geographical distribution and prevalence.
The environmental factors are also effective in the abundance and activity of malaria vectors. The present
study aimed at presenting a model to predict the type of malaria.
Methods: This cross-sectional study was conducted using the data of 285 people referring to a health center
in Saravan from June 2009 to December 2016. Clementine 12.0 was used for data analysis. The modeling was
done using classification and regression decision trees, chi-squared automatic interaction detector, C 5.0, and
neural network algorithms.
Results: The accuracy of classification and regression decision trees, chi-squared automatic interaction
detector, C5.0, and neural network was 0.7217, 0.6698, 0.6840, and 0.6557, respectively. Classification and
regression decision trees performed better than the other algorithms in terms of sensitivity, specificity, accuracy,
precision, negative predictive value, and area under the ROC curve. The sensitivity and area under the ROC
curve were 0.5787 and 0.66 for classification and regression decision trees.
Conclusions: Applying data mining methods for the analysis of malaria’s data can change the current
attitude toward malaria type determination. Faster and more precise identification of malaria type helps
determine the proper cure and improve the performance of health organizations.