عنوان مقاله :
طراحي سيستم هوشمند براي تشخيص بيماري ديابت با استفاده از رويكرد دادهكاوي: گزارش كوتاه
عنوان به زبان ديگر :
Designing an intelligent system for diagnosing type 2 diabetes using the data mining approach: brief report
پديد آورندگان :
كلهر، روحاله دانشگاه علوم پزشكي قزوين - مركز تحقيقات عوامل اجتماعي موثر برسلامت , مرتضيقلي، اصغر دانشگاه آزاد اسلامي قزوين - دانشكده برق - گروه هوش مصنوعي، رايانه و فناوري اطلاعات , ناجي، فاطمه دانشگاه علوم پزشكي قزوين - گروه اپيدميولوژي , شهسواري، سعيد دانشگاه علوم پزشكي قزوين - مركز تحقيقات ايمني محصولات بهداشتي , كيايي، محمد زكريا دانشگاه علوم پزشكي قزوين - دانشكده بهداشت - گروه مديريت خدمات بهداشتي و درماني
كليدواژه :
هوش مصنوعي , دادهكاوي , ديابت مليتوس نوع دو , تشخيص زودهنگام , يادگيري ماشيني , عوامل خطر
چكيده فارسي :
زمينه و هدف: بيماري ديابت عوارض متعددي دارد، تشخيص دير هنگام ديابت در افراد منجر به گسترش عوارض بيماري ميشود. مطالعه حاضر با هدف بررسي امكان پيشبيني ديابت با استفاده از فنون دادهكاوي انجام شد.
روش بررسي: اين پژوهش از نوع توصيفي- تحليلي بود كه بهصورت مقطعي انجام شد. جامعه پژوهش شامل افراد مراجعهكننده به مراكز بهداشتي شهرستان محمديه در استان قزوين جهت انجام غربالگري ديابت بودند. دادههاي مورد مطالعه مربوط به فروردين تا خرداد 1394 بود. دادهها در نهايت با استفاده از سه روش نزديكترين همسايگي (k-nearest neighbors algorithm, k-NN)، درخت تصميمگيري (Decision tree, DT) و ماشينهاي بردار پشتيبان (Support vector machine, SVM) تحليل و مورد مقايسه قرار گرفتند. جهت تحليل دادهها از MATLAB® software, version 8.2 (Mathworks Inc., Natick, MA, USA) استفاده شد.
يافتهها: در تمامي معيارها، بهترين نتايج توسط درخت تصميمگيري با صحت (0/96) بهدست آمد. پس از آن روشهاي نزديكترين همسايگي با صحت (0/96) و ماشينهاي بردار پشتيبان با صحت (0/94) قرار داشتند.
نتيجهگيري: براساس نتايج ارايه شده، درخت تصميمگيري بهترين نتايج را در كلاسبندي نمونههاي تست نشان داد. اين مدل ميتواند بهعنوان مدلي مناسب در پيشبيني ديابت با استفاده از دادههاي ريسك فاكتور توصيه شود.
چكيده لاتين :
Background: Diabetes mellitus has several complications. The Late diagnosis of
diabetes in people leads to the spread of complications. Therefore, this study has been
done to determine the possibility of predicting diabetes type 2 by using data mining
techniques.
Methods: This is a descriptive-analytic study that was conducted as a cross-sectional
study. The study population included people referring to health centers in
Mohammadieh City in Qazvin Province, Iran, from April to June 2015 for screening for
diabetes. The 5-step CRISP method was used to implement this study. Data were
collected from March 2015 to June 2015. In this study, 1055 persons with complete
information were included in the study. Of these, 159 were healthy and 896 were
diabetic. A total of 11 characteristics and risk factors were examined, including the age,
sex, systolic and diastolic blood pressure, family history of diabetes, BMI, height,
weight, waistline, hip circumference and diagnosis. The results obtained by support
vector machine (SVM), decision tree (DT) and the k-nearest neighbors algorithm (k-
NN) were compared with each other. Data was analyzed using MATLAB® software,
version 3.2 (Mathworks Inc., Natick, MA, USA).
Results: Data analysis showed that in all criteria, the best results were obtained by
decision tree with accuracy (0.96) and precision (0.89). The k-NN methods were
followed by accuracy (0.96) and precision (0.83) and support vector machine with
accuracy (0.94) and precision (0.85). Also, in this study, decision tree model obtained
the highest degree of class accuracy for both diabetes classes and healthy in the analysis
of confusion matrix.
Conclusion: Based on the results, the decision tree represents the best results in the
class of test samples which can be recommended as a model for predicting diabetes
type 2 using risk factor data.
عنوان نشريه :
مجله دانشكده پزشكي دانشگاه علوم پزشكي تهران