بررسي الگوريتم‌هاي رده‌بندي در پيش‌بيني داده‌هاي سلامت: يك مطالعه مروري‏

عنوان فرعي

Assessment of Classification Algorithms in the Prediction of Healthcare Data: Classification Algorithms in the Prediction of Healthcare Data:

پديد آورندگان

حميدي، حجت‌اله نويسنده دانشگاه خواجه نصيرالدين طوسي Hamidi, Hojjatollah , دارايي، عاطفه نويسنده MSc Student, Information Technology, School of Industrial Engineering, Khajeh Nasir Toosi University of Technology, Tehran, Iran ,

اطلاعات موجودي

دو ماهنامه سال 1395 شماره 49

رتبه نشريه

علمي پژوهشي

تعداد صفحه

از صفحه

235

تا صفحه

242

كليدواژه

داده‌‌كاوي , رده‌بندي , بيماري ‌قلبي , شبكه‌ عصبي

چكيده فارسي

داده‌كاوي ابزاري جهت استخراج اطلاعات مفيد از مجموعه‌ داده‌هاي عظيم، از جمله زمينه‌هاي مور‌د‌ علاقه محققان در حوزه سلامت محسوب مي‌شود. رده‌بندي، يك تابع يادگيري مي‌باشد كه هر داده را به يكي از دسته‌هاي از قبل تعريف‌ شده، نگاشت مي‌‌كند. بر اساس گزارش‌هاي سازمان بهداشت جهاني، بيماري‌هاي قلبي، كليوي، ديابت و سرطان‌ها در سال 2012 عامل 68 درصد از مرگ‌ها بوده‌‌اند. پژوهش حاضر، با هدف مطالعه و بررسي انواع الگوريتم‌هاي رده‌بندي و نتايج آن‌ها درون حوزه سلامت در مطالعات پيشين انجام شد. اين مطالعه از نوع مروري- نقلي‌ بود كه در آن، مطالعات مرتبط براي بيماري‌هاي قلبي، سرطان‌ سينه و ديابت از سال 2003 تا 2015 بررسي گرديد. كلمات كليدي «Data mining، Classification، Health، Heart disease، Diabetes و Breast cancer» در پايگاه‌هاي اطلاعاتي ScienceDirect، Elsevier، Springer و IEEE ‌جستجو و منابع هر مقاله و مقالات ‌استناد‌ شده به آن نيز جمع‌آوري شد. پس از حذف مطالعات نامتناسب، 34 مقاله انتخاب گرديد. جمع‌بندي مطالعات نشان داد كه تكرار استفاده از الگوريتم شبكه ‌عصبي، براي هر سه بيماري بيشتر بود. الگوريتم‌هاي شبكه‌ عصبي و بيز‌ ساده براي بيماري‌ قلبي، نزديك‌ترين ‌همسايگان براي سرطان ‌سينه و شبكه‌ عصبي براي ديابت بالاترين دقت را داشت. به طو‌ر كلي مي‌توان دريافت، با وجود اين كه نمي‌توان با قطعيت يك الگوريتم را بهترين الگوريتم براي هر بيماري دانست، اما تعيين بهترين الگوريتم‌ها براي هر بيماري، مي‌تواند براي مطالعات آينده مفيد باشد. واژه هاي كليدي:رده‌بندي؛ داده‌‌كاوي؛ شبكه‌ عصبي؛ بيماري ‌قلبي

چكيده لاتين

Abstract Data mining, as a tool for extracting useful information from large data sets, has been one of the areas of interest to researchers in the field of health. Classification is a learning function by which data is mapped to one of the predefined categories. According to World Health Organization (WHO), heart disease, renal disease, diabetes and cancer have been the cause of 68% of all deaths in 2012. The aim of this research was to study various types of classification algorithms and the results of previous researches in this regard in the field of health. In this narrative review, studies on heart disease, breast cancer, and diabetes, published from 2003 to 2015, were investigated. The keywords of “data mining”, “classification”, “health”, “heart disease”, “diabetes”, and “breast cancer” were searched in ScienceDirect, Elsevier, Springer, and IEEE databases. In addition, references and citations of each retrieved article were collected. After the elimination of unsuitable studies, 34 articles were selected. Literature review showed that frequency of use of neural network algorithm was the highest for all three diseases. Neural network and Naïve Bayes for heart disease, K-nearest neighbors for breast cancer, and neural network for diabetes had the highest accuracy. In general, it can be concluded that although no algorithm can be consider the best algorithm for each disease with certainty, determining the best algorithm for each disease could be useful for future studies. Keywords: Classification; Data Mining; Neural Network; Heart Disease

سال انتشار

1395

عنوان نشريه

مديريت اطلاعات سلامت

عنوان نشريه

مديريت اطلاعات سلامت

اطلاعات موجودي

دوماهنامه با شماره پیاپی 49 سال 1395

كلمات كليدي

#تست#آزمون###امتحان

لينک به اين مدرک

https://search.isc.ac/dl/search/defaultta.aspx?DTC=8&DC=894831