عنوان مقاله :
بررسي الگوريتمهاي ردهبندي در پيشبيني دادههاي سلامت: يك مطالعه مروري
عنوان فرعي :
Assessment of Classification Algorithms in the Prediction of Healthcare Data: Classification Algorithms in the Prediction of Healthcare Data:
پديد آورندگان :
حميدي، حجتاله نويسنده دانشگاه خواجه نصيرالدين طوسي Hamidi, Hojjatollah , دارايي، عاطفه نويسنده MSc Student, Information Technology, School of Industrial Engineering, Khajeh Nasir Toosi University of Technology, Tehran, Iran ,
اطلاعات موجودي :
دو ماهنامه سال 1395 شماره 49
كليدواژه :
دادهكاوي , ردهبندي , بيماري قلبي , شبكه عصبي
چكيده فارسي :
دادهكاوي ابزاري جهت استخراج اطلاعات مفيد از مجموعه دادههاي عظيم، از جمله زمينههاي مورد علاقه محققان در حوزه سلامت محسوب ميشود. ردهبندي، يك تابع يادگيري ميباشد كه هر داده را به يكي از دستههاي از قبل تعريف شده، نگاشت ميكند. بر اساس گزارشهاي سازمان بهداشت جهاني، بيماريهاي قلبي، كليوي، ديابت و سرطانها در سال 2012 عامل 68 درصد از مرگها بودهاند. پژوهش حاضر، با هدف مطالعه و بررسي انواع الگوريتمهاي ردهبندي و نتايج آنها درون حوزه سلامت در مطالعات پيشين انجام شد. اين مطالعه از نوع مروري- نقلي بود كه در آن، مطالعات مرتبط براي بيماريهاي قلبي، سرطان سينه و ديابت از سال 2003 تا 2015 بررسي گرديد. كلمات كليدي «Data mining، Classification، Health، Heart disease، Diabetes و Breast cancer» در پايگاههاي اطلاعاتي ScienceDirect، Elsevier، Springer و IEEE جستجو و منابع هر مقاله و مقالات استناد شده به آن نيز جمعآوري شد. پس از حذف مطالعات نامتناسب، 34 مقاله انتخاب گرديد. جمعبندي مطالعات نشان داد كه تكرار استفاده از الگوريتم شبكه عصبي، براي هر سه بيماري بيشتر بود. الگوريتمهاي شبكه عصبي و بيز ساده براي بيماري قلبي، نزديكترين همسايگان براي سرطان سينه و شبكه عصبي براي ديابت بالاترين دقت را داشت. به طور كلي ميتوان دريافت، با وجود اين كه نميتوان با قطعيت يك الگوريتم را بهترين الگوريتم براي هر بيماري دانست، اما تعيين بهترين الگوريتمها براي هر بيماري، ميتواند براي مطالعات آينده مفيد باشد.
واژه هاي كليدي:ردهبندي؛ دادهكاوي؛ شبكه عصبي؛ بيماري قلبي
چكيده لاتين :
Abstract
Data mining, as a tool for extracting useful information from large data sets, has been one of the areas of interest to researchers in
the field of health. Classification is a learning function by which data is mapped to one of the predefined categories. According to
World Health Organization (WHO), heart disease, renal disease, diabetes and cancer have been the cause of 68% of all deaths in
2012. The aim of this research was to study various types of classification algorithms and the results of previous researches in this
regard in the field of health. In this narrative review, studies on heart disease, breast cancer, and diabetes, published from 2003 to
2015, were investigated. The keywords of “data mining”, “classification”, “health”, “heart disease”, “diabetes”, and “breast
cancer” were searched in ScienceDirect, Elsevier, Springer, and IEEE databases. In addition, references and citations of each
retrieved article were collected. After the elimination of unsuitable studies, 34 articles were selected. Literature review showed
that frequency of use of neural network algorithm was the highest for all three diseases. Neural network and Naïve Bayes for heart
disease, K-nearest neighbors for breast cancer, and neural network for diabetes had the highest accuracy. In general, it can be
concluded that although no algorithm can be consider the best algorithm for each disease with certainty, determining the best
algorithm for each disease could be useful for future studies.
Keywords: Classification; Data Mining; Neural Network; Heart Disease
عنوان نشريه :
مديريت اطلاعات سلامت
عنوان نشريه :
مديريت اطلاعات سلامت
اطلاعات موجودي :
دوماهنامه با شماره پیاپی 49 سال 1395
كلمات كليدي :
#تست#آزمون###امتحان