عنوان مقاله :
مقايسه روشهاي مختلف يادگيري ماشين در تشخيص پرفشاري خون در بيماران ديابتي با و بدون در نظر گرفتن هزينهها
عنوان فرعي :
Comparison of Various Machine Learning Methods in Diagnosis of Hypertension in Diabetics with/without Consideration of Costs
پديد آورندگان :
تیموری، مهدی نويسنده Assistant Professor, Department of Network Science and Technology, Faculty of New Sciences and Technologies, University of Tehran, Tehran, Iran Teimouri, M , ابراهیمی، الهام نويسنده MSc student in Medical Information Technology, Department of Network Science and Technology, Faculty of New Sciences and Technologies, University of Tehran, Tehran, Iran Ebrahimi, E , علوی نیا، سید محمد نويسنده Assistant Professor, Vector-borne Diseases Research Center, North Khorasan University of Medical Sciences, Bojnurd, Iran Alavinia, SM
اطلاعات موجودي :
فصلنامه سال 1394 شماره 0
كليدواژه :
diabetes , hypertension , Machine Learning , ديابت , فشار خون , يادگيري ماشين , Classification , روشهاي حساس به هزينه , Cost sensitive models , دستهبندي
چكيده فارسي :
مقدمه و اهداف: بیماران دیابتی همواره در معرض ابتلا به پرفشاری خون هستند. هدف از این تحقیق طراحی یك مدل پیشبینی پرفشاری خون در میان افراد مبتلا به دیابت، مبتنی بر هزینه و با در نظر گرفتن توزیع این بیماری در جامعه بود، كه تا حد ممكن عملكرد مناسبی داشته باشد.
روش كار: در این پژوهش تلاش شد تا با استفاده از روشهای مختلف یادگیری ماشین، یك مدل پیشبینی مبتنی بر هزینه طراحی شود كه تا حد ممكن بهترین عملكرد در پیشبینی افراد دیابتی در معرض خطر پرفشاری خون را داشته باشد. از میان الگوریتمهای دادهكاوی، از الگوریتمهای درخت تصمیم، ماشین بردار پشتیبانی، شبكه عصبی و نیز رگرسیون لجستیك استفاده شد. برای انجام این پژوهش از دادههای مربوط به غربالگری بیماران دیابتی برای تشخیص پرفشاری خون در استان آذربایجان شرقی استفاده شد.
یافتهها: افزایش فشار خون سیستول به میزان 130 میلیمتر جیوه، فرد دیابتی را بیشتر در معرض پرفشاری خون قرار میدهد. با رویكرد غیر هزینهمحور، به شاخص یودن حدود 68 درصد رسیدیم. زمانی كه رویكرد هزینه محور به كار بسته میشود، بیشترین شاخص یودن (11/47 درصد) مربوط به شبكه عصبی است، هر چند هدف در اینجا حداقلسازی هزینه است كه در راستای این هدف، درخت تصمیم و رگرسیون لجستیك بهترین عملكرد را دارند.
نتیجه گیری: در مسائل پیشبینی بیماریها در جوامع، حساس به هزینه كردن روشها و در نظر گرفتن توزیع واقعی بیماری در جامعه اهمیت بیشتری دارد تا اینكه تنها هدف، كمینه كردن تعداد خطاهای دستهبندی روی مجموعه دادهی موجود باشد.
چكيده لاتين :
Background and Objectives: Diabetic patients are always at risk of hypertension. In this paper, the main goal was to design a native cost sensitive model for the diagnosis of hypertension among diabetics considering the prior probabilities.
Methods: In this paper, we tried to design a cost sensitive model for the diagnosis of hypertension in diabetic patients, considering the distribution of the disease in the general population. Among the data mining algorithms, Decision Tree, Artificial Neural Network, K-Nearest Neighbors, Support Vector Machine, and Logistic Regression were used. The data set belonged to Azarbayjan-e-Sharqi, Iran.
Results: For people with diabetes, a systolic blood pressure more than 130 mm Hg increased the risk of hypertension. In the non-cost-sensitive scenario, Youdenʹs index was around 68%. On the other hand, in the cost-sensitive scenario, the highest Youdenʹs index (47.11%) was for Neural Network. However, in the cost-sensitive scenario, the value of the imposed cost was important, and Decision Tree and Logistic Regression show better performances.
Conclusion: When diagnosing a disease, the cost of miss-classifications and also prior probabilities are the most important factors rather than only minimizing the error of classification on the data set.
عنوان نشريه :
اپيدميولوژي ايران
عنوان نشريه :
اپيدميولوژي ايران
اطلاعات موجودي :
فصلنامه با شماره پیاپی 0 سال 1394
كلمات كليدي :
#تست#آزمون###امتحان