كليدواژه :
بيماري كبد , ماشين بردار پشتيبان , الگوريتم CHAID , درخت تصميمC5.0 , دادهكاوي
چكيده فارسي :
زمينه و هدف: كبد بهعنوان يكي از بزرگترين اندامهاي داخلي بدن، وظيفهي انجام اعمال حياتي مختلفي ازجمله تصفيه و پالايش خون، تنظيم هورمونهاي بدن، ذخيرهي گلوكز و ... را در بدن به عهده دارد. بنابراين اختلال در كاركرد آن مشكلات گاه جبرانناپذيري به دنبال خواهد داشت. لذا پيشبيني بهموقع اين بيماري به درمانهاي اوليه و مؤثر آن كمك ميكند. با توجه به اهميت بيماري كبد و افزايش تعداد مبتلايان، مطالعهي حاضر با هدف پيشبيني بيماري كبد با استفاده از الگوريتمهاي دادهكاوي صورت گرفت.
روش بررسي: اين پژوهش از نوع توصيفي بوده و با استفاده از 721 دادهي جمعآوريشده از بيماران كبدي شهر زاهدان انجامشده است. در اين بررسي پس از پيشپردازش دادهها، تكنيكهاي داده كاوي از قبيل ماشين بردار پشتيبان، CHAID، Exhaustive CHAID و C5.0 تقويتشده در نرمافزار IBM SPSS Modeler 18 بررسي، مقايسه و تحليلشده است.
يافتهها: يافتهها نشان داد كه الگوريتم C5.0 تقويتشده با دقت 94/09 درصد، الگوريتم Exhaustive CHAID با دقت 88/71 درصد، ماشين بردار پشتيبان با دقت 87/09 درصد و الگوريتم CHAID با دقت 85/47 درصد بيماري كبد را پيشبيني كردند. بنابراين بهترين الگوريتم از لحاظ دقت عملكرد، الگوريتم C5.0 تقويتشده شناخته شد.
نتيجهگيري: با توجه به دقت الگوريتم C5.0 تقويتشده و قوانين حاصل از آن، براي يك نمونهي جديد با ويژگيهاي مشخص، ميتوان احتمال ابتلاي فرد به بيماري كبد را با دقت قابل قبولي پيشبيني كرد.
چكيده لاتين :
Background and Aim: The liver, as one of the largest internal organs in the body,
is responsible for many vital functions including purifying and purifying blood,
regulating the body's hormones, preserving glucose, and the body. Therefore,
disruptions in the functioning of these problems will sometimes be irreparable.
Early prediction of these diseases will help their early and effective treatment.
Regarding the importance of liver diseases and increasing number of patients, the
present study, using data mining algorithms, aimed to predict liver disease.
Materials and Methods: This descriptive study was performed using 721 data
from liver patients from Zahedan. In this study, after preprocessing data, data
mining techniques such as SVM: Support Vector Machine, CHAID, Exhaustive
CHAID and boosting C5.0, data were analyzed using IBM SPSS Modeler 18 data
mining software.
Result: According to the findings, the liver diseases can be predicted by the
enhanced C5.0 algorithm with precision of 94/09, exhaustive CHAID algorithm
with precision of 88/71, SVM with the precision of 87/09, and CHAID algorithm
with the precision of 85/47. The enhanced C5.0 algorithm showed the best
performance among other algorithms.
Conclusion: According to the rules created by boosting C5.0 algorithm, for a new
sample, one can predict the likelihood of a person for developing liver disease with
high precision.