عنوان مقاله :
پيشبيني امتياز اعتباري اشخاص با استفاده از الگوريتمهاي دادهكاوي (مورد مطالعه: مشتريان يك بانك دولتي ايران)
عنوان به زبان ديگر :
Personal Credit Score Prediction using Data Mining Algorithms (Case Study: Bank Customers)
پديد آورندگان :
كاظمي، عاليه دانشگاه تهران - دانشكدٔه مديريت - گروه مديريت صنعت، ايران , ابدالي، علي دانشگاه علوم انتظامي امين، تهران , عظيم زاده طهراني، كيميا دانشگاه تهران - دانشكدٔه مديريت - گروه مديريت صنعت، ايران , آريايي، سارا دانشگاه تهران - دانشكدٔه مديريت - گروه مديريت صنعت، ايران
كليدواژه :
امتياز اعتباري , جنگل تصادفي , دادهكاوي , روششناسي CRISP-DM , نزديكترين همسايگي , درخت تصميم
چكيده فارسي :
امتياز اعتباري مشتريان يكي از ابزارهاي مهم براي مديريت ريسك در سيستمهاي بانكي است. طراحي سيستمي كه بتواند شناسايي مشتريان بانكي را بهدرستي انجام دهد، از چالشهاي اساسي در دادهكاوي و يادگيري ماشين بوده كه مطالعات بسياري در مورد آن انجام شده است. در اين مطالعه، عوامل مرتبط با امتياز اعتباري معرفي، و پيشبيني امتياز اعتباري براي مشتريان يك بانك دولتي ايران انجام شده است. بدينمنظور، روششناسي CRISP-DM بهعنوان مدل مرجعي براي فرايند دادهكاوي مورد استفاده قرار گرفته و مدلسازي دادهها با بهرهگيري از الگوريتمهاي مختلف (نزديكترين همسايگي، درخت تصميم، و جنگل تصادفي) انجام شده است. نتايج ارزيابي و مقايسهٔ حساسيت و دقت الگوريتمها نشان داد الگوريتم نزديكترين همسايگي با دقت 90.3 درصد براي مجموعهٔ آموزش و 76.7 درصد براي دادههاي آزمون، عملكرد مناسبي براي پيشبيني امتياز اعتباري دارد.
چكيده لاتين :
Knowledge and information extraction from data is an age-old concept in scientific studies. In industrial decision-making processes, the application of this concept gives rise to data-mining opportunities. Personal credit scoring is an ever-vital tool for banking systems in order to manage and minimize the inherent risks of the financial sector, thus, the design and improvement of credit scoring systems based on the data-driven and machine learning techniques have garnered newfound research interest on the subject in recent years. In the present study, important variables and parameters for credit score are identified and consequently, prediction of credit score for clients of a bank is performed. CRISP-DM is employed as the reference model for the data mining process and data modelling is accomplished based on a variety of algorithms (K-nearest-neighbors, Decision tree and Random forest). Comparative results of accuracy and sensitivity of algorithms demonstrated that the k-nearest neighbour algorithm by the accuracy of 90.3% for the training set and 76.7% for test data performs suitably to predict credit score.
عنوان نشريه :
پژوهش هاي پولي-بانكي