شماره ركورد :
1218636
عنوان مقاله :
جايگذاري مقادير گمشده در مجموعه داده‌هاي ديابت و سرطان سينه با استفاده از شبكه عصبي پرسپترون دو لايه
پديد آورندگان :
پورجاني ، الهام دانشگاه آزاد اسلامي واحد علوم و تحقيقات تهران - دانشكده مكانيك، برق و كامپيوتر - گروه مهندسي كامپيوتر , نجف‌زاده ، سارا دانشگاه آزاد اسلامي واحد يادگار امام (ره) شهرري - دانشكده مهندسي برق - گروه كامپيوتر , جعفرنيا دابانلو ، نادر دانشگاه آزاد اسلامي واحد علوم و تحقيقات تهران - دانشكده مكانيك، برق و كامپيوتر - گروه مهندسي برق
از صفحه :
1
تا صفحه :
6
كليدواژه :
داده‌كاوي , مدل‌هاي شبكه عصبي , ماشين بردار پشتيبان
چكيده فارسي :
مقدمه: جايگذاري مقادير گمشده در مجموعه داده‌هاي اطلاعاتي پزشكي، يكي از چالش‌هاي مهم در مسايل داده‌كاوي به شمار مي‌رود. بنابراين، پژوهش حاضر با هدف جايگذاري مقادير گمشده برخي از ويژگي‌هاي مجموعه داده‌هاي ديابت و سرطان سينه انجام شد. روش بررسي: در اين مطالعه توصيفي، از مجموعه داده سرطان سينه شامل 699 نمونه كه 458 نمونه خوش‌خيم و 241 نمونه بدخيم و مجموعه داده ديابت شامل 768 نمونه كه 500 نمونه فاقد بيماري ديابت و 268 نمونه ديگر داراي بيماري ديابت بودند، استفاده گرديد. براي جايگذاري مقادير گمشده در اين دو مجموعه داده، مدلي بر پايه شبكه عصبي پرسپترون دو لايه طراحي شد. به منظور ارزيابي، ماشين بردار پشتيبان SVM (Support Vector Machine) و آزمون t مورد استفاده قرار گرفت. يافته‌ها: ميزان ميانگين مربعات خطا MSE (Mean Squared Error) به دست آمده در مدل شبكه عصبي پرسپترون دو لايه در مجموعه داده ديابت، حدود 03/0 و در مجموعه داده سرطان سينه، حدود 04/0 كمتر از MSE‌هاي به دست آمده در روش جايگذاري با مقدار ميانگين گزارش گرديد. مقادير جايگذاري شده با استفاده از مدل نسبت به مقادير جايگذاري شده با مقدار ميانگين، به مقدار واقعي نزديك‌تر بود. صحت و حساسيت طبقه‌بندي بيماري در حالتي كه مقادير گمشده توسط شبكه عصبي پرسپترون جايگذاري شده بود، در مقايسه با دو روش مرسوم مقدار ميانگين و روش حذف مقادير گمشده در مجموعه داده ديابت به ترتيب در حدود 2، 4، 2 و 4 درصد و در مجموعه داده سرطان سينه به ترتيب در حدود 1، 3، 2، 5 درصد بيشتر شد. تفاوت معني‌داري بين دو روش جايگذاري مقادير گمشده با مقدار ميانگين و جايگذاري مدل وجود داشت. نتيجه‌گيري: جايگذاري مقاير گمشده در مجموعه داده‌هاي پزشكي توسط شبكه عصبي پرسپترون دو لايه نسبت به دو روش جايگذاري با مقدار ميانگين و روش حذف مقادير گمشده، نتايج بهتري در طبقه‌بندي بيماري نشان مي‌دهد.
عنوان نشريه :
مديريت اطلاعات سلامت
عنوان نشريه :
مديريت اطلاعات سلامت
لينک به اين مدرک :
بازگشت