عنوان مقاله :
جايگذاري مقادير گمشده در مجموعه دادههاي ديابت و سرطان سينه با استفاده از شبكه عصبي پرسپترون دو لايه
پديد آورندگان :
پورجاني ، الهام دانشگاه آزاد اسلامي واحد علوم و تحقيقات تهران - دانشكده مكانيك، برق و كامپيوتر - گروه مهندسي كامپيوتر , نجفزاده ، سارا دانشگاه آزاد اسلامي واحد يادگار امام (ره) شهرري - دانشكده مهندسي برق - گروه كامپيوتر , جعفرنيا دابانلو ، نادر دانشگاه آزاد اسلامي واحد علوم و تحقيقات تهران - دانشكده مكانيك، برق و كامپيوتر - گروه مهندسي برق
كليدواژه :
دادهكاوي , مدلهاي شبكه عصبي , ماشين بردار پشتيبان
چكيده فارسي :
مقدمه: جايگذاري مقادير گمشده در مجموعه دادههاي اطلاعاتي پزشكي، يكي از چالشهاي مهم در مسايل دادهكاوي به شمار ميرود. بنابراين، پژوهش حاضر با هدف جايگذاري مقادير گمشده برخي از ويژگيهاي مجموعه دادههاي ديابت و سرطان سينه انجام شد. روش بررسي: در اين مطالعه توصيفي، از مجموعه داده سرطان سينه شامل 699 نمونه كه 458 نمونه خوشخيم و 241 نمونه بدخيم و مجموعه داده ديابت شامل 768 نمونه كه 500 نمونه فاقد بيماري ديابت و 268 نمونه ديگر داراي بيماري ديابت بودند، استفاده گرديد. براي جايگذاري مقادير گمشده در اين دو مجموعه داده، مدلي بر پايه شبكه عصبي پرسپترون دو لايه طراحي شد. به منظور ارزيابي، ماشين بردار پشتيبان SVM (Support Vector Machine) و آزمون t مورد استفاده قرار گرفت. يافتهها: ميزان ميانگين مربعات خطا MSE (Mean Squared Error) به دست آمده در مدل شبكه عصبي پرسپترون دو لايه در مجموعه داده ديابت، حدود 03/0 و در مجموعه داده سرطان سينه، حدود 04/0 كمتر از MSEهاي به دست آمده در روش جايگذاري با مقدار ميانگين گزارش گرديد. مقادير جايگذاري شده با استفاده از مدل نسبت به مقادير جايگذاري شده با مقدار ميانگين، به مقدار واقعي نزديكتر بود. صحت و حساسيت طبقهبندي بيماري در حالتي كه مقادير گمشده توسط شبكه عصبي پرسپترون جايگذاري شده بود، در مقايسه با دو روش مرسوم مقدار ميانگين و روش حذف مقادير گمشده در مجموعه داده ديابت به ترتيب در حدود 2، 4، 2 و 4 درصد و در مجموعه داده سرطان سينه به ترتيب در حدود 1، 3، 2، 5 درصد بيشتر شد. تفاوت معنيداري بين دو روش جايگذاري مقادير گمشده با مقدار ميانگين و جايگذاري مدل وجود داشت. نتيجهگيري: جايگذاري مقاير گمشده در مجموعه دادههاي پزشكي توسط شبكه عصبي پرسپترون دو لايه نسبت به دو روش جايگذاري با مقدار ميانگين و روش حذف مقادير گمشده، نتايج بهتري در طبقهبندي بيماري نشان ميدهد.
عنوان نشريه :
مديريت اطلاعات سلامت
عنوان نشريه :
مديريت اطلاعات سلامت