عنوان مقاله :
ارائه يك روش يادگيري ويژگي تركيبي مبتني بر الگوريتم شبيهسازي تبريد و برنامهنويسي ژنتيك (مطالعه موردي: تشخيص بدخيمي سرطان سينه)
عنوان به زبان ديگر :
A Combined Feature-Learning Method Based on Simulated Annealing Algorithm and Genetic Programming (Case Study: Malignant Breast Cancer Diagnosis
پديد آورندگان :
صادقي، رسول دانشگاه رازي - دانشكده فني و مهندسي - گروه مهندسي كامپيوتر و فناوري اطلاعات , ابدالي محمدي، فردين دانشگاه رازي - دانشكده فني و مهندسي - گروه مهندسي كامپيوتر و فناوري اطلاعات
كليدواژه :
يادگيري ماشين , يادگيري ويژگي , برنامهنويسي ژنتيك , كاهش ويژگي , سرطان سينه
چكيده فارسي :
امروزه استفاده از ابزارهاي يادگيري ماشين در حوزههاي مختلف از جمله تشخيص بيماريها در حال گسترش است. علت اين امر را ميتوان عملكرد متغير و متمايل به خطاي انسان در مقابل عملكرد ثابت ابزارهاي يادگيري ماشين در زمينه تشخيص و طبقهبندي دانست. حياتي بودن تشخيص در حوزههايي مانند پزشكي، نياز به بهبود تشخيص با روشهاي يادگيري ماشين را توجيه ميكند. از جمله روشهاي افزايش دقت در اين زمينه، الگوريتمهاي كاهش ويژگي و يادگيري ويژگي هستند. در اين مقاله با ارائه يك روش يادگيري ويژگي، دقت روشهاي مبتني بر يادگيريماشين افزايش يافته است. روش پيشنهادي شامل سه فاز افزايش كيفيت داده، انتخاب ويژگي و يادگيري ويژگي است. در فاز اول، مقادير ازدسترفته با شاخص پراكندگي ميانگين و يا مد جايگزين ميشوند در فاز دوم، الگوريتمي مبتني بر الگوريتم شبيهسازي تبريد براي كاهش ويژگي و يافتن بهترين زيرمجموعه از ويژگيها ارائه شده است. در فاز نهايي نيز الگوريتمي مبتني بر الگوريتم برنامهنويسي ژنتيك بهمنظور يادگيري ويژگيهاي متمايزكننده تركيبي ارائه شده است. روش پيشنهادي با استفاده از دو مجموعهداده استاندارد WBCD و WDBC ارزيابي شده است. نتايج بهدست آمده با آخرين دستاوردها مقايسه شده است كه حاكي از عملكرد بهبود يافته الگوريتم پيشنهادي است.
چكيده لاتين :
owadays using machine learning tools in different areas such as disease detection is expanding. Origins of this expansion can be found in humans' unstable performance and stable performance of machine learning tools. Criticality of detection in areas such as medical proves the need for improvement in machine learning methods. feature reduction and feature learning are two ways that cause to precision increment. In this paper precision of machine learning algorithms is increased by feature learning. The proposed method contains three steps: data quality increment, feature selection, and feature learning. In the first step missing values are replaced with mean or mode (distribution index). In the second step a simulated annealing-based algorithm is presented to utilized as feature selection process and finding the best subset of features. In the final step, a genetic programming algorithms is presented to do the feature learning step. The proposed method is evaluated on two benchmark datasets (WBCD and WDBC). The results show performance improvement in machine learning algorithms in terms of precision if the proposed method used.
عنوان نشريه :
مهندسي برق دانشگاه تبريز
عنوان نشريه :
مهندسي برق دانشگاه تبريز