Title of article :
Application of genetic algorithm (GA) to select input variables in support vector machine (SVM) for analyzing the occurrence of roach, Rutilus rutilus, in streams
Author/Authors :
زركامي، ر نويسنده , , صادقي پس‌ويشه، ر. نويسنده Sadeghi Pasvisheh, R. , گوتالس، پ. نويسنده Goethals, P.
Issue Information :
فصلنامه با شماره پیاپی 0 سال 2012
Pages :
10
From page :
237
To page :
246
Abstract :
در اين كار تحقيقي، مدل ماشين بردار پشتيبان (SVM) براي بررسي ميزان وقوع كلمه در رودخانه‌هاي فلامان در بلژيك مورد استفاده قرار گرفته است.براي انجام اين كار چندين پارامتر فيزيكي‌-شيميايي و ساختاري محيط (كه اصطلاحا به فاكتور‌هاي محيطي‌ معروف هستند) در رود خانه‌ها اندازه گيري شده اند. اين فاكتور ها به عنوان درون داد (input) براي توسعه مدل در نظر گرفته شده اند. تنها متغير زيستي‌ براي مطالعه ميزان پراكنش ماهي‌ اندازه گيري ميزان فراواني‌ كلمه (Rutilus rutilus) بوده است.در واقع اين فاكتور براي پيش بيني‌ حضور و يا عدم حضور ماهي‌ (نقش برون داد output در مدل) به كار گرفته شده است. به منظور انتخاب مناسب‌ترين فاكتور‌ها در پيش بيني‌ ميزان پراكنش ماهي‌ يك تكنيكي‌ به نام ژنتيك الگوريتم (Genetic algorithm) با ساپورت وكتور ماشين تركيب شده است. در صد قابليت اعتماد مدل‌ها چه قبل و چه بعد از انتخاب متغير ها، با دو تا از متداول‌ترين شاخص‌هاي آماري سنجيده شده است: ?- شاخص تعداد داده‌هاي كه به درستي‌ كلاسه بندي شده اند (%CCI) ?- كاپاي كوهني (Cohen kappa). بر اساس نتايج حاصله، قبل از به كار گيري ژنتيك الگوريتم ، قابليت اعتماد بالايي در ساپورت وكتور ماشين حاصل شد. اما بعد از ان كه ساپورت وكتور ماشين با ژنتيك الگوريتم تركيب شد در صد قابليت اعتماد مدل بسيار بالاتر رفت. بر اساس معيار سنجش وزني متغير ها، متغير هاي ساختاري-‌زيستگاهي بيش از متغير‌هاي فيزيكي‌-شيميايي در پيش بيني‌ ميزان حضور و عدم حضور نقش داشتند. اين متغير‌ها نيز بعد از به كار گيري ژنتيك الگوريتم نيز تاييد شده است. اگر چه بعد از انتخاب متغير‌ها توسط ژنتيك الگوريتم در صد قابليت اعتماد مدل‌ها افزايش يافت با اين وجود سنجش وزني متغير‌ها مي‌‌تواند يك جايگزين مناسبي براي ژنتيك الگوريتم باشد چون تمام متغير‌ها را مي‌توان بر اساس وزن انها كلاسه بندي كرد در صورتي‌ كه در ژنتيك الگوريتم فقط تعداد مهم بودن و يا نبودن فاكتور‌ها بررسي مي‌‌گردد.
Abstract :
Support vector machine (SVM) was used to analyze the occurrence of roach in Flemish stream basins (Belgium). Several habitat and physico–chemical variables were used as inputs for the model development. The biotic variable merely consisted of abundance data which was used for predicting presence/absence of roach. Genetic algorithm (GA) was combined with SVM in order to select the most important predictors for assessing the presence/absence of roach in the sampling sites. Before and after variable selection, the SVM were evaluated and compared by two predictive performances namely the percentage of Correctly Classified Instances (CCI %) and Cohenʹs kappa statistics (k). The obtained results showed that before variable selection, the SVM yielded a reliable performance but the prediction further improved after the combination of SVM with GA. According to the attribute weights, the habitat variables were more responsible than physico–chemical ones in assessing the presence/absence of fish in the streams. GA also presented that roach are more dependent on the habitat variables rather than on water quality ones. Though after variable selection the predictive performances increased, the attribute weights of SVM could be an alternative substitute for GA since all input variables can be evaluated in terms of their weights.
Journal title :
Caspian Journal of Environmental Sciences (CJES)
Serial Year :
2012
Journal title :
Caspian Journal of Environmental Sciences (CJES)
Record number :
690482
Link To Document :
بازگشت