عنوان مقاله :
استفاده از روش هاي تك متغيره و چندمتغيره به منظور شناسايي داده هاي پرت در منشايابي رسوبات، مطالعه موردي: حوزه آبخيز تنگ بستانك
عنوان به زبان ديگر :
Using univariate and multivariate methods to detect outliers in sediment fingerprinting method, case study: Tange Bostanak Watershed
پديد آورندگان :
نوحه گر، احمد دانشگاه تهران , كاظمي، محمد دانشگاه هرمزگان - دانشكده منابع طبيعي , احمدي، جواد دانشگاه تهران - دانشكده محيط زيست , غلامي، حيمد پژوهشكده چرخ سوخت سازمان انرژي اتمي , مهدوي، رسول دانشگاه هرمزگان - دانشكده منابع طبيعي
اطلاعات موجودي :
فصلنامه سال 1396 شماره 4
كليدواژه :
آناليز مولفه هاي اصلي , انگشت نگاري , فاصله ماهالانوبيس , ردياب ها , گراب , روش منشايابي و رسوبات
چكيده فارسي :
كارايي روش منشايابي با ردياب ها يا انگشت نگاري به عنوان روشي موفق و موثر براي تعيين منابع رسوبات به اثبات رسيده است. اولين و مهم ترين مرحله روش منشايابي رسوب، انتخاب تركيب مناسبي از ردياب است كه قادر به جداسازي منابع رسوب باشند .وجود داده هاي پرت بر انتخاب تركيب مناسبي از ردياب ها اثر گذاشته، ممكن است مانع انتخاب متغيرهاي مهم (ردياب هاي موثر) شده و توان جداسازي يا درصد طبقه بندي صحيح را كاهش دهد. بنابراين داده هاي يادشده بايد شناسايي و در صورت وجود شواهد كافي دال بر پرت بودن، نسبت به تصحيح يا حذف آن ها اقدام شود. در مطالعه حاضر هدف شناسايي داده هاي پرت در بين مجموعه ردياب هاي اندازه گيري شده در حوزه آبخيز تنگ بستانك، براي تشخيص بهترين تركيب ردياب ها بود. بر اين اساس از روش هاي تك متغيره شناسايي داده هاي پرت همچون آزمون گراب، آزمون گوس، آزمون ديكسون، نمودار جعبه اي، ميانه به اضافه يا منهاي ميانه انحراف هاي تمام داده ها از ميانه و ميانگين به اضافه و منهاي سه برابر انحراف از معيار داده ها و نيز از روش هاي چندمتغيره شناسايي داده هاي پرت همچون تحليل مولفه هاي اصلي، فاصله ماهالانوبيس، مربع فاصله ماهالانوبيس، نمودار چندك مربع فاصله ماهالانوبيس به روي درجه آزادي در برابر توزيع مربع كاي، نمودارهاي جعبه اي مربع فاصله ماهالانوبيس استفاده شد. در مجموع داده اي پرت شناخته شد كه دست كم نيمي از روش هاي مذكور به پرت بودن آن اذعان داشته باشند. نتايج نشان داد روش ميانه به اضافه و منهاي ميانه انحراف هاي تمام داده ها از ميانه تعداد بيشتري از داده ها را به عنوان داده پرت معرفي مي كند و همچنين روش هاي چندمتغيره اشتراك كمتري در تشخيص داده هاي پرت با يكديگر دارند. آزمون هاي تك متغيره اجماع بهتري نسبت به شناسايي و معرفي داده هاي پرت دارند. براي استفاده از روش هاي تك متغيره براي شناسايي داده هاي پرت روش هاي ميانه به اضافه يا منهاي ميانه انحراف هاي تمام داده ها از ميانه، نمودار جعبه اي و آزمون ديكسون به ترتيب حساسيت آن ها پيشنهاد مي شود. همچنين نتايج نشان داد، بيشينه اجماع روش هاي به كار رفته براي روش هاي تك متغيره چهار و براي روش هاي چندمتغيره دو مورد هست و در كل اجماع نيمي از روش ها براي پرت بودن داده ها مشاهده نشد.
چكيده لاتين :
Efficiency of sediment fingerprinting by using tracers as a successful method to determine the sources of sediment has been proved. Selection of the suite subset of tracers، capable of discriminating sediment sources، is the first and the most important step in the sediment fingerprinting method. The presence of outliers affects the selection of the suite subset and possibly prevents picking the important tracers and reducing the accuracy of classification. Therefore، the outliers must be detected in order to be corrected or omitted، if enough evidences were present. The present study aims to detect outliers in the subset of tracers، to identify the best combination. For detecting outliers، We used univariate methods such as Grubbs test، Gauss test، Dioxin test، box plot، the Median ± 3MAD، the mean ± 3standard deviation and also multivariate methods such as squared Mahalanobis distance، separate box plots of squared Mahalanobis distance for each of sediment sources، principal component analysis and plot of the squared Mahalanobis distances against the quantiles of the chi-square distribution. we consider an observation as the outlier that at least half of these methods have detected it as an outlier. The results showed that Median ± 3MAD method introduced a larger number of data as outliers Methods of multivariate outlier detection has low agreement with each other. Univariate methods to identify outliers show higher agreement with each other. To use univariate analysis techniques to detect outliers namely Median ± 3MAD، box plot، and Dioxin one can recommended to test their sensitivity. The results also showed that the maximum consensus for univariate analysis techniques is four samples (observations) and for multivariate methods is two samples (observations). In general، there is no observation that is identified as an outlier by half of the used methods.
عنوان نشريه :
مهندسي و مديريت آبخيز
عنوان نشريه :
مهندسي و مديريت آبخيز
اطلاعات موجودي :
فصلنامه با شماره پیاپی 4 سال 1396