شماره ركورد :
785614
عنوان مقاله :
مقايسه روش‌هاي مناسب جانهي مقادير سانسور شده در داده هاي ژئوشيميايي
عنوان فرعي :
The comparison of appropriate methods in imputation of the censored values in the geochemical datasets
پديد آورندگان :
حسيني، سيد علي نويسنده , , افتخاري مهابادي، سمانه نويسنده دانشكده رياضي، آمار و علوم كامپيوتر، دانشگاه تهران Eftekhari Mahabadi, Samaneh , اصغري، اميد نويسنده آزمايشگاه شبيه‌ سازي و پردازش داده، دانشكده مهندسي معدن، دانشگاه تهران Asghari, Omid
اطلاعات موجودي :
دوفصلنامه سال 1394 شماره 9
رتبه نشريه :
علمي پژوهشي
تعداد صفحه :
10
از صفحه :
63
تا صفحه :
72
كليدواژه :
داده هاي ژئوشيميايي , روش ilr-EM , ماهيت تركيبي , مقادير سانسور شده , روش هاي جانهي
چكيده فارسي :
در این تحقیق به بررسی روش­های جانهی مقادیر سانسور شده در مجموعه داده­های چند متغیره ژئوشیمیایی پرداخته شده است. وجود مقادیر گم­شده باعث محدودیت در استفاده از اغلب روش­های آماری همچون تحلیل مولفه­های اصلی می­شود. حذف نمونه­های شامل داده­های گم­شده باعث اریب شدن نتایج و از دست دادن اطلاعات می­شود به همین دلیل در نظر گرفتن رویكردی مناسب در مواجهه با داده­های گم­شده یك نیاز اساسی در تحلیل مجموعه داده­های ناكامل است. در این مقاله، با توجه به ماهیت تركیبی داده­های ژئوشیمیایی، چند روش­ مناسب برای جانهی مقادیر گم­شده كه در چند سال اخیر ارائه شده‌اند و به سادگی در محیط نرم­افزار آماری Rقابل اجرا هستند، معرفی شده­اند. در نهایت با استفاده از یك مجموعه داده كامل مربوط به منطقه ظفرقند، این روش­ها با یكدیگر مقایسه شده­اند. نتایج نشان می­دهند كه استفاده از روش­های چند متغیره برای جانهی و به طور خاص روش ilr-EMنسبت به دیگر روش­ها ارجحیت دارند.
چكيده لاتين :
This study deals with the imputation methods of censored values in the multivariable geochemical data. Presence of the missing values causes limitation in the use of most of statistical methods, e.g. principle component analysis. Excluding the samples which include missing values bias the results and leads to the loss of information. Due to this, consideration of an appropriate approach to deal with missing values is necessary in the analysis of incomplete datasets. In this paper considering the nature of geochemical data, various approaches for imputing the missing values, which have been suggested in the recent years and are easy to be used in the R statistic software, are introduced. Finally, using the complete dataset of the Zafarghand region, these methods are compared with each other. Results show that the application of the multivariable methods in the imputation and particularly the ilr-EM method is preferable to the other methods.
سال انتشار :
1394
عنوان نشريه :
روش هاي تحليلي و عددي در مهندسي معدن
عنوان نشريه :
روش هاي تحليلي و عددي در مهندسي معدن
اطلاعات موجودي :
دوفصلنامه با شماره پیاپی 9 سال 1394
كلمات كليدي :
#تست#آزمون###امتحان
لينک به اين مدرک :
بازگشت