عنوان مقاله :
مقايسه روشهاي مناسب جانهي مقادير سانسور شده در داده هاي ژئوشيميايي
عنوان فرعي :
The comparison of appropriate methods in imputation of the censored values in the geochemical datasets
پديد آورندگان :
حسيني، سيد علي نويسنده , , افتخاري مهابادي، سمانه نويسنده دانشكده رياضي، آمار و علوم كامپيوتر، دانشگاه تهران Eftekhari Mahabadi, Samaneh , اصغري، اميد نويسنده آزمايشگاه شبيه سازي و پردازش داده، دانشكده مهندسي معدن، دانشگاه تهران Asghari, Omid
اطلاعات موجودي :
دوفصلنامه سال 1394 شماره 9
كليدواژه :
داده هاي ژئوشيميايي , روش ilr-EM , ماهيت تركيبي , مقادير سانسور شده , روش هاي جانهي
چكيده فارسي :
در این تحقیق به بررسی روشهای جانهی مقادیر سانسور شده در مجموعه دادههای چند متغیره ژئوشیمیایی پرداخته شده است. وجود مقادیر گمشده باعث محدودیت در استفاده از اغلب روشهای آماری همچون تحلیل مولفههای اصلی میشود. حذف نمونههای شامل دادههای گمشده باعث اریب شدن نتایج و از دست دادن اطلاعات میشود به همین دلیل در نظر گرفتن رویكردی مناسب در مواجهه با دادههای گمشده یك نیاز اساسی در تحلیل مجموعه دادههای ناكامل است. در این مقاله، با توجه به ماهیت تركیبی دادههای ژئوشیمیایی، چند روش مناسب برای جانهی مقادیر گمشده كه در چند سال اخیر ارائه شدهاند و به سادگی در محیط نرمافزار آماری Rقابل اجرا هستند، معرفی شدهاند. در نهایت با استفاده از یك مجموعه داده كامل مربوط به منطقه ظفرقند، این روشها با یكدیگر مقایسه شدهاند. نتایج نشان میدهند كه استفاده از روشهای چند متغیره برای جانهی و به طور خاص روش ilr-EMنسبت به دیگر روشها ارجحیت دارند.
چكيده لاتين :
This study deals with the imputation methods of censored values in the multivariable geochemical data. Presence of the missing values causes limitation in the use of most of statistical methods, e.g. principle component analysis. Excluding the samples which include missing values bias the results and leads to the loss of information. Due to this, consideration of an appropriate approach to deal with missing values is necessary in the analysis of incomplete datasets. In this paper considering the nature of geochemical data, various approaches for imputing the missing values, which have been suggested in the recent years and are easy to be used in the R statistic software, are introduced. Finally, using the complete dataset of the Zafarghand region, these methods are compared with each other. Results show that the application of the multivariable methods in the imputation and particularly the ilr-EM method is preferable to the other methods.
عنوان نشريه :
روش هاي تحليلي و عددي در مهندسي معدن
عنوان نشريه :
روش هاي تحليلي و عددي در مهندسي معدن
اطلاعات موجودي :
دوفصلنامه با شماره پیاپی 9 سال 1394
كلمات كليدي :
#تست#آزمون###امتحان