شماره ركورد :
1118006
عنوان مقاله :
تُنُك‌سازي مؤلفه‌هاي اصلي در حضور نقاط دوراُفتاده
عنوان به زبان ديگر :
Sparsity of Principal Component Analysis on Presence of Outliers
پديد آورندگان :
رزاقي، امير دانشگاه تربيت مدرس، ﺗﻬﺮان، اﯾﺮان , گل علي زاده، موسي دانشگاه تربيت مدرس، ﺗﻬﺮان، اﯾﺮان
تعداد صفحه :
12
از صفحه :
117
تا صفحه :
128
كليدواژه :
داده‌هاي جرم و جنايت , تحليل مؤلفه‌هاي اصلي , نقاط دوراُفتاده , تعبيرپذيري مؤلفه‌ها , تحليل مؤلفه‌هاي اصلي اُستوار و تُنُك
چكيده فارسي :
يكي از معروف‌ترين رويكردهاي اكتشافي براي كاهش بُعد و توصيف ساده‌تر منابع اصلي تغييرات، تحليل مؤلفه‌هاي اصلي است. با وجود مزاياي جالب توجه اين روش، به‌كارگيري آن در برخي از مواقع مشكلاتي را به همراه دارد. حضور نقاط دوراُفتاده در مجموعه‌داده‌ها، تأثيرهاي مخربي بر نتايج اين رويكرد دارد كه به نظر مي‌رسد گونه‌اي از مؤلفه‌هاي اصلي كه اُستوار باشند براي اخذ نتايج معتبر، سودمند است. به علاوه، وجود بارهاي مياني در برخي از تركيبات خطي، تفسير مؤلفه‌ها را دشوار مي‌سازد كه در اين حالت مي‌توان گونه‌اي از تُنُك‌سازي مؤلفه‌ها را در نظر گرفت. در اين مقاله، براي حصول هم‌زمان مؤلفه‌هاي اصلي اُستوار و تُنُك، رويكرد تركيبي كارآمدي ارائه و سپس به‌منظور ارزيابي و مقايسه آن با رويكردهاي مطرح شده از شبيه‌سازي آماري بهره گرفته مي‌شود. در نهايت، ابزارهاي مورد اشاره در تحليل مثال واقعي مرتبط با مجموعه‌داده‌هاي جرم و جنايت در آمريكا مورد استفاده قرار مي‌گيرد.
چكيده لاتين :
The Principal Components Analysis is one of the popular exploratory approaches to reduce the dimension and to describe the main source of variation among data. Despite many benefits, it is encountered with some problems in multivariate analysis. Having outliers among data significantly influences the results of this method and it sounds a robust version of PCA is beneficial in this case. In addition, having moderate loadings in the final results makes the interpretation of principal components rather difficult. One can consider a version of sparse components in this case. We study a hybrid approach consisting of joint robust and sparse components and conduct some simulations to evaluate and compare it with other traditional methods. The proposed technique is implemented in a real-life example dealing with the crime rate in the USA.
سال انتشار :
1398
عنوان نشريه :
انديشه آماري
فايل PDF :
7746720
لينک به اين مدرک :
بازگشت