عنوان مقاله :
تُنُكسازي مؤلفههاي اصلي در حضور نقاط دوراُفتاده
عنوان به زبان ديگر :
Sparsity of Principal Component Analysis on Presence of Outliers
پديد آورندگان :
رزاقي، امير دانشگاه تربيت مدرس، ﺗﻬﺮان، اﯾﺮان , گل علي زاده، موسي دانشگاه تربيت مدرس، ﺗﻬﺮان، اﯾﺮان
كليدواژه :
دادههاي جرم و جنايت , تحليل مؤلفههاي اصلي , نقاط دوراُفتاده , تعبيرپذيري مؤلفهها , تحليل مؤلفههاي اصلي اُستوار و تُنُك
چكيده فارسي :
يكي از معروفترين رويكردهاي اكتشافي براي كاهش بُعد و توصيف سادهتر منابع اصلي تغييرات، تحليل مؤلفههاي اصلي است. با وجود مزاياي جالب توجه اين روش، بهكارگيري آن در برخي از مواقع مشكلاتي را به همراه دارد. حضور نقاط دوراُفتاده در مجموعهدادهها، تأثيرهاي مخربي بر نتايج اين رويكرد دارد كه به نظر ميرسد گونهاي از مؤلفههاي اصلي كه اُستوار باشند براي اخذ نتايج معتبر، سودمند است. به علاوه، وجود بارهاي مياني در برخي از تركيبات خطي، تفسير مؤلفهها را دشوار ميسازد كه در اين حالت ميتوان گونهاي از تُنُكسازي مؤلفهها را در نظر گرفت. در اين مقاله، براي حصول همزمان مؤلفههاي اصلي اُستوار و تُنُك، رويكرد تركيبي كارآمدي ارائه و سپس بهمنظور ارزيابي و مقايسه آن با رويكردهاي مطرح شده از شبيهسازي آماري بهره گرفته ميشود. در نهايت، ابزارهاي مورد اشاره در تحليل مثال واقعي مرتبط با مجموعهدادههاي جرم و جنايت در آمريكا مورد استفاده قرار ميگيرد.
چكيده لاتين :
The Principal Components Analysis is one of the popular exploratory approaches to reduce the dimension and to describe the main source of variation among data. Despite many benefits, it is encountered with some problems in multivariate analysis. Having outliers among data significantly influences the results of this method and it sounds a robust version of PCA is beneficial in this case. In addition, having moderate loadings in the final results makes the interpretation of principal components rather difficult. One can consider a version of sparse components in this case. We study a hybrid approach consisting of joint robust and sparse components and conduct some simulations to evaluate and compare it with other traditional methods. The proposed technique is implemented in a real-life example dealing with the crime rate in the USA.
عنوان نشريه :
انديشه آماري