Title of article :
Evaluating Estimation Methods of Missing Data on a Multivariate Process Capability Index
Author/Authors :
Ashuri, A Industrial Engineering Department - Faculty of Engineering - Shahed University,Tehran , Amiri, A Industrial Engineering Department - Faculty of Engineering - Shahed University,Tehran
Issue Information :
فصلنامه با شماره پیاپی سال 2015
Abstract :
Quality of products has been one of the most important issues for manufacturers in the recent decades.
One of the challenging issues is evaluating capability of the process using process capability indices.
On the other hand, usually the missing data is available in many manufacturing industries. So far, the
performance of estimation methods of missing data on process capability indices has not been
evaluated. Hence, we analyze the performance of a process capability index when we deal with the
missing data. For this purpose, we consider a multivariate process capability index and evaluate four
methods including Mean Substitution, EM algorithm, Regression Imputation and Stochastic
Regression Imputation to estimate missing data. In the analysis, factors including percent of missing
data (k), sample size (m), correlation coefficients (r ) and the estimation methods of missing data are
investigated. We evaluate the main and interaction effects of the factors on response variable which is
defined as difference between the estimated index and the computed index with full data by using
General Linear Model in ANOVA table. The results of this research show that the Stochastic
Regression Imputation has the best performance among the estimation methods and the percent of
missing data (k) has the highest effect on response variable. Also, we conclude that the sample size has
the lowest effect on response variable among the mentioned factors.
Farsi abstract :
كيفيت محصولات يكي از مهم ترين مسائل براي توليدكنندگان در دهه هاي اخير مي باشد. يكي از مباحث چالش برانگيز در اين حوزه بررسي قابليت فرايند است. دربرخي كاربردهاي عملي در بين مشاهدات داده هاي از دست رفته وجود دارد. بنابراين در اين مقاله، ارزيابي عملكرد يك شاخص توانايي فرآيند زماني كه با داده هاي از دست رفته سروكار داريم مورد تحليل قرار گرفته است. شاخص توانايي فرايند ارزيابي شده شاخص چند متغيره تام وهمكاران مي باشد. در اين مقاله چهار روش جايگزيني ميانگين، ماكزيمم سازي ارزش انتظاري، رگرسيون و رگرسيون تصادفي براي تخمين داده هاي از دست رفته بررسي شده است. دراين تحليل عواملي از قبيل درصد داده هاي ازدست رفته، اندازه نمونه، ضريب همبستگي و روش هاي تخمين داده هاي از دست رفته به عنوان فاكتورهاي موثر در نظر گرفته شده است. اثرات اصلي و متقابل اين فاكتور ها روي متغير پاسخ كه به صورت اختلاف بين شاخص تخمين زده شده و شاخص بدست آمده با داده هاي كامل تعريف شده است مورد ارزيابي قرار گرفته است. نتايج اين تحليل نشان مي دهد كه روش رگرسيون تصادفي داراي بهترين عملكرد بين روش هاي براورد داده هاي از دست رفته ميباشد و درصد داده هاي از دست رفته بيشترين اثررا روي متغير پاسخ دارد. همچنين اندازه نمونه كمترين اثر را در بين فاكتور هاي ذكر شده بر روي متغير پاسخ دارد.
Keywords :
Process Capability Index , Missing Data , Imputation Methods , Response Variable , Main and Interaction Effects
Journal title :
Astroparticle Physics