Title of article :
Evaluating Estimation Methods of Missing Data on a Multivariate Process Capability Index
Author/Authors :
Ashuri, A Industrial Engineering Department - Faculty of Engineering - Shahed University,Tehran , Amiri, A Industrial Engineering Department - Faculty of Engineering - Shahed University,Tehran
Issue Information :
فصلنامه با شماره پیاپی سال 2015
Pages :
9
From page :
88
To page :
96
Abstract :
Quality of products has been one of the most important issues for manufacturers in the recent decades. One of the challenging issues is evaluating capability of the process using process capability indices. On the other hand, usually the missing data is available in many manufacturing industries. So far, the performance of estimation methods of missing data on process capability indices has not been evaluated. Hence, we analyze the performance of a process capability index when we deal with the missing data. For this purpose, we consider a multivariate process capability index and evaluate four methods including Mean Substitution, EM algorithm, Regression Imputation and Stochastic Regression Imputation to estimate missing data. In the analysis, factors including percent of missing data (k), sample size (m), correlation coefficients (r ) and the estimation methods of missing data are investigated. We evaluate the main and interaction effects of the factors on response variable which is defined as difference between the estimated index and the computed index with full data by using General Linear Model in ANOVA table. The results of this research show that the Stochastic Regression Imputation has the best performance among the estimation methods and the percent of missing data (k) has the highest effect on response variable. Also, we conclude that the sample size has the lowest effect on response variable among the mentioned factors.
Farsi abstract :
كيفيت محصولات يكي از مهم ترين مسائل براي توليدكنندگان در دهه هاي اخير مي­ باشد. يكي از مباحث چالش برانگيز در اين حوزه بررسي قابليت فرايند است. دربرخي كاربردهاي عملي در بين مشاهدات داده هاي از دست رفته وجود دارد. بنابراين در اين مقاله، ارزيابي عملكرد يك شاخص توانايي فرآيند زماني كه با داده هاي از دست رفته سروكار داريم مورد تحليل قرار گرفته است. شاخص توانايي فرايند ارزيابي شده شاخص چند متغيره تام وهمكاران مي­ باشد. در اين مقاله چهار روش جايگزيني ميانگين، ماكزيمم سازي ارزش انتظاري، رگرسيون و رگرسيون تصادفي براي تخمين داده هاي از دست رفته بررسي شده است. دراين تحليل عواملي از قبيل درصد داده هاي ازدست رفته، اندازه نمونه، ضريب همبستگي و روش هاي تخمين داده هاي از دست رفته به عنوان فاكتورهاي موثر در نظر گرفته شده است. اثرات اصلي و متقابل اين فاكتور ها روي متغير پاسخ كه به صورت اختلاف بين شاخص تخمين زده شده و شاخص بدست آمده با داده هاي كامل تعريف شده است مورد ارزيابي قرار گرفته است. نتايج اين تحليل نشان مي­ دهد كه روش رگرسيون تصادفي داراي بهترين عملكرد بين روش هاي براورد داده هاي از دست رفته مي­باشد و درصد داده هاي از دست رفته بيشترين اثررا روي متغير پاسخ دارد. همچنين اندازه نمونه كمترين اثر را در بين فاكتور هاي ذكر شده بر روي متغير پاسخ دارد.
Keywords :
Process Capability Index , Missing Data , Imputation Methods , Response Variable , Main and Interaction Effects
Journal title :
Astroparticle Physics
Serial Year :
2015
Record number :
2406317
Link To Document :
بازگشت