عنوان مقاله :
مروري بر دادههاي گمشده
عنوان فرعي :
Missing Data
پديد آورندگان :
كاظمي، الهه نويسنده دانشگاه علوم بهزيستي و توانبخشي Kazemi, E , كريملو، مسعود نويسنده , , رهگذر، مهدي نويسنده گروه آمار زيستي, دانشگاه علوم بهزيستي و توانبخشي تهران,تهران,ايران rahgozar, mahdi
اطلاعات موجودي :
دوفصلنامه سال 1390 شماره 1
رتبه نشريه :
فاقد درجه علمي
كليدواژه :
سازوكار گمشدگي كاملاً تصادفي , داده گمشده , سازوكار گمشدگي به علت ذات طرح , سازوكار گمشدگي غير قابل اغماض , سازوكار گمشدگي تصادفي
چكيده فارسي :
در اين مقاله سعي شده است كه مفاهيم گمشدگي داده به صورت ساده و كاربردي توضيح داده شود.
گمشدگي داده در تمامي پژوهشهاي علوم اجتماعي، رفتاري، پزشكي وجود دارد. در آمار ، گمشدن داده به وضعيتي گفته ميشود كه بخشي از مجموعه دادهها گزارش نشده باشند. گمشدگي داده باعث كاهش تطابق جامعه نمونه با جامعه كل شده و ميتواند منجر به نتيجهگيري اشتباه در مورد جمعيت اصلي شود.
گمشدگي داده يك اتفاق معمول بوده و بسته به ميزان آن، ميتواند اثر قابل توجهي در نتيجهگيري به دست آمده از دادهها داشته باشد. تمامي روشهاي برآورد پارامترها بر پايه فرض كامل بودن مجموعه دادهها استوار است و تحت برقراري اين شرايط منجر به برآوردهايي نااريب ميشوند؛ و البته با افزايش نسبت گمشدگي، مقدار اريبي نيز افزايش خواهد يافت.
براي دههها، محققين از روشهاي قديمي استفاده ميكردهاند، اين روشها متكي به تصحيح مجموعه دادهها با صرفنظر كردن از موردهاي داراي مقادير گمشده و يا جايگزيني مقاديري تخميني با مقادير گمشده بودند. متاسفانه اكثر اين روشها وابسته به برقراربودن فرض دلايل گمشدگي داده و نوع سازوكار گمشدگي است؛ و در صورت عدم برقراري اين فرض منجر به اريبي نتايج ميشود.
چكيده لاتين :
In this paper, we are presenting the basic concepts of missing data in a very simple but practical approach.
Missing data are ubiquitous throughout the social, behavioral, and medical sciences. In Statistics, missing data occur when no data value is stored for the variable in the current observation. Missing data reduce the representativeness of the sample and can therefore distort inferences about the population.
Missing data are a common occurrence and can have a significant effect on the conclusions that can be drawn from the data. All the methods of parameters estimation are based on the completion of data set assumption and only in this case the result will be a non- biased one, and with the increase of missing proportion, the rate of biased results increase too.
For decades, researchers have relied on a variety of old techniques that attempt to “fix” the data by discarding incomplete cases or by filling in the missing values. Unfortunately, most of these techniques require a relatively strict assumption about the cause of missing data and are prone to substantial bias.
عنوان نشريه :
مطالعات ناتواني
عنوان نشريه :
مطالعات ناتواني
اطلاعات موجودي :
دوفصلنامه با شماره پیاپی 1 سال 1390
كلمات كليدي :
#تست#آزمون###امتحان