شماره ركورد :
741396
عنوان مقاله :
وزن‌دهي بهينه به سوال‌ها و خرده آزمون‌هاي ورودي براي ساخت نمره كل تركيبي
عنوان فرعي :
Optimum Weighting to Entrance Subtests and Their Items to Make Composite Score
پديد آورندگان :
ذوالفقارنسب، سليمان نويسنده , , خدايي، ابراهيم نويسنده سازمان سنجش آموزش كشور Khodaei, Ebrahim , يادگارزاده، غلامرضا نويسنده ,
اطلاعات موجودي :
فصلنامه سال 1392 شماره 4
رتبه نشريه :
علمي پژوهشي
تعداد صفحه :
26
از صفحه :
79
تا صفحه :
104
كليدواژه :
خطاي اندازه‌گيري , ضريب پايايي , نظريه كلاسيك آزمون‌سازي , نمره فرمولي , نمره واقعي , وزن‌دهي , نمره كل تركيبي
چكيده فارسي :
اين تحقيق به منظور وزن‌دهي بهينه به خرده آزمون‌ها و سوال‌هاي آزمون سراسري براي ساخت نمره كل تركيبي انجام شده است. هدف نهايي اين تحقيق پايين آوردن خطاي اندازه‌گيري نمره كل تركيبي بر اساس نظريه كلاسيك آزمون‌سازي بود. وزن‌دهي در سه سطح صورت گرفته است نخست آزمون سي سوالي چهارگزينه‌اي حساب ديفرانسيل كه نمونه آن 3409 نفر بود بر اساس وزن‌دهي در سطح گزينه‌هاي سوال (درصد محبوبيت گزينه‌ها، نمره فرمولي) و در سطح سوال (سرجمع ساده بدون وزن يا وزن موثر سوال، وزن عاملي سوال و وزن دشواري سوال) وزن‌دهي شده‌اند. همچنين در سطح خرده آزمون يك مجموعه آزمون سراسري دستياري پزشكي با پنج خرده آزمون با طول برابر شش سوال كه نمونه آن 3572 نفر بود نيز به روش‌هاي مختلف (متوسط ضريب همبستگي پيرسون، وزن عاملي و ضرايب رگرسيون ) وزن‌دهي شده‌اند. به علاوه يك مجموعه آزمون دستياري پزشكي ديگر با طول خرده آزمون‌هاي نابرابر به ترتيب 45، 26، 24، 6 و 6 سوال كه در بين گروه 3638 نفري اجرا شده بر اساس وزن موثر خود خرده آزمون‌ها (بدون وزن) مورد بررسي قرار گرفته است. اين تحقيق نشان داد كه روش نمره فرمولي بيشترين واريانس خطا را نسبت به ديگر روش‌ها توليد مي‌كند. تنها وزن‌دهي بر اساس دشواري سوال مي‌تواند رتبه‌بندي افراد را به نفع افراد شايسته‌تر تغيير دهد و ديگر روش‌هاي وزن‌دهي براي افزايش پايايي رضايت بخش نيستند و ضريب پايايي آزمون در همان ابتدا تحت تاثير سوال‌هاي خوب و خرده آزمون‌هاي خوش ساخت با طول بهينه است.
چكيده لاتين :
This research has been accomplished to weight national subtests and their items to make composite score. The aim of the project was to reduce measurement error associated with composite score in classical test theory framework. weighting procedure has been done in three levels; first, 30 multiple-choice-item test in differential calculus course with 3409 sample size was weighted at item choice level (choices popularity percent and formula score), and item level (simple total without weight or item effect weight, item factor weight and item difficulty weight). At subtest level, also, a test battery of medical assistance national test with 5 equally sized subtests, 6 items, which administered on 3572 candidates, has been weighted in different ways (average Pearson product-moment correlation coefficients weights, factor weights and regression coefficients). Another test battery of medical assistance national test with 5 unequal subtest length, 45, 26, 24,6, and 6 items which administered on 3638 candidates were studied without weighting just on their effective weights. This research revealed that formula score method produces more error than other procedures. Only weighting by item difficulty could rearrange examinees ranking in favor of qualified examinees. Other weighting methods are not satisfactory to enhance reliability coefficients and reliability coefficients, ab initio, are affected by appropriate items and well-made subtests with optimum length.
سال انتشار :
1392
عنوان نشريه :
مطالعات اندازه گيري و ارزشيابي آموزشي
عنوان نشريه :
مطالعات اندازه گيري و ارزشيابي آموزشي
اطلاعات موجودي :
فصلنامه با شماره پیاپی 4 سال 1392
كلمات كليدي :
#تست#آزمون###امتحان
لينک به اين مدرک :
بازگشت