عنوان مقاله :
وزندهي بهينه به سوالها و خرده آزمونهاي ورودي براي ساخت نمره كل تركيبي
عنوان فرعي :
Optimum Weighting to Entrance Subtests and Their Items to Make Composite Score
پديد آورندگان :
ذوالفقارنسب، سليمان نويسنده , , خدايي، ابراهيم نويسنده سازمان سنجش آموزش كشور Khodaei, Ebrahim , يادگارزاده، غلامرضا نويسنده ,
اطلاعات موجودي :
فصلنامه سال 1392 شماره 4
كليدواژه :
خطاي اندازهگيري , ضريب پايايي , نظريه كلاسيك آزمونسازي , نمره فرمولي , نمره واقعي , وزندهي , نمره كل تركيبي
چكيده فارسي :
اين تحقيق به منظور وزندهي بهينه به خرده آزمونها و سوالهاي آزمون سراسري براي ساخت نمره كل تركيبي انجام شده است. هدف نهايي اين تحقيق پايين آوردن خطاي اندازهگيري نمره كل تركيبي بر اساس نظريه كلاسيك آزمونسازي بود. وزندهي در سه سطح صورت گرفته است نخست آزمون سي سوالي چهارگزينهاي حساب ديفرانسيل كه نمونه آن 3409 نفر بود بر اساس وزندهي در سطح گزينههاي سوال (درصد محبوبيت گزينهها، نمره فرمولي) و در سطح سوال (سرجمع ساده بدون وزن يا وزن موثر سوال، وزن عاملي سوال و وزن دشواري سوال) وزندهي شدهاند. همچنين در سطح خرده آزمون يك مجموعه آزمون سراسري دستياري پزشكي با پنج خرده آزمون با طول برابر شش سوال كه نمونه آن 3572 نفر بود نيز به روشهاي مختلف (متوسط ضريب همبستگي پيرسون، وزن عاملي و ضرايب رگرسيون ) وزندهي شدهاند. به علاوه يك مجموعه آزمون دستياري پزشكي ديگر با طول خرده آزمونهاي نابرابر به ترتيب 45، 26، 24، 6 و 6 سوال كه در بين گروه 3638 نفري اجرا شده بر اساس وزن موثر خود خرده آزمونها (بدون وزن) مورد بررسي قرار گرفته است. اين تحقيق نشان داد كه روش نمره فرمولي بيشترين واريانس خطا را نسبت به ديگر روشها توليد ميكند. تنها وزندهي بر اساس دشواري سوال ميتواند رتبهبندي افراد را به نفع افراد شايستهتر تغيير دهد و ديگر روشهاي وزندهي براي افزايش پايايي رضايت بخش نيستند و ضريب پايايي آزمون در همان ابتدا تحت تاثير سوالهاي خوب و خرده آزمونهاي خوش ساخت با طول بهينه است.
چكيده لاتين :
This research has been accomplished to weight national subtests and their items to make composite score. The aim of the project was to reduce measurement error associated with composite score in classical test theory framework. weighting procedure has been done in three levels; first, 30 multiple-choice-item test in differential calculus course with 3409 sample size was weighted at item choice level (choices popularity percent and formula score), and item level (simple total without weight or item effect weight, item factor weight and item difficulty weight). At subtest level, also, a test battery of medical assistance national test with 5 equally sized subtests, 6 items, which administered on 3572 candidates, has been weighted in different ways (average Pearson product-moment correlation coefficients weights, factor weights and regression coefficients). Another test battery of medical assistance national test with 5 unequal subtest length, 45, 26, 24,6, and 6 items which administered on 3638 candidates were studied without weighting just on their effective weights. This research revealed that formula score method produces more error than other procedures. Only weighting by item difficulty could rearrange examinees ranking in favor of qualified examinees. Other weighting methods are not satisfactory to enhance reliability coefficients and reliability coefficients, ab initio, are affected by appropriate items and well-made subtests with optimum length.
عنوان نشريه :
مطالعات اندازه گيري و ارزشيابي آموزشي
عنوان نشريه :
مطالعات اندازه گيري و ارزشيابي آموزشي
اطلاعات موجودي :
فصلنامه با شماره پیاپی 4 سال 1392
كلمات كليدي :
#تست#آزمون###امتحان