كليدواژه :
همتراز سازي , پس هموارسازي ( PSE ) , روش كرنل ( KE ) , آزمون توليمو , سؤالات لنگر , نظريه كلاسيك آزمون ( CTT ) , Circle arc
چكيده فارسي :
اين پژوهش با هدف يافتن بهترين روش هموارسازي داده ها در روشهاي مختلف همترازسازي انجام شد. به اين منظور از دادههاي آزمون توليمو و آزمونهاي جامع كنكورهاي آزمايشي شركت تعاوني سازمان سنجش آموزش كشوردر سال 92-91 استفاده شد. براي تحليل دادههاي آزمونهاي جامع كنكورهاي آزمايشي شركت تعاوني سازمان سنجش آموزش كشور صرفاً از سؤالات مشترك دروس عمومي رشتههاي رياضي- فيزيك، علوم تجربي و علوم انساني استفاده شد. براي يافتن بهينه ترين روش هموارسازي داده ها در همترازسازي از حجم نمونه هاي مختلف و آزمونهاي با تعداد سؤالات مختلف (طول متفاوت) استفاده شد. در آزمون توليمو از طرح همترازسازي NEAT و در آزمونهاي جامع از طرح گروههاي همسان استفاده شد. نتايج تحليلها به طور كلي نشان داد كه براي هموارسازي داده ها در آزمون توليمو، مدل اول (مدل لگاريتم خطي شامل ميانگين، واريانس، چولگي و كشيدگي- چهار گشتاور اول براي آزمون و لنگر) كه سادهتر است انتخاب شد و بهترين مدل براي هموارسازي دادههاي آزمون توليمو (فرم X) در سه حجم نمونه 200، 500 و 1000 نفري مدل اول بدست آمد. به همين ترتيب، در فرم Y آزمون توليمو در حجم نمونه 200 و 1000 نفر بهترين مدل، مدل اول و در حجم نمونه 500 نفر مدل دوم برگزيده شد. در داده هاي آزمون جامع سنجش، (هم فرم X و هم فرم Y) در حجم هاي نمونه مختلف 200، 500 و 1000 نفري بهترين مدل، مدل سوم مدل لگاريتم خطي شامل ميانگين، واريانس، چولگي و كشيدگي (چهار گشتاور اول) است چون مدلي كه كمترين مقدار AIC را داشته باشد برازش بهتري دارد. همچنين نتايج پژوهش گوياي آن است كه به موازات افزايش حجم نمونه، برازش مربوط به هموارسازي كرنل نيز بهبود يافته است و بهبود هموارسازي كرنل با افزايش طول آزمون همراه بوده است.
چكيده لاتين :
This study aimed to discover the most optimal method of smoothing data in different equating methods. For this purpose, data were exactly collected using both TOLIMO and Comprehensive Tests of Iran Educational Testing Organization administered in 1391-92. To analyze data collected from Comprehensive Tests of Iran Educational Testing Organization, only the items related to joint general subjects from majors of mathematics and physics, science and humanities were utilized. Data were collected from samples with different sizes and tests with different lengths in terms of items to discover the most optimal method for smoothing data in test equating. As to TOLIMO, equating NEAT design was used while in Comprehensive Tests it was homogeneous groups design. Results of the analyses showed that to smooth data in TOLIMO, the first model (logarithmic linear model including mean, variance, skewness and kurtosis- the first four transformations for the test and anchor) which is simpler was selected. Thus, the best model for smoothing data collected from TOLIMO (form X) was discovered in three sample sizes 0f 200, 500 and 1000 participants. In the same way, in the form Y of TOLIMO with sample sized of 200 and 1000 participants the first model was recognized the best model, but in sample size of 500 people the second model was selected best. As to the data collected from Comprehensive Tests (both X and Y forms), the third model of logarithmic linear models including mean, variance, skewness and kurtosis (the first four transformations) was the best model with different sample sizes of 200, 500 and 1000 people since a model with the lowest AIC has better fitness indexes. Findings, also, indicated that the larger the sample size was and the longer the test was in terms of items, the more improved the fitness for Kernel smoothing there would be.