عنوان مقاله :
ارزيابي كارايي روشهاي مرسوم بازسازي نبودهاي آماري در مناطق خشك ايران
عنوان به زبان ديگر :
Investigation of the efficiency of common methods of infilling missing data in the arid regions of Iran
پديد آورندگان :
ميري، مرتضي سازمان تحقيقات آموزش و ترويج كشاورزي - پژوهشكده حفاظت خاك و آبخيزداري، تهران , كوثري، محمدرضا سازمان تحقيقات آموزش و ترويج كشاورزي - پژوهشكده حفاظت خاك و آبخيزداري، تهران , زند، مهران سازمان تحقيقات آموزش و ترويج كشاورزي - پژوهشكده حفاظت خاك و آبخيزداري، تهران
كليدواژه :
دما , رگرسيون خطي , ضريب همبستگي , كمبود داده , نسبت نرمال
چكيده فارسي :
يكي از مشكلات شايع و تأثيرگذار در مطالعات اقليمي، وجود كمبودهاي فراوان در سريهاي زماني دادههاي مختلف اقليمي و هيدرولوژي است. اين پژوهش، با هدف ارزيابي دقت روشهاي بازسازي پارامترهاي دمايي در مناطق خشك ايران انجام شده است. براي اين منظور، دادههاي روزانه دماي كمينه، متوسط و دماي بيشينه 73 ايستگاه همديدي با پراكنش مناسب در مناطق خشك ايران از آرشيو سازمان هواشناسي كل كشور دريافت و پردازش شد. روشهاي بازسازي مورد استفاده شامل روشهاي نسبت نرمال، رگرسيون خطي، رگرسيون چندگانه و عكس مجذور فاصله (IDW) ميشوند. در اين تحقيق، كارايي هر يك از روشهاي مذكور در بازسازي نبودهاي آماري پارامترهاي دمايي در مقياسهاي زماني روزانه، ماهانه و سالانه مناطق خشك كشور متناسب با ميزان نسبت كمبود دادههاي گمشده (از پنج تا 50 درصد كمبود دادهها) مورد ارزيابي قرار گرفت. براي ارزيابي آماري روشهاي نامبرده از آمارههاي ضريب همبستگي R، معيار برآورد خطاي RMSE و ضريب Nash استفاده شد. نتايج نشان داد كه در حالت كلي، هر كدام از روشهاي نامبرده شده در سطح خاصي از بازسازي و مقياس زماني از عملكرد مناسبي برخوردارند. در مقياس سالانه و ماهانه روشهاي رگرسيون خطي و نسبت نرمال بيشترين دقت در بازسازي دادههاي دما در منطقه خشك ايران را دارند. مقدار همبستگي بين دادههاي بازسازي و مشاهدهاي در سطوح مختلف با استفاده از اين روشها به بيش از 0.95 ميرسد. در مقياس روزانه تفاوت قابل توجهي بين دقت روشهاي مورد استفاده در بازسازي دادههاي دمايي وجود ندارد و تقريباً هر چهار روش ياد شده از دقت مناسبي برخوردارند؛ چرا كه ميزان همبستگي بين دادههاي بازسازيشده و مشاهدهشده به بيش از 90 درصد ميرسد. با وجود اين، روش رگرسيون چندگانه با ميانگين همبستگي 0/99 درصد در سطوح مختلف بازسازي از بيشترين دقت در بازسازي دادههاي روزانه برخوردار است.
چكيده لاتين :
One of the most common and effective problems in long-term climate studies is the presence of gaps in the time series of various climatic and hydrological data. Therefore, the present study evaluates the accuracy of methods for infilling missing data of daily, monthly and annual temperature time series in the arid regions of Iran. For this purpose, the observed daily minimum, average and maximum temperature data for the period 1987-2014 measured at 73 synoptic stations distributed all over arid regions of Iran were used. Methods of readjustment used include: Normal ratio method, linear regression, multivariate regression and Inverse Distance Weighting (IDW). In this study, the capability of each mentioned methods for infilling missing data of daily, monthly and annual precipitation time series in the arid regions of the Iran was investigated, while the proportion of missing data varies from 5 to 50% of total data. In order to compare and evaluate the accuracy of the four mentioned methods three statistical indicators, namely the correlation coefficient (R), the Root Mean Square Error (RMSE) and Nash coefficient were used. The results showed that in general, each of the methods mentioned had different functionalities at a special level of readjustment and time scale. On annual and monthly scales, linear regression and normal ratio methods are the most accurate method in readjustment temperature data in the arid region of Iran. The correlation value between the readjustment and observational data at different levels reaches more than 0.95 using these methods. On the daily scale, there is no significant difference between the accuracy of the methods used in the readjustment of temperature data, and almost all four of these methods have appropriate accuracy because in all methods the correlation between readjustment and observed data is more than 90%. However, multivariate regression methods with an average correlation of 0.99 showed the most accurate performance in readjustment daily data at different levels of readjustment. Generally, each method should be used in accordance with the conditions, and therefore it is recommended to develop a software package for infilling missing data.
عنوان نشريه :
مهندسي و مديريت آبخيز