عنوان مقاله :
مقايسه ي واژه هاي پايه ي زبان فارسي در شش پژوهش
عنوان به زبان ديگر :
Basic Words in Farsi: A Comparison of Six Studies
پديد آورندگان :
صحرايي، رضامراد دانشگاه علامه طباطبايي , طالبي، مرواريد , مجيري، اميرحسين
كليدواژه :
زبان فارسي , واژه هاي پربسامد , واژه هاي پايه , متون مطبوعاتي , پيكره زباني
چكيده فارسي :
يكي از مهمترين مولفه ها در آموزش زبان خارجي/ دوم، واژه هاي زبان است. بسياري از كارشناسان آموزش زبان معتقدند كه اهميت اين مولفه ي زباني به حدي است كه يادگيري زبان با يادگيري واژه مترادف شده است؛ به همين جهت چگونگي گزينش و سطح بندي محتواي واژگاني در منابع درسي از مسائل مهم در حوزه ي زبان دوم آموزي به شمار ميرود. استفاده از صورت نشاندار واژه هاي زبان و گنجاندن سليقه اي واژه ها در منابع آموزش زبان فارسي، يكي از بزرگترين چالش ها در سر راه يادگيري زبان فارسي است. در پژوهش پيشرو سعي ما بر اين بوده است كه با استفاده از متون مطبوعاتي و استخراج و بسامدگيري واژه هاي موجود در اين متون، به فهرستي از واژه هاي پركاربرد زبان فارسي دست پيدا كنيم. بدين منظور پيكرهاي بيش از يك ميليون و دويست هزار واژه در 7 زمينه ي موضوعي فرهنگي، اجتماعي، سياسي، ورزشي، علمي، اقتصادي و ادبيات داستاني در طول 100 روز كاري از روزنامه هاي كثيرالانتشار استخراج شد و در پايگاه داده هايي كه جهت انجام اين پژوهش توليد شده است ثبت شد. در مرحله ي بعد واژه ها برچسب گذاري و بسامدگيري شدند كه پيرو آن به جدول «جمع بسامدها» نيز دست يافتيم. پس از دستيابي به واژه هاي پربسامد استخراج شده از پژوهش حاضر، به مقايسه ي اين واژه ها با نتايج ساير پژوهش ها، از جمله حميد حسني (1384)، بي جن خان (1390)، محك وب (1387)، همشهري (2009) و نعمت زاده و همكاران (1390) و اعتبارسنجي يافته هاي پژوهش پرداخته شد. نتيجه ي اين مقايسه حاكي از اختلاف حدود 30 درصدي با پژوهش هاي مشابه است. اين اختلاف طبيعي به نظر مي رسد؛ زيرا منبع داده هاي اين پژوهش ها يكسان نيست.
چكيده لاتين :
Vocabulary is one of the most important factors in foreign/second language teaching. Many scholars believe that the importance of this component of language is to the extent that learning the vocabulary of a language is synonymous with learning the language itself. Therefore, the selection and grading of lexical content of language teaching curriculums has become very important. Accordingly, using the marked words of the language and including the personal tastes and preferences in selecting the lexical contents of language teaching resources are the major challenges in Persian language learning. This study aimed to identify the most frequent words of Persian language in journalistic texts. For this purpose, over 100 working days a corpus of over one million and two hundred thousand words was extracted from widely circulated newspapers and was recorded to the database which was developed for this study. The corpus covered seven genres which included culture, society, politics, sports, science, economy, and fiction. Then, the frequency of each words was counted in the corpus. The resulting list of high frequency words was then compared with and validated against the results of other projects, including Hasani (1384), Bijankhan (1390), Mahakweb (1387), Hamshahri (2009), and Nematzadeh et al. (1390). The results of this comparison showed about 30% difference with the findings of other projects. This difference seems to be normal because the source corpora were not the same in these projects.
عنوان نشريه :
پژوهش نامه آموزش زبان فارسي به غير فارسي زبانان
عنوان نشريه :
پژوهش نامه آموزش زبان فارسي به غير فارسي زبانان