عنوان :
تهيه پيكره (فرهنگ) املائي واژه هاي هم آوا و هم نويسه در زبان فارسي
شرح پديد آور/مجري (مجريان) طرح :
برنجيان، شاپوررضا
تنالگان :
مركز منطقه اي اطلاع رساني علوم و فناوري
چكيده فارسي :
يكي از مهمترين گامها در طراحي و ساختِ سيستمهاي بازشناسي گفتار و تصحيح خطاهاي آوايي و غلط يابها و استاندارد سازي متونِ فارسي نحوهي تهيه ي يك پيكره و واژه نامه ي بيعيب و نقص در يك زبانِ
خاص است. براي چنين عملي، داشتن مقادير بسيار زيادي از دادههاي تصفيه شدهي استانداردي )كه قبالً بارها بررسي شده باشند( از آن زبان خاص ضروري است. هدف اين پژوهش تهيه ي گنجينه اي از واژه هاي هم- آوا و واژه هاي همنويسه جهت جوابگويي به نيازهايي از اين دست ميباشد. جامعه ي پژوهش اين طرح را تمامي واژه هاي بخش اول فرهنگ معين )1371 )تشكيل ميدهد. اين بخش شامل پنج هزار و دويست و
هفتاد و هفت )5277 )صفحه و حدوداً بيش از سي و هفت هزار )37000 )مدخل ميباشد. روش پژوهش ما تركيبي از روشهاي زبانشناسي و رايانشي است. نتايج به دست آمده نشان داد كه كل واژه هاي استخراج شده 13770 مدخل همراه با معاني واژه ها مي باشند كه از اين تعداد 28 % را »هم آواها« و 38 % را »همنويسه ها« و 15 % را »امكان خطا در امالء« و 19 % را نيز »هم نامه ا« تشكيل ميدهند. در اين تحقيق براي اولين بار
واژهنامه ي »امكان خطا در امالء« كه شامل هم آواها و واژه هاي داراي واجهاي مشابه بودند، استخراج گرديد تا بتواند در اختيار آموزگاران و مدرسين دوره هاي ابتدايي براي تدريس واژه هاي دشوار قرارگيرد. اين پيكره ها براي اشتراك گذاري و دسترسي آسان پژوهشگران ميتوانند به صورت برخط در سامانۀ مركز منطقه اي اطلاع رساني علوم و فناوري براي استفادۀ كاربران نصب گردند
چكيده انگليسي :
فاقد چكيده لاتين
كليدواژه :
پيكره , زبان فارسي , زبان فارسي , واژه هاي هم آوا , واژه هاي هم نويسه
اطلاعات نشر :
شيراز مركز منطقه اي اطلاع رساني علوم و فناوري
فروست :
مركز منطقه اي اطلاع رساني علوم و فناوري