شماره ركورد كنفرانس :
3945
عنوان مقاله :
تحليل آماري واژههاي فارسي مقالات علوم انساني بر مبناي قانون زيف
پديدآورندگان :
اميني خواه نجمه n.aminikhah@yahoo.com مركز منطقه اي اطلاع رساني علوم و فناوري , دستغيب محمدباقر استاديار گروه پژوهشي طراحي و عمليات سيستمها در مركز منطقهاي اطلاعرساني علوم و فناوري , فلاحتي قديمي فومني محمدرضا استاديار گروه پژوهشي زبانشناسي رايانشي در مركز منطقهاي اطلاعرساني علوم و فناوري
كليدواژه :
قانون زيف , پيكرههاي زباني , آمار , بسامد , زبان فارسي
عنوان كنفرانس :
نخستين كنفرانس ملي پژوهش هاي كاربردي در زبان شناسي رايانشي (با محوريت خط و زبان فارسي)
چكيده فارسي :
در پي كمبود ابزارهاي ابتدايي پردازش زبان طبيعي فارسي و نياز روزافزون به برنامههاي ماشيني مبتني بر زبان طبيعي، با مطالعه و اثبات تابعيت زبان فارسي از قوانين زبانشناسي كَمّي، ميتوان بين زبانهاي برنامهنويسي و زبانهاي طبيعي پل ارتباطي ايجاد كرد. قانون زيف از جمله قوانيني است كه در زبانشناسي كمي، در عين سادگي ميتواند نقشي مهمي در پردازش زبان طبيعي فارسي ايفا كند. چرا كه با استفاده از نتايج و گزارشهاي حاصل از اين تحليل، ميتوان برنامهها و ابزارهاي پردازش زبان طبيعي را به گونهاي اصوليتر ساخت. در پژوهش حاضر پيكرهاي كوچك مقياس، ساخته شد و سطح قابل قبولي از پيشپردازش با رويكردي زبانشناسانه بر روي آن اجرا و سپس قانون زيف بر روي آن پيادهسازي و بردار و نمودارهاي زيف آن رسم شد. به منظور اعتبارسنجي از ضريب همبستگي پيرسون ما بين بسامدهاي تخميني و واقعي استفاده شد. همچنين بردارهاي رسم شد با بردارهاي زيف پيكرههاي ديگر به زبان انگليسي كه از اين قانون پيروي ميكنند مقايسه شد. نتيجه حاصل، تبعيت زبان فارسي از اين قانون بود.