شماره ركورد :
1330361
عنوان مقاله :
پيكرۀ ساخت‌هاي فعل سبك زبان فارسي
پديد آورندگان :
اسحاقي ، مهديه دانشگاه تهران - دانشكده ادبيات و علوم انساني , كريمي‌دوستان ، غلامحسين دانشگاه تهران - دانشكده ادبيات و علوم انساني
از صفحه :
173
تا صفحه :
198
كليدواژه :
زبان فارسي , منابع داده‌اي , پيكرۀ زباني , ساخت‌هاي فعل سبك , پردازش زبان طبيعي
چكيده فارسي :
پيكرۀ زباني مجموعه‌اي بزرگ از داده‌هاي زباني مبتني بر كاربرد سخنوران زبان‌هاست كه الگوهاي واقعي كاربرد زباني را در اختيار پژوهشگران قرار مي‌دهند. برتري پيكره‌ها در مقايسه با ساير منابع داده‌اي علاوه بر حجم زياد داده‌، ايجاد امكان به‌كارگيري رايانه در بررسي‌هاي زباني است. مقالۀ حاضر به معرفي اولين پيكرۀ ساخت‌هاي فعل سبك زبان فارسي مي‌پردازد. آشنايي با ماهيت اين ساخت‌ها و دسترسي به فهرستي از آن‌ها، علاوه بر اهميت نظري به‌لحاظ كاربردي نيزحائز اهميت است. اين يافته‌ها در حوزۀ بررسي‌هاي هوش مصنوعي مرتبط با پردازش زبان‌هاي طبيعي، ترجمۀ ماشيني، آموزش زبان فارسي، دستورنويسي و فرهنگ‌نگاري كاربرد مي‌يابد. پيكرۀ هدف اين پژوهش «پيكرۀ زباني ساخت‌هاي فعل‌سبك زبان فارسي» يا  LCP نام دارد. براي ايجاد آن پيكرۀ تك‌زبانۀ پژوهشگاه ارتباطات و فناوري اطلاعات (بي‌جن‌خان، 1397) كه حاوي 950000 فايل متني است، به‌عنوان پيكرۀ مبنا برگزيده شد. ساخت‌هاي فعلي مركب مربوط به 21 فعل سبك زاياي زبان فارسي از آن استخراج ‌شده است و پس از برچسب‌زني در چارچوب صرف توزيعي (Halle Marantz, 1993; Marantz, 2013) در قالب پيكره‌اي مشتمل بر بيش از 6000 ساخت فعل سبك در بيش از 2000000 بافت زباني ارائه شده است كه در بيش از 200000 بافت زباني ارائه شده‌اند. مقايسۀ تعداد فعل‌هاي واژگاني زبان فارسي با تعداد ساخت‌هاي فعل سبك موجود در پيكرۀ حاضر، بديهي‌ترين عاملي است كه وجود چنين پيكره‌اي در ميان منابع زبان فارسي را ضرورت مي‌بخشد. از سوي ديگر، ماهيت اين پيكره، يعني نمايش ساخت‌هاي فعل سبك در بافت‌هاي زباني متفاوت، مي‌تواند به پژوهشگران در يافتن پاسخ پرسش‌هاي موجود در رابطه با اين ساخت‌ها، رد يا تأييد فرضيه‌ها و طرح نظريه‌هاي جديد كمك كند.
عنوان نشريه :
پژوهش هاي زبان شناسي
عنوان نشريه :
پژوهش هاي زبان شناسي
لينک به اين مدرک :
بازگشت