عنوان مقاله :
پيكرۀ ساختهاي فعل سبك زبان فارسي
پديد آورندگان :
اسحاقي ، مهديه دانشگاه تهران - دانشكده ادبيات و علوم انساني , كريميدوستان ، غلامحسين دانشگاه تهران - دانشكده ادبيات و علوم انساني
كليدواژه :
زبان فارسي , منابع دادهاي , پيكرۀ زباني , ساختهاي فعل سبك , پردازش زبان طبيعي
چكيده فارسي :
پيكرۀ زباني مجموعهاي بزرگ از دادههاي زباني مبتني بر كاربرد سخنوران زبانهاست كه الگوهاي واقعي كاربرد زباني را در اختيار پژوهشگران قرار ميدهند. برتري پيكرهها در مقايسه با ساير منابع دادهاي علاوه بر حجم زياد داده، ايجاد امكان بهكارگيري رايانه در بررسيهاي زباني است. مقالۀ حاضر به معرفي اولين پيكرۀ ساختهاي فعل سبك زبان فارسي ميپردازد. آشنايي با ماهيت اين ساختها و دسترسي به فهرستي از آنها، علاوه بر اهميت نظري بهلحاظ كاربردي نيزحائز اهميت است. اين يافتهها در حوزۀ بررسيهاي هوش مصنوعي مرتبط با پردازش زبانهاي طبيعي، ترجمۀ ماشيني، آموزش زبان فارسي، دستورنويسي و فرهنگنگاري كاربرد مييابد. پيكرۀ هدف اين پژوهش «پيكرۀ زباني ساختهاي فعلسبك زبان فارسي» يا LCP نام دارد. براي ايجاد آن پيكرۀ تكزبانۀ پژوهشگاه ارتباطات و فناوري اطلاعات (بيجنخان، 1397) كه حاوي 950000 فايل متني است، بهعنوان پيكرۀ مبنا برگزيده شد. ساختهاي فعلي مركب مربوط به 21 فعل سبك زاياي زبان فارسي از آن استخراج شده است و پس از برچسبزني در چارچوب صرف توزيعي (Halle Marantz, 1993; Marantz, 2013) در قالب پيكرهاي مشتمل بر بيش از 6000 ساخت فعل سبك در بيش از 2000000 بافت زباني ارائه شده است كه در بيش از 200000 بافت زباني ارائه شدهاند. مقايسۀ تعداد فعلهاي واژگاني زبان فارسي با تعداد ساختهاي فعل سبك موجود در پيكرۀ حاضر، بديهيترين عاملي است كه وجود چنين پيكرهاي در ميان منابع زبان فارسي را ضرورت ميبخشد. از سوي ديگر، ماهيت اين پيكره، يعني نمايش ساختهاي فعل سبك در بافتهاي زباني متفاوت، ميتواند به پژوهشگران در يافتن پاسخ پرسشهاي موجود در رابطه با اين ساختها، رد يا تأييد فرضيهها و طرح نظريههاي جديد كمك كند.
عنوان نشريه :
پژوهش هاي زبان شناسي
عنوان نشريه :
پژوهش هاي زبان شناسي