عنوان مقاله :
تحليل پيكره بنيان متون فارسي ميانه بر مبناي پايگاه داده پارسيگ
پديد آورندگان :
گشتاسب ، فرزانه پژوهشگاه علوم انساني و مطالعات فرهنگي - پژوهشكده زبانشناسي - گروه فرهنگ و زبانهاي باستاني , قيومي ، مسعود پژوهشگاه علوم انساني و مطالعات فرهنگي - پژوهشكده زبانشناسي - گروه زبانشناسي , حاجي پور ، ناديا پژوهشگاه علوم انساني و مطالعات فرهنگي - پژوهشكده زبانشناسي - گروه فرهنگ و زبانهاي باستاني
كليدواژه :
زبان پهلوي , زبانشناسي پيكرهاي , پايگاه داده , نشانهگذاري داده
چكيده فارسي :
رويكرد نوين در مطالعات زبانشناختي يا يك پديده زباني بر اصل وجود مجموعهاي از دادههاي زباني گردآوريشده نهادينه شدهاست؛ بنابراين به تهيه يك پيكره زباني نياز است كه از توليدات واقعي گويشوران و نه براساس شمّ زبانيِ فردي گردآوري شدهاست. اين شيوۀ پژوهشي براي بررسي دادههاي زباني تاريخي كه جزء زبانهاي مرده است و اكنون هيچگونه گويشوري ندارد از اهميت بهسزايي برخوردار است. هدف از انجام اين پژوهش، تهيه پيكرۀ زبان پهلوي ساساني (فارسي ميانه) و ساماندهي آن در يك پايگاه است. براي هر واژه، شش لايۀ اطلاعاتي، اعم از حرفنويسي متن پهلوي، آوانويسي واژهها بههمراه ترجمۀ فارسي آنها، تعيين مقولۀ دستوري دانهريز واژهها، بنواژهسازي واژهها و تعيين هزوارشبودن آنها، تعريف شدهاست. براي مقولۀ دستوري دانهريز واژهها، مجموعۀ برچسب مقولات دستوري فارسي معاصر تهيهشده توسط بيجنخان و همكاران (2011) و ساختارمندشده توسط قيومي (2014) باتوجهبه نيازهاي زبان پهلوي جرح و تعديل شدهاست و از مجموعۀ جديد براي برچسبگذاري واژههاي پهلوي استفاده شدهاست. پس از نشانهگذاري واژهها و ساماندهي اطلاعات، امكان استخراج اطلاعات آماري وجود دارد كه ميتواند بينش عميقتري از محتواي متن منتقل نمايد. ازاينرو، اطلاعات آماري از پيكرۀ بهدستآمده استخراج شده و توضيح داده ميشود تا دورنماي كلي نسبتبه منابع تشكيلدهندۀ اين پيكره بهدستآيد.