شماره ركورد :
1256798
عنوان مقاله :
تحليل پيكره بنيان متون فارسي ميانه بر مبناي پايگاه داده پارسيگ
پديد آورندگان :
گشتاسب ، فرزانه پژوهشگاه علوم انساني و مطالعات فرهنگي - پژوهشكده زبان‌شناسي - گروه فرهنگ و زبان‌هاي باستاني , قيومي ، مسعود پژوهشگاه علوم انساني و مطالعات فرهنگي - پژوهشكده زبان‌شناسي - گروه زبانشناسي , حاجي پور ، ناديا پژوهشگاه علوم انساني و مطالعات فرهنگي - پژوهشكده زبان‌شناسي - گروه فرهنگ و زبان‌هاي باستاني
از صفحه :
1
تا صفحه :
24
كليدواژه :
زبان پهلوي , زبان‌شناسي پيكره‎اي , پايگاه داده , نشانه‎گذاري داده
چكيده فارسي :
رويكرد نوين در مطالعات زبان‎شناختي يا يك پديده زباني بر اصل وجود مجموعه‌اي از داده‌هاي زباني گردآوري‌شده نهادينه شده‎است؛ بنابراين به تهيه يك پيكره زباني نياز  است كه از توليدات واقعي گويشوران و نه براساس شمّ زبانيِ فردي گردآوري شده‎است. اين شيوۀ پژوهشي براي بررسي داده‎هاي زباني تاريخي كه جزء زبان‌هاي مرده است و اكنون هيچگونه گويشوري ندارد از اهميت به‎سزايي برخوردار است. هدف از انجام اين پژوهش،‌ تهيه پيكرۀ زبان پهلوي ساساني (فارسي ميانه) و ساماندهي آن در يك پايگاه است. براي هر واژه، شش لايۀ اطلاعاتي، اعم از حرف‏نويسي متن پهلوي، آوانويسي واژه‌ها به‌همراه ترجمۀ فارسي آنها، تعيين مقولۀ دستوري دانه‎ريز واژه‌ها، بن‌واژه‌سازي واژه‌ها و تعيين هزوارش‌بودن آنها، تعريف شده‎است. براي مقولۀ دستوري دانه‎ريز واژه‎ها، مجموعۀ برچسب مقولات دستوري فارسي معاصر تهيه‎شده توسط بي‎جن‎خان و همكاران (2011) و ساختارمندشده توسط قيومي (2014) باتوجه‏به نيازهاي زبان پهلوي جرح و تعديل شده‌است و از مجموعۀ جديد براي برچسب‎گذاري واژه‎هاي پهلوي استفاده شده‌است. پس ‎از نشانه‌گذاري واژه‎ها و ساماندهي اطلاعات، امكان استخراج اطلاعات آماري وجود دارد كه مي‎تواند بينش عميق‎تري از محتواي متن منتقل نمايد. ازاين‌رو، اطلاعات آماري از پيكرۀ به‌دست‌آمده استخراج شده و توضيح داده مي‌شود تا دورنماي كلي نسبت‌به منابع تشكيل‌دهندۀ اين پيكره به‌دست‌آيد.
عنوان نشريه :
زبان شناخت
عنوان نشريه :
زبان شناخت
لينک به اين مدرک :
بازگشت