تحليل پيكره بنيان متون فارسي ميانه بر مبناي پايگاه داده پارسيگ

پديد آورندگان

گشتاسب ، فرزانه پژوهشگاه علوم انساني و مطالعات فرهنگي - پژوهشكده زبان‌شناسي - گروه فرهنگ و زبان‌هاي باستاني , قيومي ، مسعود پژوهشگاه علوم انساني و مطالعات فرهنگي - پژوهشكده زبان‌شناسي - گروه زبانشناسي , حاجي پور ، ناديا پژوهشگاه علوم انساني و مطالعات فرهنگي - پژوهشكده زبان‌شناسي - گروه فرهنگ و زبان‌هاي باستاني

از صفحه

تا صفحه

كليدواژه

زبان پهلوي , زبان‌شناسي پيكره‎اي , پايگاه داده , نشانه‎گذاري داده

چكيده فارسي

رويكرد نوين در مطالعات زبان‎شناختي يا يك پديده زباني بر اصل وجود مجموعه‌اي از داده‌هاي زباني گردآوري‌شده نهادينه شده‎است؛ بنابراين به تهيه يك پيكره زباني نياز است كه از توليدات واقعي گويشوران و نه براساس شمّ زبانيِ فردي گردآوري شده‎است. اين شيوۀ پژوهشي براي بررسي داده‎هاي زباني تاريخي كه جزء زبان‌هاي مرده است و اكنون هيچگونه گويشوري ندارد از اهميت به‎سزايي برخوردار است. هدف از انجام اين پژوهش،‌ تهيه پيكرۀ زبان پهلوي ساساني (فارسي ميانه) و ساماندهي آن در يك پايگاه است. براي هر واژه، شش لايۀ اطلاعاتي، اعم از حرف‏نويسي متن پهلوي، آوانويسي واژه‌ها به‌همراه ترجمۀ فارسي آنها، تعيين مقولۀ دستوري دانه‎ريز واژه‌ها، بن‌واژه‌سازي واژه‌ها و تعيين هزوارش‌بودن آنها، تعريف شده‎است. براي مقولۀ دستوري دانه‎ريز واژه‎ها، مجموعۀ برچسب مقولات دستوري فارسي معاصر تهيه‎شده توسط بي‎جن‎خان و همكاران (2011) و ساختارمندشده توسط قيومي (2014) باتوجه‏به نيازهاي زبان پهلوي جرح و تعديل شده‌است و از مجموعۀ جديد براي برچسب‎گذاري واژه‎هاي پهلوي استفاده شده‌است. پس ‎از نشانه‌گذاري واژه‎ها و ساماندهي اطلاعات، امكان استخراج اطلاعات آماري وجود دارد كه مي‎تواند بينش عميق‎تري از محتواي متن منتقل نمايد. ازاين‌رو، اطلاعات آماري از پيكرۀ به‌دست‌آمده استخراج شده و توضيح داده مي‌شود تا دورنماي كلي نسبت‌به منابع تشكيل‌دهندۀ اين پيكره به‌دست‌آيد.

عنوان نشريه

زبان شناخت

عنوان نشريه

زبان شناخت

لينک به اين مدرک

https://search.isc.ac/dl/search/defaultta.aspx?DTC=8&DC=1256798