مرکز منطقه ای اطلاع رساني علوم و فناوري - تاثير ساخت‌واژه‌ها در تجزيه وابستگي زبان فارسي

شماره ركورد :

728966

عنوان مقاله :

تاثير ساخت‌واژه‌ها در تجزيه وابستگي زبان فارسي

عنوان فرعي :

Effect of morphologies on Persian dependency parsing

پديد آورندگان :

خلاش ، مجتبي نويسنده دانشكده مهندسي كامپيوتر، دانشگاه علم و صنعت ايران، تهران، ايران Khalash, Mojtaba , مينايي بيدگلي، بهروز نويسنده دانشكده مهندسي كامپيوتر، دانشگاه علم و صنعت ايران، تهران، ايران Minaee Bidgoli, Behrooz

اطلاعات موجودي :

دوفصلنامه سال 1393 شماره 22

رتبه نشريه :

علمي پژوهشي

تعداد صفحه :

از صفحه :

تا صفحه :

كليدواژه :

تجزيه وابستگي , خصوصيات ساخت‌واژي , زبان‌هاي از نظر ساخت‌واژي غني

چكيده فارسي :

سامانه‌هاي مبتني بر داده به‌راحتي مي‌توانند به ساير زبان‌ها يا دامنه‌ها منتقل شوند. استفاده از اين رويكرد در تجزيه وابستگي منجر به ارايه روش‌هاي مبتني‌بر داده شد كه تنها نيازمند پيكره‌اي حاوي جملات و درخت وابستگي متناظر با آن به‌عنوان داده آموزشي است. الگوريتم‌هاي طراحي‌شده براي تجزيه وابستگي با وجود صحت بالا در زبان انگليسي، بر روي دسته‌اي از زبان‌ها با افت صحت مواجه مي‌شوند كه دليل اين امر را مي‌توان در پر رنگ‌تر بودن عامل بي‌ترتيبي و غناي ساخت‌واژي آنها دانست. اين بدان معناست كه سامانه‌هاي مبتني‌بر داده نيازمند انتخاب خصوصيات و تنظيم دقيق پارامترها به‌منظور رسيدن به كارايي بهينه هستند. زبان فارسي كه به‌تازگي پيكره وابستگي براي آن طراحي شده است، جزو زبان‌هايي است كه دو عامل بي‌ترتيبي و غناي ساخت‌واژي را دارد. در اين مقاله سعي شده است عوامل تاثيرگذار بر كاهش صحت تجزيه وابستگي در زبان فارسي شناسايي و راهكارهايي براي بهبود صحت آن ارايه شود.

چكيده لاتين :

Data-driven systems can be adapted to different languages and domains easily. Using this trend in dependency parsing was lead to introduce data-driven approaches. Existence of appreciate corpora that contain sentences and theirs associated dependency trees are the only pre-requirement in data-driven approaches. Despite obtaining high accurate results for dependency parsing task in English language, for many of other languages with high free-word order and rich morphology, most applying algorithms lead to drop in accuracy compared to English language. Therefore, data-driven systems require careful selection of features and tuning of parameters to reach optimal performance. A dependency corpus for Persian language introduced recently. Persian language has high free-word order and rich morphology. In this paper we try to find detect effective factors for decreasing parsing accuracy and we present solutions to improve the accuracy.

سال انتشار :

1393

عنوان نشريه :

پردازش علائم و داده ها

عنوان نشريه :

پردازش علائم و داده ها

اطلاعات موجودي :

دوفصلنامه با شماره پیاپی 22 سال 1393

كلمات كليدي :

#تست#آزمون###امتحان

لينک به اين مدرک :

https://search.ricest.ac.ir/dl/search/defaultta.aspx?DTC=8&DC=728966