عنوان مقاله :
تاثير ساختواژهها در تجزيه وابستگي زبان فارسي
عنوان فرعي :
Effect of morphologies on Persian dependency parsing
پديد آورندگان :
خلاش ، مجتبي نويسنده دانشكده مهندسي كامپيوتر، دانشگاه علم و صنعت ايران، تهران، ايران Khalash, Mojtaba , مينايي بيدگلي، بهروز نويسنده دانشكده مهندسي كامپيوتر، دانشگاه علم و صنعت ايران، تهران، ايران Minaee Bidgoli, Behrooz
اطلاعات موجودي :
دوفصلنامه سال 1393 شماره 22
كليدواژه :
تجزيه وابستگي , خصوصيات ساختواژي , زبانهاي از نظر ساختواژي غني
چكيده فارسي :
سامانههاي مبتني بر داده بهراحتي ميتوانند به ساير زبانها يا دامنهها منتقل شوند. استفاده از اين رويكرد در تجزيه وابستگي منجر به ارايه روشهاي مبتنيبر داده شد كه تنها نيازمند پيكرهاي حاوي جملات و درخت وابستگي متناظر با آن بهعنوان داده آموزشي است. الگوريتمهاي طراحيشده براي تجزيه وابستگي با وجود صحت بالا در زبان انگليسي، بر روي دستهاي از زبانها با افت صحت مواجه ميشوند كه دليل اين امر را ميتوان در پر رنگتر بودن عامل بيترتيبي و غناي ساختواژي آنها دانست. اين بدان معناست كه سامانههاي مبتنيبر داده نيازمند انتخاب خصوصيات و تنظيم دقيق پارامترها بهمنظور رسيدن به كارايي بهينه هستند.
زبان فارسي كه بهتازگي پيكره وابستگي براي آن طراحي شده است، جزو زبانهايي است كه دو عامل بيترتيبي و غناي ساختواژي را دارد. در اين مقاله سعي شده است عوامل تاثيرگذار بر كاهش صحت تجزيه وابستگي در زبان فارسي شناسايي و راهكارهايي براي بهبود صحت آن ارايه شود.
چكيده لاتين :
Data-driven systems can be adapted to different languages and domains easily. Using this trend in dependency parsing was lead to introduce data-driven approaches. Existence of appreciate corpora that contain sentences and theirs associated dependency trees are the only pre-requirement in data-driven approaches. Despite obtaining high accurate results for dependency parsing task in English language, for many of other languages with high free-word order and rich morphology, most applying algorithms lead to drop in accuracy compared to English language. Therefore, data-driven systems require careful selection of features and tuning of parameters to reach optimal performance.
A dependency corpus for Persian language introduced recently. Persian language has high free-word order and rich morphology. In this paper we try to find detect effective factors for decreasing parsing accuracy and we present solutions to improve the accuracy.
عنوان نشريه :
پردازش علائم و داده ها
عنوان نشريه :
پردازش علائم و داده ها
اطلاعات موجودي :
دوفصلنامه با شماره پیاپی 22 سال 1393
كلمات كليدي :
#تست#آزمون###امتحان