عنوان مقاله :
بررسي مقايسهاي تأثير برچسبزني مقولات دستوري بر تجزيه در پردازش خودكار زبان فارسي
عنوان به زبان ديگر :
A Comparative Study on the Impact of Part-of-Speech Tagging on Parsing for the Persian Language Processing
پديد آورندگان :
قيومي، مسعود پژوهشگاه علوم انساني و مطالعات فرهنگي، تهران - پژوهشكده زبانشناسي - گروه دستور زبان آلماني
كليدواژه :
پردازش زبان فارسي , برچسب مقوله دستوري , تجزيه نحوي خودكار , دانگي اطلاعات زبان شناختي
چكيده فارسي :
در اين مقاله، به بررسي جايگاه برچسب زني مقولات دستوري در تجزيه نحوي خودكار جملات فارسي پرداخته خواهد شد. به همين منظور، تأثير كيفيت برچسب زني مقولات دستوري و همچنين تأثيرگذاري ميزان اطلاعات موجود در مقولات دستوري بر كارايي تجزيه خودكار جملات مورد مطالعه قرار خواهد گرفت. به منظور انجام اين دو بررسي، سه سناريو براي تجزيه جملات ارائه شده و مقايسه مي شود. در سناريو 1، تجزيه گر ابتدا داده ورودي را برچسبزني كرده و سپس جمله را تجزيه ميكند. در سناريو 2، از يك برچسب زن خارج از تجزيه گر و در سناريو 3 از برچسب معيار واژه ها براي تجزيه جملات استفاده مي شود. در اين بررسي، معيارهاي ارزيابي متفاوت مورد استفاده قرار مي گيرد تا ميزان اين تأثيرگذاري از ابعاد مختلف نشان داده شود. نتايج حاصل از آزمايشات نشان مي دهد كه كيفيت و ميزان اطلاعات در مقولات دستوري واژه بر كارايي تجزيه گر تأثير مستقيم دارد. كيفيت بالاي برچسب مقولات دستوري سبب كاهش خطاي تجزيه گر و افزايش كارايي آن مي گردد. همچنين عدم وجود اطلاعات صرفي ـ نحوي تأثير منفي بسزايي بر كارايي تجزيه گر دارد كه اين تأثيرگذاري در مقايسه با كيفيت برچسب مقولات دستوري بسيار بيشتر است.
چكيده لاتين :
In this paper, the role of Part-of-Speech (POS) tagging for parsing in automatic processing of the Persian language is studied. To this end, the impact of the quality of POS tagging as well as the impact of the quantity of information available in the POS tags on parsing are studied. To reach the goals, three parsing scenarios are proposed and compared. In the first scenario, the parser assigns the POS tags firstly and then it parses the input sentence. In the second scenario, an external POS tagger is usedto assign the tags, then the sentence is parsed. In the third scenario, the parser uses the gold standard POS tags to parse the input sentence. In this study, various evaluation metrics are used to show the impacts from different points of views. The experimental results show that the quality of the POS tagger and the quantity of the information available in the POS tags have a direct effect on the parsing performance. The high quality of the POS tags causes error reduction in parsing and also it increases parsing performance. Moreover, lack ofmorphological -syntactic information in the POS tags has a high negative impact on parsing performance. This impact is more pronounced than the impact of POS tagger performance.
عنوان نشريه :
پردازش علائم و داده ها
عنوان نشريه :
پردازش علائم و داده ها