شماره ركورد كنفرانس :
4163
عنوان مقاله :
تجزية سطحي معنايي جملات فارسي به كمك درخت ساختسازهاي
عنوان به زبان ديگر :
Shallow semantic parsing of Persian sentences via Phrase-structure parsing
پديدآورندگان :
لازمي صغري Soghra.lazemi@gmail.com دانشگاه كاشان , ابراهيمپور كومله حسين Ebrahimpour@kashanu.ac.ir دانشگاه كاشان , نوروزي ناصر Noroozi@kashanu.ac.ir دانشگاه كاشان
كليدواژه :
تجزية سطحي معنايي , تجزية ساختسازهاي , زبان فارسي.
عنوان كنفرانس :
چهارمين همايش ملي زبان شناسي رايانشي
چكيده فارسي :
در پردازش خودكار زبان طبيعي، پس از تحليل لغوي و ساختاري، بررسي و دريافت معناي جملات توسط تحليلگر معنايي انجام ميگيرد. بهدليل آنكه در زبانهاي طبيعي، كلمات در بافت جمله، معاني خود را نمايان ميسازند، نخستين گام در تحليلگر معنايي، تجزية سطحي معنايي است كه به تعيين نقش معنايي وابستههاي محمول در جمله ميپردازد. در اين مقاله، تجزية سطحي معنايي با رويكرد مبتنيبر يادگيري ماشين و با استفاده از اطلاعات موجود در درخت ساختسازهاي انجام شدهاست. در روش پيشنهادي، پس از ايجاد درخت ساختسازهاي، براي كاهش محاسبات، سازههاي غيرمرتبط با محمول فعلي از درخت حذف شدهاند. در مرحلة بعدي براي سازههاي باقيمانده، با استفاده از اطلاعات استخراج شده از درخت و تعريف تعدادي ويژگيهاي لغوي-نحوي، بردار ويژگي ساخته شدهاست. درنهايت با استفاده از دستهبندهاي چندكلاسه، برچسب معنايي واژهها مشخص گرديدهاست. آزمايشها بر روي پيكرة تهيهشده نتايج قابلقبولي را نشان ميدهند.
چكيده لاتين :
In the automatic processing of natural language, after the lexical and syntactical analysis, the investigation and understanding of the meaning of the sentences are performed by semantic analyzer. Because in natural languages, the words reveal their meanings in the context of sentences, the first step in the semantic analyzer is the shallow semantic parsing, that defines the semantic role of the predicate’s dependents in the sentences. In this paper, the shallow semantic parsing is done by using the machine learning-based approaches and available information in the Phrase-structure trees. In the proposed method after constructing Phrase-structure tree, to reduce complexity, the non-related constituents of the predicate have been removed. In the next stage, for the remaining constituents, the feature vector is designed by using extracted information from the Phrase-structure tree and defining a number of lexical-syntactical features. Finally, the semantic label of words has been generated by using the multi-class classification algorithms. Experiments show the acceptable results.