شماره ركورد كنفرانس :
4163
عنوان مقاله :
تجزية سطحي معنايي جملات فارسي به كمك درخت‌ ساخت‌سازه‌اي
عنوان به زبان ديگر :
Shallow semantic parsing of Persian sentences via Phrase-structure parsing
پديدآورندگان :
لازمي صغري Soghra.lazemi@gmail.com دانشگاه كاشان , ابراهيم‌پور كومله حسين Ebrahimpour@kashanu.ac.ir دانشگاه كاشان , نوروزي ناصر Noroozi@kashanu.ac.ir دانشگاه كاشان
تعداد صفحه :
22
كليدواژه :
تجزية سطحي معنايي , تجزية ساخت‌سازه‌اي , زبان فارسي.
سال انتشار :
1396
عنوان كنفرانس :
چهارمين همايش ملي زبان شناسي رايانشي
زبان مدرك :
فارسي
چكيده فارسي :
در پردازش خودكار زبان طبيعي، پس از تحليل لغوي و ساختاري، بررسي و دريافت معناي جملات توسط تحليل‌گر معنايي انجام مي‌گيرد. به‌دليل آنكه در زبان‌هاي طبيعي، كلمات در بافت جمله، معاني خود را نمايان مي‌سازند، نخستين گام در تحليل‌گر معنايي، تجزية سطحي معنايي است كه به تعيين نقش معنايي وابسته‌هاي محمول در جمله مي‌پردازد. در اين مقاله، تجزية سطحي معنايي با رويكرد مبتني‌بر يادگيري ماشين و با استفاده از اطلاعات موجود در درخت ساخت‌سازه‌اي انجام شده‌است. در روش پيشنهادي، پس از ايجاد درخت ساخت‌سازه‌اي، براي كاهش محاسبات، سازه‌هاي غيرمرتبط با محمول فعلي از درخت حذف شده‌اند. در مرحلة بعدي براي سازه‌هاي باقيمانده، با استفاده از اطلاعات استخراج شده از درخت‌ و تعريف تعدادي ويژگي‌هاي لغوي-نحوي، بردار ويژگي ساخته شده‌است. درنهايت با استفاده از دسته‌بندهاي چندكلاسه، برچسب معنايي واژه‌ها مشخص گرديده‌است. آزمايش‌ها بر روي پيكرة تهيه‌شده نتايج قابل‌قبولي را نشان مي‌دهند.
چكيده لاتين :
In the automatic processing of natural language, after the lexical and syntactical analysis, the investigation and understanding of the meaning of the sentences are performed by semantic analyzer. Because in natural languages, the words reveal their meanings in the context of sentences, the first step in the semantic analyzer is the shallow semantic parsing, that defines the semantic role of the predicate’s dependents in the sentences. In this paper, the shallow semantic parsing is done by using the machine learning-based approaches and available information in the Phrase-structure trees. In the proposed method after constructing Phrase-structure tree, to reduce complexity, the non-related constituents of the predicate have been removed. In the next stage, for the remaining constituents, the feature vector is designed by using extracted information from the Phrase-structure tree and defining a number of lexical-syntactical features. Finally, the semantic label of words has been generated by using the multi-class classification algorithms. Experiments show the acceptable results.
كشور :
ايران
لينک به اين مدرک :
بازگشت