عنوان مقاله :
شناسايي رابطه تقابل در گفتمان فارسي بهكمك روشهاي يادگيري باسرپرستي
عنوان فرعي :
Contrast Relation Recognition in Persian discourse using supervised learning methods
پديد آورندگان :
خدادادي، حبيب نويسنده گروه مهندسي كامپيوتر، واحد ميناب، دانشگاه آزاد اسلامي، ميناب، ايران khodadadi, habib , راحتي قوچاني ، سعيد نويسنده گروه مهندسي برق، واحد مشهد، دانشگاه آزاد اسلامي، مشهد، ايران rahati ghoochani, saeed , استاجي، اعظم نويسنده گروه زبانشناسي همگاني، دانشكده ادبيات و علوم انساني، دانشگاه فردوسي مشهد، مشهد، ايران estaji, azam
اطلاعات موجودي :
دوفصلنامه سال 1394 شماره 24
كليدواژه :
گفتمان , پردازش زبان طبيعي , نقش نماي گفتمان , شناسايي رابطه تقابل , يادگيري باسرپرستي
چكيده فارسي :
گفتمان به هر قطعه يا پاره اي از زبان گفته مي شود كه به قصد برقراري ارتباط بهكاربرده شده باشد . سامانه شناسايي روابط موجود در گفتمان، روابط موجود بين واحدهاي متني يك گفتمان را شناسايي ميكند. يكي از روابط موجود در گفتمان هاي زبان فارسي رابطه تقابل است كه شناسايي آن به توانايي توليد و درك گفتمان كمك مي كند و در سامانه هاي متعددي مانند خلاصه ساز، تفسير و... كاربرد دارد. رابطه تقابل مي تواند به كمك نقش نماهاي خاص رابطه تقابل مانند «اما» و «ولي» شناسايي شود؛ اما در بعضي موارد اين نقش نماها حذف ميشوند و شناسايي رابطه را با مشكل مواجه مي كنند و بايد از ويژگي هايي مانند زمان فعل ها، جفت كلمات و ... براي شناسايي استفاده كرد. براي انجام آزمايش ها، 10000 نمونه از رابطه تقابل و ساير روابط از پيكره متني پژوهشكده هوشمند علايم بهعنوان مجموعه داده گردآوري شد. از اين نمونهها، بردار ويژگي استخراج شد و در نهايت براي دسته بندي و تشخيص رابطه تقابل از چند روش يادگيري باسرپرستي شامل ماشين بردار پشتيبان، K نزديكترين همسايه، پنجره پارزن و همچنين تركيب اين دسته بندها استفاده شد. بهترين ميزان صحت 13/87 و مربوط به تركيب دسته بندها در بهترين حالت است.
چكيده لاتين :
Discourse is any section or part of the language used to establish communications. Discourse Relations Recognition System recognizes the relations between textual units of a discourse. Contrast is one of the relations in Persian discourse. Recognition of this relation helps produce and understand the discourse. It can be used in variant systems such as summarization systems, interpretation systems, and so on. The contrast relation can be recognized using certain contrast relation markers such as “اما” and “ولي” Nevertheless, these markers are sometimes omitted, making trouble for relation recognition. In these cases, features such as tense of verbs, word pairs, etc. should be used for recognition. To conduct the experiments, 10000 samples for the contrast recognition and other relations were collected from the Corpus of Research Center of Intelligent Signal Processing as the data set. Then, feature vector was extracted from these samples. Finally, several supervised learning methods such as Supporting Vector Machine, the k-Nearest Neighbors algorithm, Parzen-Window, and the integration of these methods, were used to categorize and recognize contrast relations. The highest accuracy was 87.13, which belonged to the combination of category-clauses in its best shape.
عنوان نشريه :
پردازش علائم و داده ها
عنوان نشريه :
پردازش علائم و داده ها
اطلاعات موجودي :
دوفصلنامه با شماره پیاپی 24 سال 1394
كلمات كليدي :
#تست#آزمون###امتحان