شماره ركورد :
769266
عنوان مقاله :
شناسايي رابطه تقابل در گفتمان فارسي به‌كمك روش‌هاي يادگيري باسرپرستي
عنوان فرعي :
Contrast Relation Recognition in Persian discourse using supervised learning methods
پديد آورندگان :
خدادادي، حبيب نويسنده گروه مهندسي كامپيوتر، واحد ميناب، دانشگاه آزاد اسلامي، ميناب، ايران khodadadi, habib , راحتي قوچاني ، سعيد نويسنده گروه مهندسي برق، واحد مشهد، دانشگاه آزاد اسلامي، مشهد، ايران rahati ghoochani, saeed , استاجي، اعظم نويسنده گروه زبان‌شناسي همگاني، دانشكده ادبيات و علوم انساني، دانشگاه فردوسي مشهد، مشهد، ايران estaji, azam
اطلاعات موجودي :
دوفصلنامه سال 1394 شماره 24
رتبه نشريه :
علمي پژوهشي
تعداد صفحه :
10
از صفحه :
13
تا صفحه :
22
كليدواژه :
گفتمان , پردازش زبان طبيعي , نقش نماي گفتمان , شناسايي رابطه تقابل , يادگيري باسرپرستي
چكيده فارسي :
گفتمان به هر قطعه يا پاره اي از زبان گفته مي شود كه به قصد برقراري ارتباط به‌كاربرده شده باشد . سامانه شناسايي روابط موجود در گفتمان، روابط موجود بين واحدهاي متني يك گفتمان را شناسايي مي‌كند. يكي از روابط موجود در گفتمان هاي زبان فارسي رابطه تقابل است كه شناسايي آن به توانايي توليد و درك گفتمان كمك مي كند و در سامانه هاي متعددي مانند خلاصه ساز، تفسير و... كاربرد دارد. رابطه تقابل مي تواند به كمك نقش نماهاي خاص رابطه تقابل مانند «اما» و «ولي» شناسايي شود؛ اما در بعضي موارد اين نقش نماها حذف مي‌شوند و شناسايي رابطه را با مشكل مواجه مي كنند و بايد از ويژگي هايي مانند زمان فعل ها، جفت كلمات و ... براي شناسايي استفاده كرد. براي انجام آزمايش ها، 10000 نمونه از رابطه تقابل و ساير روابط از پيكره متني پژوهشكده هوشمند علايم به‌عنوان مجموعه داده گردآوري شد. از اين نمونه‌ها، بردار ويژگي استخراج شد و در نهايت براي دسته بندي و تشخيص رابطه تقابل از چند روش يادگيري باسرپرستي شامل ماشين بردار پشتيبان، K نزديك‌ترين همسايه، پنجره پارزن و همچنين تركيب اين دسته بندها استفاده شد. بهترين ميزان صحت 13/87 و مربوط به تركيب دسته بندها در بهترين حالت است.
چكيده لاتين :
Discourse is any section or part of the language used to establish communications. Discourse Relations Recognition System recognizes the relations between textual units of a discourse. Contrast is one of the relations in Persian discourse. Recognition of this relation helps produce and understand the discourse. It can be used in variant systems such as summarization systems, interpretation systems, and so on. The contrast relation can be recognized using certain contrast relation markers such as “اما” and “ولي” Nevertheless, these markers are sometimes omitted, making trouble for relation recognition. In these cases, features such as tense of verbs, word pairs, etc. should be used for recognition. To conduct the experiments, 10000 samples for the contrast recognition and other relations were collected from the Corpus of Research Center of Intelligent Signal Processing as the data set. Then, feature vector was extracted from these samples. Finally, several supervised learning methods such as Supporting Vector Machine, the k-Nearest Neighbors algorithm, Parzen-Window, and the integration of these methods, were used to categorize and recognize contrast relations. The highest accuracy was 87.13, which belonged to the combination of category-clauses in its best shape.
سال انتشار :
1394
عنوان نشريه :
پردازش علائم و داده ها
عنوان نشريه :
پردازش علائم و داده ها
اطلاعات موجودي :
دوفصلنامه با شماره پیاپی 24 سال 1394
كلمات كليدي :
#تست#آزمون###امتحان
لينک به اين مدرک :
بازگشت