شماره ركورد كنفرانس
4163
عنوان مقاله
سامانة خودكار خلاصهسازي با استفاده از روش تعبية متن
عنوان به زبان ديگر
Automatic text summarization using text embedding
پديدآورندگان
كهنسال محمود kohansal@ut.ac.ir دانشگاه تهران , فيلي هشام hfaili@ut.ac.ir دانشگاه تهران , فرضي سعيد saeedfarzi@gmail.com دانشگاه خواجهنصيرالدينطوسي
تعداد صفحه
21
كليدواژه
خلاصهسازي خودكار , پردازش متن , تعبية كلمات , پردازش زبان طبيعي.
سال انتشار
1396
عنوان كنفرانس
چهارمين همايش ملي زبان شناسي رايانشي
زبان مدرك
فارسي
چكيده فارسي
گسترش استفاده از فناوريهاي نوين و در دسترس قرار گرفتن دادههاي زياد و متنوع، لزوم وجود ابزارهاي تسهيلكننده را براي سرعت بخشيدن به كسب اطلاعات مفيد و مختصر بيشتر نمايان ساختهاست. سامانههاي خودكار خلاصهساز متن يكي از كاربرديترين ابزارهاي پردازش زبان طبيعي است. در پژوهش پيش رو، يك سامانة خلاصهساز استخراجي تكسندي معرفي شدهاست كه با استفاده از روشهاي تعبية متن، متن ورودي را به برداري از اعداد حقيقي تبديل ميكند و سپس جملات برتر را براي ايجاد خلاصه انتخاب ميكند. اين روند بهصورت بدون ناظر و بدون استفاده از ويژگيهاي متن انجام ميشود. جهت ارزيابي اين سامانه از پيكرة استاندارد پاسخ استفاده شدهاست و سيستم پيشنهادي روي اين پيكره با سامانههاي ايجاز و فارسيسام بهعنوان دو سامانة موفق مقايسه شدهاند كه نتايج نشاندهندة افزايش فراخواني حداقل دو درصدي سامانة پيشنهادي بر اساس معيار ROUGE است.
چكيده لاتين
The spread of using new technologies and the availability of diverse data shows the need for facilitating tools to accelerate the acquisition of more useful and brief information. Automatic Text Summarization systems are one of the most useful natural language processing tools. In this research, an extractive single-document summarization system is introduced that uses text embedding methods to convert the input text into a vector of real numbers and then selects the superior sentences for generating a summary.This process is performed unsupervised and without using of text features. To evaluate the system, the Pasokh standard dataset has been used and the proposed system has been compared with Ijaz and FarsiSum as two successful summarization systems. Theresults shows at least two percent increasing of recall for the proposed system based on the ROUGE measure.
كشور
ايران
لينک به اين مدرک