شماره ركورد كنفرانس :
4847
عنوان مقاله :
خلاصهسازي چندسندي استخراجي مبتني بر پرسوجوي متن با استفاده از تفسير و استلزام متني
پديدآورندگان :
ناصراسدي علي naserasadi@uk.ac.ir مجتمع آموزش عالي زرند
كليدواژه :
پردازش زبان طبيعي , خلاصهسازي متن , تفسير متني , استلزام متني , كولهپشتي صفر و يك
عنوان كنفرانس :
چهارمين كنفرانس ملي موضوعات نوين در علوم كامپيوتر و اطلاعات
چكيده فارسي :
يكي از مشكلات رايج شبكههاي كامپيوتري حجم زياد اطلاعات موجود در چنين شبكههايي است. در اين بين، جستجو و اطلاع از محتواي اسناد متني كه گستردهترين نوع اطلاعات بر روي چنين شبكههايي هستند، بسيار مشكل و گاهي اوقات غيرممكن ميباشد. هدف سيستمهاي خلاصهسازي چند سندي متن، توليد كردن خلاصهاي با طول ثابت از اسناد متني ورودي ضمن پوشش حداكثري محتواي اسناد ميباشد. مقالهي حاضر، روشي جديد براي خلاصهسازي اسناد متني بر مبناي استفاده از روابط تفسير و استلزام متني و با فرمولهسازي مسأله در قالب يك مسألهي بهينهسازي ارائه كرده است. در اين روش، جملههاي درون اسناد ورودي ابتدا بر اساس رابطهي تفسير متني خوشهبندي شده سپس امتياز استلزام متني براي كسري از سرآيند خوشهها كه داراي بيشترين امتياز مرتبط با پرسوجوي كاربر هستند محاسبه شده و براساس آن امتياز نهايي هر جمله به دست ميآيد. در نهايت، به كمك دو رويكرد حريصانه و برنامهريزي پويا مسألهي بهينهسازي حل شده و ضمن انتخاب بهترين جملهها، خلاصهي نهايي توليد ميشود. نتايج اجراي سيستم پيشنهادي بر روي مجموعهدادههاي استاندارد و انجام ارزايابي بر اساس سيستم ROUGE نشان ميدهند كه اين سيستم كارايي بهترين سيستمهاي خلاصهسازي استخراجي مبتني بر پرسوجو را به صورت ميانگين حداقل به ميزان 5/2% بهبود داده است.