شماره ركورد :
1267543
عنوان مقاله :
ارائه يك موتور جستجو براي بازيابي رويداد ساختارمند از منابع خبري
پديد آورندگان :
ميرزائيان ، عليرضا دانشگاه شهيد بهشتي - دانشكده مهندسي و علوم كامپيوتر , علي اكبري ، صادق دانشگاه شهيد بهشتي - دانشكده مهندسي و علوم كامپيوتر
از صفحه :
221
تا صفحه :
227
كليدواژه :
تشخيص رويداد , موتور جستجو , بازيابي اطلاعات , متن‌كاوي
چكيده فارسي :
تحليل محتواي اخبار منتشرشده، يكي از مسايل مهم در حوزه بازيابي اطلاعات است. امروزه تحقيقات زيادي براي تحليل تك‌تك مقالات خبري انجام شده‌ است، در حالي كه اكثر رويدادهاي خبري به شكل چندين مقاله مرتبط به هم به طور مكرر در رسانه‌ها منتشر مي‌شوند. تشخيص رويداد، وظيفه كشف و گروه‌بندي اسنادي را دارد كه رويدادي يكسان را شرح مي‌دهد و با ارائه يك ساختار قابل درك از گزارش‌هاي خبري، هدايت بهتر كاربران در فضاهاي خبري را تسهيل مي‌كند. با رشد سريع و روزافزون اخبار برخط، نياز به ايجاد موتورهاي جستجو براي بازيابي رويدادهاي خبري به منظور تسهيل جستجوي كاربران در اين فضاهاي خبري بيش از پيش احساس مي‌شود. فرض اصلي تشخيص رويداد بر اين است كه به احتمال زياد كلمات مرتبط به يك رويداد يكسان در دنياي واقعي، در اسناد و پنجره‌هاي زماني مشابه ظاهر مي‌شوند. بر همين اساس ما در اين تحقيق روشي گذشته‌نگر و ويژگي‌محور پيشنهاد مي‌كنيم كه كلمات را بر اساس ويژگي‌هاي معنايي و زماني گروه‌بندي مي‌كند. سپس از اين كلمات براي توليد يك بازه زماني و توصيف متني قابل درك براي انسان استفاده مي‌كنيم. ارائه يك معماري مناسب و استفاده مؤثر از خوشه‌بندي جهت بازيابي رويدادها و همچنين تشخيص مناسب زمان رويداد، از نوآوري‌هاي اين پژوهش به شمار مي‌روند. روش پيشنهادي روي مجموعه داده AllTheNews كه تقريباً شامل دويست هزار مقاله از ۱۵ منبع خبري در سال 2016 مي‌باشد ارزيابي شده و با روش‌هاي ديگر مقايسه گرديده است. ارزيابي‌ها نشان مي‌دهد كه روش پيشنهادي در دو معيار دقت و يادآوري نسبت به روش‌هاي پيشين عملكرد بهتري دارد.
عنوان نشريه :
مهندسي برق و مهندسي كامپيوتر ايران
عنوان نشريه :
مهندسي برق و مهندسي كامپيوتر ايران
لينک به اين مدرک :
بازگشت