عنوان مقاله :
ارائه يك موتور جستجو براي بازيابي رويداد ساختارمند از منابع خبري
پديد آورندگان :
ميرزائيان ، عليرضا دانشگاه شهيد بهشتي - دانشكده مهندسي و علوم كامپيوتر , علي اكبري ، صادق دانشگاه شهيد بهشتي - دانشكده مهندسي و علوم كامپيوتر
كليدواژه :
تشخيص رويداد , موتور جستجو , بازيابي اطلاعات , متنكاوي
چكيده فارسي :
تحليل محتواي اخبار منتشرشده، يكي از مسايل مهم در حوزه بازيابي اطلاعات است. امروزه تحقيقات زيادي براي تحليل تكتك مقالات خبري انجام شده است، در حالي كه اكثر رويدادهاي خبري به شكل چندين مقاله مرتبط به هم به طور مكرر در رسانهها منتشر ميشوند. تشخيص رويداد، وظيفه كشف و گروهبندي اسنادي را دارد كه رويدادي يكسان را شرح ميدهد و با ارائه يك ساختار قابل درك از گزارشهاي خبري، هدايت بهتر كاربران در فضاهاي خبري را تسهيل ميكند. با رشد سريع و روزافزون اخبار برخط، نياز به ايجاد موتورهاي جستجو براي بازيابي رويدادهاي خبري به منظور تسهيل جستجوي كاربران در اين فضاهاي خبري بيش از پيش احساس ميشود. فرض اصلي تشخيص رويداد بر اين است كه به احتمال زياد كلمات مرتبط به يك رويداد يكسان در دنياي واقعي، در اسناد و پنجرههاي زماني مشابه ظاهر ميشوند. بر همين اساس ما در اين تحقيق روشي گذشتهنگر و ويژگيمحور پيشنهاد ميكنيم كه كلمات را بر اساس ويژگيهاي معنايي و زماني گروهبندي ميكند. سپس از اين كلمات براي توليد يك بازه زماني و توصيف متني قابل درك براي انسان استفاده ميكنيم. ارائه يك معماري مناسب و استفاده مؤثر از خوشهبندي جهت بازيابي رويدادها و همچنين تشخيص مناسب زمان رويداد، از نوآوريهاي اين پژوهش به شمار ميروند. روش پيشنهادي روي مجموعه داده AllTheNews كه تقريباً شامل دويست هزار مقاله از ۱۵ منبع خبري در سال 2016 ميباشد ارزيابي شده و با روشهاي ديگر مقايسه گرديده است. ارزيابيها نشان ميدهد كه روش پيشنهادي در دو معيار دقت و يادآوري نسبت به روشهاي پيشين عملكرد بهتري دارد.
عنوان نشريه :
مهندسي برق و مهندسي كامپيوتر ايران
عنوان نشريه :
مهندسي برق و مهندسي كامپيوتر ايران