شماره ركورد كنفرانس :
4379
عنوان مقاله :
دسته بندي موضوعي پرس وجوهاي زبان فارسي
پديدآورندگان :
زاهدي محمد صادق s.zahedi@itrc.ac.ir مركز تحقيقات مخابرات ايران، دانشگاه تهران , منصوري بهروز b.mansouri@ut.ac.ir دانشگاه تهران , فرهودي مژگان farhoodi@itrc.ac.ir مركز تحقيقات مخابرات ايران , مرادخاني شيوا sh.moradkhani@itrc.ac.ir مركز تحقيقات مخابرات ايران
تعداد صفحه :
7
كليدواژه :
دسته بندي پرس وجو , دسته بندي موضوعي پرس وجو , لاگ موتور جستجو , Query Classification
سال انتشار :
1395
عنوان كنفرانس :
هشتمين كنفرانس فناوري اطلاعات و دانش
زبان مدرك :
فارسي
چكيده فارسي :
مسئله ي دسته بندي موضوعي پرس‌وجوها يكي از مسائل چالش برانگيز و مهم در زمينه داده كاوي است كه در بسياري از زمينه ها نظير موتورهاي جستجو، سيستم پرسش و پاسخ و سيستم هاي آنلاين تبليغات كاربرد دارد. با وجود اهميت بسيار بالاي دسته بندي موضوعي پرس وجوها، هنوز پژوهشي در اين زمينه براي زبان فارسي صورت نگرفته است لذا در اين مقاله سعي شده است، در ابتدا راه كاري براي دسته بندي موضوعي پرس وجوهاي زبان فارسي ارائه گردد و سپس بر اساس آن پرس وجوهاي لاگ موتور جستجوي بومي تحليل شود. دو روش مبتني بر مدل زباني و اسناد مرتبط با پرس وجو ارائه شده است كه هر دو روش از نسخه ي توسعه يافته ي مجموعه داده ي همشهري به عنوان داده آموزشي استفاده مي نمايند. براي ارزيابي روش هاي ارائه شده از يك مجموعه داده استاندارد براي دستهبندي موضوعي پرس‌وجوهاي فارسي شامل 7000 پرس وجو و دسته ي موضوعي آن ها، استفاده شده است. نتايج حاصل شده حاكي از عملكرد مناسب روش هاي پيشنهادي براي دسته بندي موضوعي پرس وجوهاي زبان فارسي دارند.
كشور :
ايران
لينک به اين مدرک :
بازگشت