عنوان مقاله :
افزايش سرعت جستجو در مدلهاي مبتني بر مجاورت
پديد آورندگان :
پاك سيما، جواد دانشگاه يزد - دانشكده برق و كامپيوتر , زارع بيدكي، علي محمد دانشگاه يزد - دانشكده برق و كامپيوتر , درهمي، ولي دانشگاه يزد - دانشكده برق و كامپيوتر
كليدواژه :
موتور جستجو , رتبهبندي , فاصله , مدل مجاورت , سرعت بازيابي
چكيده فارسي :
يكي از اصليترين چالشهاي مدلهاي مبتني بر مجاورت مسأله سرعت بازيابي اطلاعات ميباشد. در مدلهاي مبتني بر مجاورت مفهومي به نام فاصله تعريف ميشود كه براي محاسبه آن بايد موقعيت كلمات پرس و جو در سند استخراج شود. اين موضوع يعني استخراج موقعيتها و محاسبه فاصلهها فرايندي زمانبر است و چون غالباً در زمان جستجو اجرا ميشود از ديد كاربر اهميت بيشتري دارد. در صورتي كه بتوان تعداد اسناد مورد بررسي را كاهش داد بازيابي سريعتر ميشود. در اين مقاله الگوريتمي به نام 3SNTK براي هرسكردن پوياي اسناد در موقع جستجوي عبارت ارائه گرديده است. براي اجتناب از تخصيص بيش از حد حافظه و كاهش ريسك بروز خطا در موقع بازيابي، امتياز تعدادي از اسناد بدون هيچ گونه هرسي محاسبه ميشود (Skip-N). در اين الگوريتم از سه هرم حداقل براي استخراج اسناد داراي بالاترين امتيازها استفاده شده و آزمايشها نشان ميدهد كه استفاده از الگوريتم پيشنهادي باعث بهبود سرعت بازيابي ميگردد.
عنوان نشريه :
مهندسي برق و مهندسي كامپيوتر ايران
عنوان نشريه :
مهندسي برق و مهندسي كامپيوتر ايران