شماره ركورد كنفرانس :
4726
عنوان مقاله :
موتور جستجو بر پايه فنّاوري وب معنايي و استفاده از روش K نزديكترين همسايه براي رتبهبندي و طبقهبندي صفحات وب
پديدآورندگان :
سعيدي فر هادي hadisaeedifard@gmail.com ، گروه كامپيوتر، واحد اروميه، دانشگاه آزاد اسلامي، اروميه، ايران. , بابازاده سنگر امين aminbzh@yahoo.com ، گروه كامپيوتر، واحد اروميه، دانشگاه آزاد اسلامي، اروميه، ايران.
كليدواژه :
موتور جستجو , وب معنايي , وب كاوي , ديكشنري WordNet , K نزديكترين همسايه.
عنوان كنفرانس :
چهارمين كنفرانس ملي محاسبات توزيعي و پردازش داده هاي بزرگ
چكيده فارسي :
وب معنايي نسخهي ارتقاءيافتهي وب كنوني است كه اطلاعات موجود در آن داراي معاني تعريفشدهاي هستند. در اين مقاله يك الگوريتم پيشنهادي بر پايه فنّاوري وب معنايي ارائهشده است. روش پيشنهادي از دو بخش تشكيلشده است، بخش اول بيشتر شامل پيشپردازش صفحات وب و استخراج كلمات كليدي و تشكيل بردار كلمات كليدي براي هر يك از صفحات وب است و بخش دوم پردازش پرسوجوي كاربر و تبديل آن به يك بردار كلمات كليدي است. براي بررسي ميزان شباهت معنايي كلمات پرسوجو كاربر و متن صفحات وب از ديكشنري WordNet استفادهشده است. درنهايت درروش پيشنهادي از روش K نزديكترين همسايه براي رتبهبندي و طبقهبندي صفحات و محاسبه فاصله كلمات پرسوجو و كلمات كليدي استخراجشده از هر صفحه وب استفاده شد. براي ارزيابي الگوريتم پيشنهادي از مجموعه داده با 250 نمونه صفحه وب استفاده شد كه نتايج نشان ميدهد الگويتم پيشنهادي در و پرسوجو كلمات مرتبط با ميانگين 81.6 درصد و در پرسوجو يك جمله با ميانگين 71.20 و پرسوجو خود كلمات كليدي با ميانگين 91 درصد صحيح توانسته صفحات وب را بر اساس ارتباط معنايي رتبهبندي كند.