شماره ركورد كنفرانس :
3752
عنوان مقاله :
روشهاي مورداستفاده در خزندههاي متمركز و موضوعي
پديدآورندگان :
شعباني محمد علي Mohamad.sh91@gmail.com دانشجوي كارشناسي ارشد، دانشكده كامپيوتر، دانشگاه آزاد اسلامي واحد نجفآباد ، اصفهان، , بصيري محمد احسان e.basiri@chmail.ir دكتراي هوش مصنوعي، دانشكده كامپيوتر ، دانشگاه شهركرد، شهركرد
كليدواژه :
خزندههاي وب , خزندههاي متمركز , خزندههاي موضوعي , شاخص¬گذاري وب , كراولر
عنوان كنفرانس :
اولين كنفرانس بين المللي مهندسي و علوم كامپيوتر
چكيده فارسي :
خزندهي وب ، عاملي است كه با كاوش در فضاي وب، اسناد را بررسي و دستهبندي مينمايند. يك خزنده سايت¬هاي زيادي را براي جمعآوري اطلاعات بازديد ميكند. اين اطلاعات در يك مكان مركزي ذخيرهشده و براي پاسخ به نيازهاي كاربران مورداستفاده قرار مي¬گيرد. با توجه به گستردگي موضوعات منتشرشده در فضاي وب و حجم زياد تغييرات، براي كاهش زمان به¬روز¬رساني و افزايش دقت نتايج ، نوعي از خزندههاي وب موردنياز است كه تنها صفحات مرتبط با موضوع خاصي را دنبال كند. اين نوع از خزندههاي وب، خزندههاي متمركز ناميده مي¬شوند.
اصليترين چالشي كه خزندههاي متمركز با آن روبهرو هستند تشخيص ارتباط موضوعي يك پيوند بازديد نشده، با موضوع مشخص¬شده براي خزنده است و سپس در صورت وجود ارتباط، اختصاص اولويت مناسب به آن پيوند، براي دنبال كردن آن در آينده است. روش¬هاي مختلفي براي پيادهسازي خزنده¬هاي متمركز و مقابله با اين چالش مورداستفاده قرارگرفته است. اين مقاله به بررسي اين روش¬ها و نحوه برخورد آن¬ها با اين چالش مي¬پردازد.