عنوان مقاله :
يادگيري رتبه بندي محتواي فارسي وب بر مبناي برنامه نويسي ژنتيك چند لايه
پديد آورندگان :
كيهاني پور ، اميرحسين دانشگاه تهران- پرديس فارابي - دانشكده مهندسي - گروه مهندسي كامپيوتر
كليدواژه :
يادگيري رتبه بندي , مدل برنامه نويسي ژنتيك چند لايه , ويژگي هاي كليك از گذر داده , محتواي فارسي وب , مجموعه داده dotIR
چكيده فارسي :
يادگيري رتبهبندي، يك رويكرد نو ظهور به منظور رفع چالشهاي موجود و بهبود عملكرد جويشگرهاي وب، بسيار اميد بخش و كارآمد است. در عين حال عدم توجه جدي به سوابق تعاملات كاربران با جويشگر طي فرآيند جستجو و ارزيابي نتايج بدست آمده، يكي از معضلات جدي آن بشمار ميرود. در عين حال حجم بسيار زياد ويژگيهاي مورد نياز از اسناد و پرسوجوهاي كاربران نيز كاربردي بودن اين رويكرد را در شرايط واقعي با ابهام مواجه ساخته است. استفاده از مدل اطلاعات كليك از گذر دادهها و توليد ويژگيهاي كليك از گذر داده، راهكار نويني است كه بر مبناي آن و با بكارگيري مدل برنامهنويسي ژنتيك چند لايه، مدل رتبهبندي مناسبي تحت عنوان MGPRank براي بازيابي اطلاعات انگليسي وب، عرضه شده است. در اين پژوهش اين، با عنايت به ويژگيهاي خاص زبان فارسي، از طريق ارائه سناريوهاي مناسب براي ايجاد ويژگيهاي كليك از گذر داده اين الگوريتم، اين الگوريتم بوميسازي شده است. نتايج حاصل از ارزيابي عملكرد اين الگوريتم در حوزه زبان فارسي با استفاده از مجموعه داده dotIR، حاكي از توانمندي قابل ملاحظه آن نسبت به روشهاي مرجع رتبهبندي اطلاعات است. اين بهبود عملكرد، بخصوص در بخش ابتدايي فهرست نتايج جستجو كه غالباً بيشتر مورد مراجعه كاربران است، قابل توجه است.
عنوان نشريه :
فناوري اطلاعات و ارتباطات ايران
عنوان نشريه :
فناوري اطلاعات و ارتباطات ايران