شماره ركورد :
1160976
عنوان مقاله :
يادگيري رتبه ‏بندي محتواي فارسي وب بر مبناي برنامه‏ نويسي ژنتيك چند لايه
پديد آورندگان :
كيهاني پور ، اميرحسين دانشگاه تهران- پرديس فارابي - دانشكده مهندسي - گروه مهندسي كامپيوتر
از صفحه :
45
تا صفحه :
70
كليدواژه :
يادگيري رتبه بندي , مدل برنامه نويسي ژنتيك چند لايه , ويژگي هاي كليك از گذر داده , محتواي فارسي وب , مجموعه داده dotIR
چكيده فارسي :
يادگيري رتبه‏بندي، يك رويكرد نو ظهور به منظور رفع چالش‏هاي موجود و بهبود عملكرد جويشگرهاي وب، بسيار اميد بخش و كارآمد است. در عين حال عدم توجه جدي به سوابق تعاملات كاربران با جويشگر طي فرآيند جستجو و ارزيابي نتايج بدست آمده، يكي از معضلات جدي آن بشمار مي‏رود. در عين حال حجم بسيار زياد ويژگي‏هاي مورد نياز از اسناد و پرس‏وجوهاي كاربران نيز كاربردي بودن اين رويكرد را در شرايط واقعي با ابهام مواجه ساخته است. استفاده از مدل اطلاعات كليك از گذر داده‏ها و توليد ويژگي‏هاي كليك از گذر داده، راهكار نويني است كه بر مبناي آن و با بكارگيري مدل برنامه‏نويسي ژنتيك چند لايه، مدل رتبه‏بندي مناسبي تحت عنوان MGPRank براي بازيابي اطلاعات انگليسي وب، عرضه شده است. در اين پژوهش اين، با عنايت به ويژگي‏هاي خاص زبان فارسي، از طريق ارائه سناريوهاي مناسب براي ايجاد ويژگي‏هاي كليك از گذر داده اين الگوريتم، اين الگوريتم بومي‏سازي شده است. نتايج حاصل از ارزيابي عملكرد اين الگوريتم در حوزه زبان فارسي با استفاده از مجموعه داده dotIR، حاكي از توانمندي قابل ملاحظه آن نسبت به روش‏هاي مرجع رتبه‏بندي اطلاعات است. اين بهبود عملكرد، بخصوص در بخش ابتدايي فهرست نتايج جستجو كه غالباً بيشتر مورد مراجعه كاربران است، قابل توجه است.
عنوان نشريه :
فناوري اطلاعات و ارتباطات ايران
عنوان نشريه :
فناوري اطلاعات و ارتباطات ايران
لينک به اين مدرک :
بازگشت