شماره ركورد كنفرانس :
4820
عنوان مقاله :
افزايش دقت تشخيص صفحات وب هرز با استفاده از سيستم ايمني مصنوعي
پديدآورندگان :
اصدقي فائزه asdaghi@shahroodut.ac.ir دانشگاه صنعتي شاهرود , سليماني علي solimani_ali@shahroodut.ac.ir دانشگاه صنعتي شاهرود
كليدواژه :
وبهرز , طبقهبندي , انتخاب ويژگي , شاخص دقت متعادل شده.
عنوان كنفرانس :
سومين كنفرانس ملي محاسبات تكاملي و هوش جمعي
چكيده فارسي :
وبهرز روشي غيرقانوني و غيراخلاقي بهمنظور افزايش رتبه صفحات اينترنتي توسط فريب الگوريتمهاي موتورهاي جستجو است. از آنجا كه حضور يك صفحه در نتايج بالاي موتورهاي جستجو به معناي بازديدكننده بيشتر و نيز درآمد بيشتر است به اين خاطر راهكارهاي زيادي بهمنظور تشخيص آنها و افزايش كيفيت نتايج ارائه شده است. برخي از اين روشها بر انتخاب ويژگيهاي دقيقتر و برخي ديگر بر ارائه روشهاي طبقهبندي كاراتر تاكيد داشتهاند. در اين مقاله قصد داريم تا با الهام از سيستم ايمني مصنوعي روشي به منظور افزايش دقت تشخيص صفحات وب هرز ارائه نماييم. بدين منظور ابتدا با استفاده از روشهاي انتخاب ويژگي موجود، تعداد ويژگي را كاهش داده، سپس با استفاده از سيستم ايمني مصنوعي و ايجاد سلولهاي حافظه، اقدام به شناسايي صفحات وبهرز خواهيم نمود. آزمايشها كه روي مجموعه داده معتبر WEBSPAM-UK2007 انجام شده نشان ميدهد مدل پيشنهادي توانسته در مقايسه با كارهاي ديگران باعث افزايش معيار F به ميزان 10% شود.