عنوان مقاله :
دستهبندي بيزين جمعي با استفاده از انتخاب ويژگي رپر مبتني بر الگوريتم ژنتيك در تشخيص هرزنامه
پديد آورندگان :
نصرتي ، وحيد دانشگاه اراك - دانشكده فني و مهندسي , رحماني ، محسن دانشگاه اراك - دانشكده فني و مهندسي
كليدواژه :
ايميل , هرزنامه , دستهبندي , الگوريتم ژنتيك , انتخاب ويژگي , ماتريس انتقال , يادگيري جمعي
چكيده فارسي :
جايگاه ايميل در ارتباطات، با ورود پديدهاي به نام هرزنامه با تهديد جدي مواجه شده است. تاكنون، بهمنظور مقابله با اين پديده، روشهاي فراواني پيشنهاد شده كه يكي از مهمترين اين روشها، دستهبندي آنها بر اساس محتوا به دو دسته هرزنامه و غيرهرزنامه است. دستهبندي بر اساس محتوا با استفاده از كلمات بهعنوان ويژگي انجام ميشود كه بهدليل تعداد زياد ويژگيها، استفاده از يك سازوكار انتخاب ويژگي كارآمد موضوعي حياتي به نظر ميرسد. بر اين اساس، تمركز روش پيشنهادي در اين مقاله روي انتخاب ويژگيهاي مفيد بوده و يك فرايند انتخاب ويژگي رپر با بهرهگيري از الگوريتم قدرتمند ژنتيك و با همكاري دستهبند بيزين كه داراي كارايي بالايي در مسائل دستهبندي متون است، ارائه ميشود. روش كار نيز به اين صورت است كه ابتدا يك بردار ويژگي اوليه ساخته شده، سپس با ضرب كردن آن در يك ماتريس با عنوان ماتريس انتقال، با استفاده از الگوريتم ژنتيك، روي آن عمليات بهينهسازي اعمال شده و در پايان، k بردار ويژگي نهايي ساخته ميشوند. عمليات دستهبندي نيز بهصورت جمعي و با اعمال k دستهبند بيزين روي بردارهاي ويژگي اعمال شده و از بين آنها رأيگيري انجام ميشود. روش پيشنهادي روي دو پايگاه داده اجرا شده كه بر اساس نتايج، روش پيشنهادي با مقدار 7 = k داراي نرخ صحت 87.76 و 87.91 در دو پايگاه داده 1PU و 2PU است. همچنين نتايج مقايسه روش پيشنهادي، حاكي از كارآمدي روش پيشنهادي در مقايسه با بيزين پايه و دو دستهبند SVM و KNN است.
عنوان نشريه :
مديريت اطلاعات
عنوان نشريه :
مديريت اطلاعات