شماره ركورد :
1225737
عنوان مقاله :
دسته‌بندي بيزين جمعي با استفاده از انتخاب ويژگي رپر مبتني بر الگوريتم ژنتيك در تشخيص هرزنامه
پديد آورندگان :
نصرتي ، وحيد دانشگاه اراك - دانشكده فني و مهندسي , رحماني ، محسن دانشگاه اراك - دانشكده فني و مهندسي
از صفحه :
250
تا صفحه :
277
كليدواژه :
ايميل , هرزنامه , دسته‌بندي , الگوريتم ژنتيك , انتخاب ويژگي , ماتريس انتقال , يادگيري جمعي
چكيده فارسي :
جايگاه ايميل در ارتباطات، با ورود پديده‌اي به نام هرزنامه با تهديد جدي مواجه شده است. تاكنون، به‏منظور مقابله با اين پديده، روش­هاي فراواني پيشنهاد شده كه يكي از مهم‎ترين اين روش‎ها، دسته‌بندي آنها بر اساس محتوا به دو دسته هرزنامه و غيرهرزنامه است. دسته‌بندي بر اساس محتوا با استفاده از كلمات به‎عنوان ويژگي انجام مي‌شود كه به‎دليل تعداد زياد ويژگي‌ها، استفاده از يك سازوكار انتخاب ويژگي كارآمد موضوعي حياتي به نظر مي‌رسد. بر اين اساس، تمركز روش پيشنهادي در اين مقاله روي انتخاب ويژگي‌هاي مفيد بوده و يك فرايند انتخاب ويژگي رپر با بهره‌گيري از الگوريتم قدرتمند ژنتيك و با همكاري دسته‌بند بيزين كه داراي كارايي بالايي در مسائل دسته‌بندي متون است، ارائه مي‌شود. روش كار نيز به اين صورت است كه ابتدا يك بردار ويژگي اوليه ساخته شده، سپس با ضرب كردن آن در يك ماتريس با عنوان ماتريس انتقال، با استفاده از الگوريتم ژنتيك، روي آن عمليات بهينه‌سازي اعمال شده و در پايان، k بردار ويژگي نهايي ساخته مي‌شوند. عمليات دسته‌بندي نيز به‌صورت جمعي و با اعمال k دسته‌بند بيزين روي بردارهاي ويژگي اعمال شده و از بين آنها رأي‌گيري انجام مي‌شود. روش پيشنهادي روي دو پايگاه داده اجرا شده كه بر اساس نتايج، روش پيشنهادي با مقدار 7 = k داراي نرخ صحت 87.76 و 87.91 در دو پايگاه داده 1PU و 2PU است. همچنين نتايج مقايسه روش پيشنهادي، حاكي از كارآمدي روش پيشنهادي در مقايسه با بيزين پايه و دو دسته‌بند SVM و KNN است.
عنوان نشريه :
مديريت اطلاعات
عنوان نشريه :
مديريت اطلاعات
لينک به اين مدرک :
بازگشت