شماره ركورد كنفرانس :
957
عنوان مقاله :
ارائه فيلتري نوين مبتني بر روش بيزين براي شناسايي هرزنامه ها
پديدآورندگان :
حسين پور دشتي مينا نويسنده
كليدواژه :
ايميل , هرزنامه , الگوريتم بيزين , يادگيري ماشين , پردازش متن , كلاس بندي متن , بازيابي اطلاعات
عنوان كنفرانس :
همايش ملي فن آوري محاسبات و اطلاعات
چكيده فارسي :
در سال هاي اخير هرزنامه ها به معضلي جدي براي ميليون ها كاربر ايميل بدل شده اند و استفاده از ابزار و متدهايي براي شناسايي و فيلتر آنها ضرورتي ناگزير است. در اين مقاله با اعمال تغييراتي در نحوه محاسبه احتمال ها در فرمولهاي الگوريتم بيزين، فيلتري نوين براي شناسايي و فيلتر هرزنامه ها طراحي و پياده سازي شده است كه كار كلاس بندي متن را روي پيام هاي متني ايميل انجام ميدهد. ابتدا فيلتر با 4200 پيام اسپم و 4200 پيام غيراسپم از ديتاست Enron آموزش داده شده است و سپس با 1200 پيام مورد تست و ارزيابي قرار گرفته است. نتايج حاصل از تست نشان ميدهد كه با استفاده از روابط جديد براي محاسبه احتمال ها مي توان كارايي و دقت فيلتر بيزين را تا حد زيادي بهبود بخشيد.
شماره مدرك كنفرانس :
4476039