شماره ركورد كنفرانس :
3752
عنوان مقاله :
بررسي عملكرد الگوريتم هاي يادگيري ماشين در تشخيص هرزنامه ها
پديدآورندگان :
ابراهيمي مجيد mjdebm@sco.iaun.ac.ir دانشكده مهندسي كامپيوتر، واحد نجفآباد، دانشگاه آزاد اسلامي، نجفآباد، ايران , رستگاري حميد rastegari@iaun.ac.ir دانشكده مهندسي كامپيوتر، واحد نجفآباد، دانشگاه آزاد اسلامي، نجفآباد، ايران (مولف مسئول)
كليدواژه :
تشخيص هرزنامه , اسپم فيلترينگ , يادگيري ماشين , محتوا
عنوان كنفرانس :
اولين كنفرانس بين المللي مهندسي و علوم كامپيوتر
چكيده فارسي :
با گسترش دنياي تكنولوژي و راه هاي مختلف ارتباطي، انتشار خبر و محتوا و از طرفي ديگر، به دليل ارزان و حتي رايگان بودن استفاده از ابزارهاي ارتباطي الكترونيك و گستره انبوه كاربران اين حوزه، توليد كنندگان هرزنامه ها تمام قدرت خود را بكار بسته اند تا از اين بستر مناسب به بهترين نحو براي رسيدن به مقاصد خود استفاده كنند، در نتيجه مقابله با آنها به يك مسئله غير قابل انكار تبديل شده است كه هر روز با پيشرفت دنياي تكنولوژي وارد فاز جديدي از تقابل مي شوند. ايميل ها، پيامك ها، شبكه هاي اجتماعي و صفحات وب همه از حوزه هاي تقابل ضد هرزنامه ها و هرزنامه ها مي باشند. در اين مقاله ابتدا مروري بر انواع حوزه هاي نفوذ و روش هاي ارائه شده مي پردازيم، سپس تمركز اصلي خود را بر روي مرور روش هاي داده محور و به طور ويژه الگوريتم هاي يادگيري ماشين قرار مي دهيم و در انتها با توجه به آزمايشاتي كه انجام داده ايم، به مقايسه تعدادي از اين الگوريتم ها از لحاظ دقت و سرعت مي پردازيم. در اين آزمايشات الگوريتم LSSVM بهترين دقت، الگوريتم Naive Bayes Updateable بهترين سرعت را دارا هستند و الگوريتم Random forest متوسط دقت و سرعت را در بين الگوريتم هاي آزمايش شده دارا است.