شماره ركورد كنفرانس :
3928
عنوان مقاله :
دستهبندي متون لاتين با روشهاي انتخاب ويژگي فيلتري،پوششي و الگوريتمهاي بيزساده
پديدآورندگان :
پورعباسي حديث hadis_mis_87@yahoo.com دانشجوي كارشناسي ارشد، گروه مهندسي كامپيوتر، واحد اهواز، دانشگاه آزاد اسلامي، اهواز، ايران , عباسي دزفولي ماشالله abbasi_masha@yahoo.com استاديار، گروه مهندسي كامپيوتر، واحد اهواز، دانشگاه آزاد اسلامي، اهواز، ايران
كليدواژه :
انتخاب ويژگي , بيز ساده , دستهبندي , فيلتري
عنوان كنفرانس :
نخستين همايش ملي توسعه پژوهش در كامپيوتر و فناوري اطلاعات
چكيده فارسي :
رشد سريع اينترنت و بهوجود آمدن صفحات وب متعدد با مطالب و موضوعات گوناگون، نياز به روشهايي براي دستهبندي هرچه بهتر صفحات وب را فراهم كرده است. به دليل اينكه حجم عمده صفحات وب را متون تشكيل ميدهند ما در اين پژوهش به توسعه دستهبندي متون در صفحات وب با برخي از روشهاي متنكاوي و يادگيري ماشين پرداختهايم. ما در اين پژوهش پس از يك پيشپردازش مناسب بر روي متون در قسمت انتخاب ويژگي يك روش تركيبي كه مبتني بر تركيب الگوريتمهاي فيلتري و پوششي ميباشد را استفاده كردهايم. در مرحله يادگيري نيز از الگوريتمهاي خانواده بيز ساده استفاده شدهاست. در طي ارزيابي روش پيشنهادي استفاده از روش شاخصبندي 3گرم در مرحله پيشپردازش، و روش فيلتري بهره اطلاعاتي و سپس استفاده از روش پوششي با دستهبند MNB در مرحله انتخاب ويژگي، و همچنين استفاده از الگوريتم دسته بندي MNB در مرحله يادگيري بهينهترين روش در اين پژوهش ارزيابي شده است. روش پيشنهادي در مقايسه با كارهاي گذشته در اين زمينه بهبود بسيار خوبي داشته است.