شماره ركورد كنفرانس
5520
عنوان مقاله
شناسايي جملات حاوي كلمات توهينآميز با استفاده از الگوريتمهاي يادگيري ماشين در سرويسهاي ابري آمازون
پديدآورندگان
خانهعنقا اميرعلي amiralikhanehanqa@ut.ac.ir كارشناسي مهندسي كامپيوتر، دانشگاه تهران , موحدي زهرا zmovahedi@ut.ac.ir استاديار ، گروه مهندسي كامپيوتر، دانشكده مهندسي دانشكدگان فارابي دانشگاه تهران
تعداد صفحه
10
كليدواژه
شناسايي كلمات ناهنجار , يادگيري ماشين , پردازش زبان طبيعي , سرويسهاي ابري آمازون
سال انتشار
1401
عنوان كنفرانس
نخستين كنفرانس ملي فضاي سايبر
زبان مدرك
فارسي
چكيده فارسي
با گسترش فضاي مجازي، نظارت بر اين فضا در جهت حفظ ارزشهاي جامعه امري ضروري است. مسئلهي استفاده از جملات توهينآميز، زورگوييهاي اينترنتي و استفاده از كلمات مخالف با هنجارهاي فرهنگي ميبايست مورد بررسي و نظارت قرار گرفته و از بروز و نشر آن جلوگيري شود. در اين مقاله، راهكاري مبتني بر پردازش زبان طبيعي ارائه ميشود تا بتوانيم در زبان فارسي جملات حاوي كلمات توهينآميز را به كمك يادگيري ماشين پردازش كنيم. روش انجام كار به كمك سرويسهاي مختلف ابري آمازون اجرا شده است. نتايج نشان ميدهد كه در مقايسه با روشهاي سنتي، سرويسهاي آمازون موجب تسريع عمليات يادگيري ماشين ميشوند و توانايي ارائه درصد بالايي از دقت و همچنين پيشپردازش و پردازش سريع دادهها و استقرار ماشين را دارا مي باشند.
كشور
ايران
لينک به اين مدرک