شماره ركورد :
1294704
عنوان مقاله :
ارائه رويكرد تنسور سه بعدي براي طبقه‌بندي و تشخيص اخبار جعلي: مطالعه موردي اخبار فارسي در حوزه كرونا ويروس
پديد آورندگان :
متقي ، وحيد دانشگاه آزاد اسلامي واحد قشم - گروه مديريت فناوري اطلاعات , اسماعيلي ، مهدي دانشگاه آزاد اسلامي واحد كاشان - گروه علوم كامپيوتر , بازايي ، قاسمعلي دانشگاه آزاد اسلامي واحد تهران مركزي - گروه مديريت , افشاركاظمي ، محمدعلي دانشگاه آزاد اسلامي واحد تهران مركزي - گروه مديريت
از صفحه :
221
تا صفحه :
250
كليدواژه :
پردازش زبان طبيعي , طبقه‌بندي متن , شبكه‌هاي عصبي كانولوشني , تنسور سه بعدي , اخبار جعلي , اخبار فارسي , كرونا ويروس
چكيده فارسي :
هدف: هدف پژوهش حاضر اختصاص يكي از كلاس‌‌هاي جعل و واقعي به متن‌‌هاي آزاد مي‌باشد. شبكه‌‌هاي عصبي كانولوشني به عنوان يكي از مهم‌‌ترين مدل‌‌هاي يادگيري عميق، دقت بالايي را بر روي اين مسائل بدست آورده است. در اين تحقيق آناليز متن در سطح جمله و بهبود عملكرد شبكه عصبي كانولوشني جهت تشخيص اخبار جعلي مورد توجه بوده است. در اﯾﻦ ﺷﺒﮑﻪ‌‌ﻫﺎ ﮐﻠﻤﺎت ﺑﻪ ﺻﻮرت ﮐﯿﺴﻪ‌‌اي از ﮐﻠﻤﺎت ﺑﻪ ﻣﺪل داده ﻣﯽ‌‌ﺷﻮﻧﺪ ﮐﻪ ﻫﺮ ﮐﻠﻤﻪ ﺑﺎ ﺗﻮﺟﻪ ﺑﻪ ﻓﻀﺎي ﺑﺮداري ﺑﻪ ﻣﺎﺗﺮﯾﺲ‌‌ﻫﺎي دو ﺑﻌﺪي ﺗﺒﺪﯾﻞ ﻣﯽ‌‌ﺷود. يكي از محدوديت‌‌هاي شبكه‌‌هاي كانولوشن اين است كه در سطح كلمه كار كرده و نمي‌‌تواند رابطه و فاصله بين جملات را در نظر بگيرد و آﻧﺎﻟﯿﺰ در ﺳﻄﺢ ﺟﻤﻠﻪ مشكل اساسي در اين تحقيق مي‌‌باشد. در اين پژوهش يك مدل پايه‌‌اي مبتني بر شبكه‌‌هاي كانولوشني پيشنهاد شده كه در آن اسناد به صورت تنسورهاي سه بعدي به شبكه داده مي‌‌شوند تا بتواند مشكل مذكور را مرتفع نمايد. در نظر گرفتن تنسورهاي سه بعدي امكان يادگيري موقعيت كلمات در جمله را براي مدل فراهم مي‌‌آورد و به نتايج دقيق‌تري در تشخيص اخبار جعل دست مي‌يابد.روش‌‌شناسي: پژوهش حاضر مطالعه‌اي كاربردي بوده كه در آن حدود 42000 اخبار فارسي از شهرهاي مختلف ايران از توييتر جمع‌‌آوري شده و با عمل پيش‌پردازش، داده‌هاي اضافي و غير مفيد حذف و پس از برچسب زدن متون پاك‌سازي شده، متن اخبار جهت رويكرد پيشنهادي با استفاده از نرم‌افزار پايتون پردازش شده‌اند.يافته‌‌ها: برخي از الگوريتم‌‌هاي يادگيري ماشين داراي قدرت بيشتري در مسائل طبقه‌‌بندي بودند، ولي با تغييراتي كه در ساختار الگوريتم شبكه كانولوشن صورت گرفت، نتايج بهتري نسبت به الگوريتم‌‌هاي يادگيري ماشين و ساير الگوريتم‌‌هاي مشابه حاصل شد.نتيجه‌‌گيري: در نظر گرفتن تنسورهاي سه بعدي امكان يادگيري موقعيت كلمات در جمله را براي مدل فراهم مي‌آورد و اين مدل پيشنهادي در مقايسه با رويكردهاي پيشنهادي در ادبيات، دقت قابل توجهي را بدست آورده است. مدل پيشنهادي بدون اضافه كردن سربار اضافي از لحاظ تعداد ويژگي‌ها و عمق شبكه، با تغيير در ورودي توانسته است به نتايج بهتر و قابل قبول از ساير رويكردهاي موجود در ادبيات دست يافته و به دقت و صحّت بيش از 94 درصد دست يابد.
عنوان نشريه :
علوم و فنون مديريت اطلاعات
عنوان نشريه :
علوم و فنون مديريت اطلاعات
لينک به اين مدرک :
بازگشت