عنوان مقاله :
ارائه رويكرد تنسور سه بعدي براي طبقهبندي و تشخيص اخبار جعلي: مطالعه موردي اخبار فارسي در حوزه كرونا ويروس
پديد آورندگان :
متقي ، وحيد دانشگاه آزاد اسلامي واحد قشم - گروه مديريت فناوري اطلاعات , اسماعيلي ، مهدي دانشگاه آزاد اسلامي واحد كاشان - گروه علوم كامپيوتر , بازايي ، قاسمعلي دانشگاه آزاد اسلامي واحد تهران مركزي - گروه مديريت , افشاركاظمي ، محمدعلي دانشگاه آزاد اسلامي واحد تهران مركزي - گروه مديريت
كليدواژه :
پردازش زبان طبيعي , طبقهبندي متن , شبكههاي عصبي كانولوشني , تنسور سه بعدي , اخبار جعلي , اخبار فارسي , كرونا ويروس
چكيده فارسي :
هدف: هدف پژوهش حاضر اختصاص يكي از كلاسهاي جعل و واقعي به متنهاي آزاد ميباشد. شبكههاي عصبي كانولوشني به عنوان يكي از مهمترين مدلهاي يادگيري عميق، دقت بالايي را بر روي اين مسائل بدست آورده است. در اين تحقيق آناليز متن در سطح جمله و بهبود عملكرد شبكه عصبي كانولوشني جهت تشخيص اخبار جعلي مورد توجه بوده است. در اﯾﻦ ﺷﺒﮑﻪﻫﺎ ﮐﻠﻤﺎت ﺑﻪ ﺻﻮرت ﮐﯿﺴﻪاي از ﮐﻠﻤﺎت ﺑﻪ ﻣﺪل داده ﻣﯽﺷﻮﻧﺪ ﮐﻪ ﻫﺮ ﮐﻠﻤﻪ ﺑﺎ ﺗﻮﺟﻪ ﺑﻪ ﻓﻀﺎي ﺑﺮداري ﺑﻪ ﻣﺎﺗﺮﯾﺲﻫﺎي دو ﺑﻌﺪي ﺗﺒﺪﯾﻞ ﻣﯽﺷود. يكي از محدوديتهاي شبكههاي كانولوشن اين است كه در سطح كلمه كار كرده و نميتواند رابطه و فاصله بين جملات را در نظر بگيرد و آﻧﺎﻟﯿﺰ در ﺳﻄﺢ ﺟﻤﻠﻪ مشكل اساسي در اين تحقيق ميباشد. در اين پژوهش يك مدل پايهاي مبتني بر شبكههاي كانولوشني پيشنهاد شده كه در آن اسناد به صورت تنسورهاي سه بعدي به شبكه داده ميشوند تا بتواند مشكل مذكور را مرتفع نمايد. در نظر گرفتن تنسورهاي سه بعدي امكان يادگيري موقعيت كلمات در جمله را براي مدل فراهم ميآورد و به نتايج دقيقتري در تشخيص اخبار جعل دست مييابد.روششناسي: پژوهش حاضر مطالعهاي كاربردي بوده كه در آن حدود 42000 اخبار فارسي از شهرهاي مختلف ايران از توييتر جمعآوري شده و با عمل پيشپردازش، دادههاي اضافي و غير مفيد حذف و پس از برچسب زدن متون پاكسازي شده، متن اخبار جهت رويكرد پيشنهادي با استفاده از نرمافزار پايتون پردازش شدهاند.يافتهها: برخي از الگوريتمهاي يادگيري ماشين داراي قدرت بيشتري در مسائل طبقهبندي بودند، ولي با تغييراتي كه در ساختار الگوريتم شبكه كانولوشن صورت گرفت، نتايج بهتري نسبت به الگوريتمهاي يادگيري ماشين و ساير الگوريتمهاي مشابه حاصل شد.نتيجهگيري: در نظر گرفتن تنسورهاي سه بعدي امكان يادگيري موقعيت كلمات در جمله را براي مدل فراهم ميآورد و اين مدل پيشنهادي در مقايسه با رويكردهاي پيشنهادي در ادبيات، دقت قابل توجهي را بدست آورده است. مدل پيشنهادي بدون اضافه كردن سربار اضافي از لحاظ تعداد ويژگيها و عمق شبكه، با تغيير در ورودي توانسته است به نتايج بهتر و قابل قبول از ساير رويكردهاي موجود در ادبيات دست يافته و به دقت و صحّت بيش از 94 درصد دست يابد.
عنوان نشريه :
علوم و فنون مديريت اطلاعات
عنوان نشريه :
علوم و فنون مديريت اطلاعات