مرکز منطقه ای اطلاع رساني علوم و فناوري - برچسب‌گذاري خودكار فراگفتمان موضع‌گيري مقالات علمي فارسي با استفاده از يادگيري عميق

چكيده فارسي :

در تحليل فراگفتماني روابط بين نويسنده، خواننده و خود متن بررسي مي‌شود. هايلند (2005) شيوه‌اي از تحليل را مطرح كرد كه نوعي رابطه تعاملي بين اين سه ركن متن ايجاد مي‌كند. روابط فراگفتمان تعاملي به دو دسته موضع‌گيري و مشاركتي تقسيم مي‌شود. فراگفتمان موضع‌گيري با پنج نوع نشانگر نشانه‌گذاري مي‌شود. هدف از انجام اين پژوهش اين است كه به مدل رايانشي دست يافت تا به‌صورت خودكار امكان برچسب‌گذاري فراگفتماني نشانگرها، خواه واژه‌ها يا عبارات، ميسر گردد. براي رسيدن به هدف، ابتدا به‌واسطه خزش پيكره‌اي از چكيده مقالات موجود در پرتال جامع علوم انساني به‌دست آمد و كار نشانه‌گذاري فراگفتمان موضع‌گيري چكيده‌ها كه متعلق به 16 حوزه علوم انساني بود بر اساس نظر فراگفتمان تعاملي هايلند (2005) نشانه‌گذاري شد. در اين فرايند 50 چكيده براي هر حوزه نشانه‌گذاري شد. از اين داده براي آموزش مدل پردازشي استفاده شد. در اين پژوهش، يك مدل با استفاده از بازنمايي معنايي واژه‌ها در فضاي برداري ساخته ‌شده توسط ورد2وك تهيه شده ‌است و در دو مدل ديگر از بازنمايي معنايي مبتني‌ بر برت به‌نام‌ها پارس‌برت و ايكس.ال.ام-روبرتا استفاده شده ‌است تا بافت‌هاي جايگاهي متنوع‌تري از واژه‌ها در بردارها لحاظ گردد. مدل‌ها در سطح واژه يا عبارت كار برچسب‌گذاري را انجام داده ‌است. براساس نتايج عملي به‌دست‌آمده، مدل مبتني‌بر بازنمايي برت با تفاوت معناداري بهتر از مدل مبتني ‌بر بازنمايي ورد2وك عمل نمود. از ميان دو مدل مبتني ‌بر بازنمايي برت، در مجموع برچسب‌گذاري در سطح واژه و عبارت، مدل ايكس.ال.ام-روبرتا با 82.82 درصد امتياز F در سطح واژه و 51.81 درصد امتياز F در سطح عبارت كارايي بهتري نسبت‌به مدل پارس‌برت به‌دست آورد.