عنوان مقاله :
برچسبگذاري خودكار فراگفتمان موضعگيري مقالات علمي فارسي با استفاده از يادگيري عميق
پديد آورندگان :
قيومي ، مسعود پژوهشگاه علوم انساني و مطالعات فرهنگي , عبدالهپور ، محمدمهدي دانشگاه صنعتي اميركبير - دانشكده مهندسيكامپيوتر
كليدواژه :
فراگفتمان موضعگيري , بازنمايي معنايي , ورد2وك , برت , نشانهگذاري پيكره زباني
چكيده فارسي :
در تحليل فراگفتماني روابط بين نويسنده، خواننده و خود متن بررسي ميشود. هايلند (2005) شيوهاي از تحليل را مطرح كرد كه نوعي رابطه تعاملي بين اين سه ركن متن ايجاد ميكند. روابط فراگفتمان تعاملي به دو دسته موضعگيري و مشاركتي تقسيم ميشود. فراگفتمان موضعگيري با پنج نوع نشانگر نشانهگذاري ميشود. هدف از انجام اين پژوهش اين است كه به مدل رايانشي دست يافت تا بهصورت خودكار امكان برچسبگذاري فراگفتماني نشانگرها، خواه واژهها يا عبارات، ميسر گردد. براي رسيدن به هدف، ابتدا بهواسطه خزش پيكرهاي از چكيده مقالات موجود در پرتال جامع علوم انساني بهدست آمد و كار نشانهگذاري فراگفتمان موضعگيري چكيدهها كه متعلق به 16 حوزه علوم انساني بود بر اساس نظر فراگفتمان تعاملي هايلند (2005) نشانهگذاري شد. در اين فرايند 50 چكيده براي هر حوزه نشانهگذاري شد. از اين داده براي آموزش مدل پردازشي استفاده شد. در اين پژوهش، يك مدل با استفاده از بازنمايي معنايي واژهها در فضاي برداري ساخته شده توسط ورد2وك تهيه شده است و در دو مدل ديگر از بازنمايي معنايي مبتني بر برت بهنامها پارسبرت و ايكس.ال.ام-روبرتا استفاده شده است تا بافتهاي جايگاهي متنوعتري از واژهها در بردارها لحاظ گردد. مدلها در سطح واژه يا عبارت كار برچسبگذاري را انجام داده است. براساس نتايج عملي بهدستآمده، مدل مبتنيبر بازنمايي برت با تفاوت معناداري بهتر از مدل مبتني بر بازنمايي ورد2وك عمل نمود. از ميان دو مدل مبتني بر بازنمايي برت، در مجموع برچسبگذاري در سطح واژه و عبارت، مدل ايكس.ال.ام-روبرتا با 82.82 درصد امتياز F در سطح واژه و 51.81 درصد امتياز F در سطح عبارت كارايي بهتري نسبتبه مدل پارسبرت بهدست آورد.
عنوان نشريه :
پژوهش هاي زبان شناسي تطبيقي
عنوان نشريه :
پژوهش هاي زبان شناسي تطبيقي