شماره ركورد :
2052
عنوان :
طراحي سامانه برچسب‌دهي به اجزا كلام براي متون فارسي
شرح پديد آور/مجري (مجريان) طرح :
الهام علايي ابوذر
شناسه هاي افزوده :
عاصي، مصطفي ناظر فني , شيراني، فرهاد ناظر فني , شمسي، ميترا ناظر فني
سال نشر :
1397
چكيده فارسي :
در پژوهش حاضر به اين مسئله پرداخته شد كه آيا با رفع ابهام از برچسب نحوي هم‌نگاره‌هاي اسمي و صفتي مختوم به «-ي»، كه فراواني بالايي در پيكره‌هاي متني فارسي دارند، كارايي يك سيستم برچسب‌زني خودكار، افزايش مي‌يابد و در نهايت مي‌توان سامانه‌اي طراحي كرد كه عمل برچسب‌دهي خودكار را با در نظر گرفتن رفع ابهام از برچسب هم‌نگاره‌هاي اسمي و صفتي مختوم به «-ي» در فارسي، با كارايي بهتري انجام دهد؟ سيستم مورد مطالعه در پژوهش حاضر، سيستم «هضم» بود. در پژوهش حاضر، نرم‌افزاري جهت رفع ابهام از برچسب نحوي هم‌نگاره‌هاي اسمي و صفتي مختوم به «-ي» در فارسي، تهيه شد كه خود مبتني بر الگوهاي حساس به بافت نحوي است كه بر اساس اين الگوها مي‌توان برچسب درست را به هم‌نگار‌هاي مذكور اختصاص داد. ارزيابي كلي نرم‌افزار تهيه شده جهت رفع ابهام از برچسب نحوي هم‌نگاره‌هاي اسمي و صفتي مختوم به «-ي» در فارسي، نشان مي‌دهد اگر تنها الگوهاي حساس به بافت نحوي كه تاثير مثبت در برچسب‌زني داشته‌اند را به برچسب‌زن «هضم» اضافه كنيم، صحت (Accuracy) كلي برچسب‌زن 95.691 درصد مي‌شود كه 1.34 درصد نسبت به حالتي كه از تمام الگوهاي حساس به بافت نحوي استفاده ‌شود، بالاتر است. اين مسئله در تهيه سامانه برچسب‌گذاري اجزاي كلام لحاظ شد و گزينه‌اي تحت عنوان «رفع ابهام» در سامانه در نظر گرفته شد. سامانه برچسب‌گذاري اجزاي كلام، امكان وارد كردن متون گوناگون فارسي، برچسب‌گذاري مقوله‌اي كلمات تشكيل‌دهنده متون، مشاهده فهرست كلمات برچسب‌خورده همراه با فراواني آن كلمات در متن، مشاهده فراواني برچسب‌ها در متن، مشاهده فهرست اسم‌ها به ترتيب فراواني آن‌ها در متن، رفع ابهام از برچسب برخي از هم‌نگاره‌هاي اسمي و صفتي فارسي و دريافت خروجي هر كدام از فهرست‌ها را فراهم مي‌آورد
كليدواژه :
برچسب‌گذاري اجزا واژگاني كلام , پردازش زبان طبيعي , هم‌نگاره‌ها , رفع ابهام از برچسب نحوي هم‌نگاره‌هاي اسمي و صفتي مختوم به «-ي» , سامانه برچسب‌دهي به اجزاي كلام در فارسي
سرشناسه :
علايي ابوذر، الهام
اطلاعات نشر :
تهران پژوهشگاه علوم و فناوري اطلاعات ايران(ايرانداك)
مشخصات ظاهري :
84ص.، جدول، نمودار.
كليدواژه - جزئيات :
لينک به اين مدرک :
بازگشت