عنوان :
طراحي سامانه برچسبدهي به اجزا كلام براي متون فارسي
شرح پديد آور/مجري (مجريان) طرح :
الهام علايي ابوذر
شناسه هاي افزوده :
عاصي، مصطفي ناظر فني , شيراني، فرهاد ناظر فني , شمسي، ميترا ناظر فني
چكيده فارسي :
در پژوهش حاضر به اين مسئله پرداخته شد كه آيا با رفع ابهام از برچسب نحوي همنگارههاي اسمي و صفتي مختوم به «-ي»، كه فراواني بالايي در پيكرههاي متني فارسي دارند، كارايي يك سيستم برچسبزني خودكار، افزايش مييابد و در نهايت ميتوان سامانهاي طراحي كرد كه عمل برچسبدهي خودكار را با در نظر گرفتن رفع ابهام از برچسب همنگارههاي اسمي و صفتي مختوم به «-ي» در فارسي، با كارايي بهتري انجام دهد؟ سيستم مورد مطالعه در پژوهش حاضر، سيستم «هضم» بود. در پژوهش حاضر، نرمافزاري جهت رفع ابهام از برچسب نحوي همنگارههاي اسمي و صفتي مختوم به «-ي» در فارسي، تهيه شد كه خود مبتني بر الگوهاي حساس به بافت نحوي است كه بر اساس اين الگوها ميتوان برچسب درست را به همنگارهاي مذكور اختصاص داد. ارزيابي كلي نرمافزار تهيه شده جهت رفع ابهام از برچسب نحوي همنگارههاي اسمي و صفتي مختوم به «-ي» در فارسي، نشان ميدهد اگر تنها الگوهاي حساس به بافت نحوي كه تاثير مثبت در برچسبزني داشتهاند را به برچسبزن «هضم» اضافه كنيم، صحت (Accuracy) كلي برچسبزن 95.691 درصد ميشود كه 1.34 درصد نسبت به حالتي كه از تمام الگوهاي حساس به بافت نحوي استفاده شود، بالاتر است. اين مسئله در تهيه سامانه برچسبگذاري اجزاي كلام لحاظ شد و گزينهاي تحت عنوان «رفع ابهام» در سامانه در نظر گرفته شد. سامانه برچسبگذاري اجزاي كلام، امكان وارد كردن متون گوناگون فارسي، برچسبگذاري مقولهاي كلمات تشكيلدهنده متون، مشاهده فهرست كلمات برچسبخورده همراه با فراواني آن كلمات در متن، مشاهده فراواني برچسبها در متن، مشاهده فهرست اسمها به ترتيب فراواني آنها در متن، رفع ابهام از برچسب برخي از همنگارههاي اسمي و صفتي فارسي و دريافت خروجي هر كدام از فهرستها را فراهم ميآورد
كليدواژه :
برچسبگذاري اجزا واژگاني كلام , پردازش زبان طبيعي , همنگارهها , رفع ابهام از برچسب نحوي همنگارههاي اسمي و صفتي مختوم به «-ي» , سامانه برچسبدهي به اجزاي كلام در فارسي
سرشناسه :
علايي ابوذر، الهام
اطلاعات نشر :
تهران پژوهشگاه علوم و فناوري اطلاعات ايران(ايرانداك)
مشخصات ظاهري :
84ص.، جدول، نمودار.