شماره ركورد كنفرانس :
3860
عنوان مقاله :
بهبود تصحيح غلط املايي در زبان كردي با تغيير وزندهي در كمترين فاصله ويرايشي
پديدآورندگان :
اماني آرش arash.amani@srbiau.ac.ir دانشگاه آزاد واحد علوم و تحقيقات تهران , كوچاري عباس koochari@srbiau.ac.ir دانشگاه آزاد واحد علوم و تحقيقات تهران
تعداد صفحه :
6
كليدواژه :
زبان كردي , تصحيح خودكار , كمترين فاصله ويرايشي , كد گذاري Sounde
سال انتشار :
1396
عنوان كنفرانس :
دومين كنفرانس ملي محاسبات نرم
زبان مدرك :
فارسي
چكيده فارسي :
در اين مقاله روشي براي تصحيح خودكار غلط هاي املايي زبان كردي ارائه شده است. در روش پيشنهادي از Soundex براي كد گذاري كلمات و پيشنهاد كلمات كانديد براي تصحيح غلط املايي استفاده شده است. براي اولويت دادن به كلمات پيشنهادي نخست فاصله ويرايشي لونشتاين به كار گرفته شد، سپس با تغيير در هزينه ي جايگزيني حروف ويژه ي زبان كردي نرخ تصحيح خطا و كارايي سيستم افزايش داده شد. براي آزمودن الگوريتم ارائه شده يك مجموعه آزمون با تعداد 399 كلمه داراي خطاي املايي جمع آوري گرديده است. براي ايجاد فرهنگ لغات كردي، گزينش كلمات براساس تعداد تكرار و قواعد زباني انجام گرفته تا از قرارگيري واژه ي نامعتبر در فرهنگ لغات جلوگيري شود. روش پيشنهادي نسبت به روشهاي عمومي براي ديگر زبان ها مانند لونشتاين در نرخ تصحيح خطا 3.76 درصد بهبود داشته و وجود كلمه ي درست در اولين پيشنهاد 10.03درصد بهبود يافته است.
كشور :
ايران
لينک به اين مدرک :
بازگشت