شماره ركورد كنفرانس
3860
عنوان مقاله
بهبود تصحيح غلط املايي در زبان كردي با تغيير وزندهي در كمترين فاصله ويرايشي
پديدآورندگان
اماني آرش arash.amani@srbiau.ac.ir دانشگاه آزاد واحد علوم و تحقيقات تهران , كوچاري عباس koochari@srbiau.ac.ir دانشگاه آزاد واحد علوم و تحقيقات تهران
تعداد صفحه
6
كليدواژه
زبان كردي , تصحيح خودكار , كمترين فاصله ويرايشي , كد گذاري Sounde
سال انتشار
1396
عنوان كنفرانس
دومين كنفرانس ملي محاسبات نرم
زبان مدرك
فارسي
چكيده فارسي
در اين مقاله روشي براي تصحيح خودكار غلط هاي املايي زبان كردي ارائه شده است. در روش پيشنهادي از Soundex براي كد گذاري كلمات و پيشنهاد كلمات كانديد براي تصحيح غلط املايي استفاده شده است. براي اولويت دادن به كلمات پيشنهادي نخست فاصله ويرايشي لونشتاين به كار گرفته شد، سپس با تغيير در هزينه ي جايگزيني حروف ويژه ي زبان كردي نرخ تصحيح خطا و كارايي سيستم افزايش داده شد. براي آزمودن الگوريتم ارائه شده يك مجموعه آزمون با تعداد 399 كلمه داراي خطاي املايي جمع آوري گرديده است. براي ايجاد فرهنگ لغات كردي، گزينش كلمات براساس تعداد تكرار و قواعد زباني انجام گرفته تا از قرارگيري واژه ي نامعتبر در فرهنگ لغات جلوگيري شود. روش پيشنهادي نسبت به روشهاي عمومي براي ديگر زبان ها مانند لونشتاين در نرخ تصحيح خطا 3.76 درصد بهبود داشته و وجود كلمه ي درست در اولين پيشنهاد 10.03درصد بهبود يافته است.
كشور
ايران
لينک به اين مدرک