شماره ركورد كنفرانس :
2139
عنوان مقاله :
پياده سازي يك سيستم كنترل خطاي املايي در زبان فارسي بر اساس كدگذاري Soundex
پديدآورندگان :
بهرام پور انور نويسنده , اخلاقيان طاب فردين نويسنده , سجادي جلال نويسنده , بارخدا وفا نويسنده
كليدواژه :
سيستم كنترل خطا , روش كدگذاري soundex , تشخيص خطا , تصحيح خطا
عنوان كنفرانس :
نخستين كنفرانس بين المللي پردازش خط و زبان فارسي
چكيده فارسي :
در بسیاری از كاربردها مانند پردازشگرهای متن، موتورهای جستجو، لغت نامه های الكترونیك، كاربردهای تلفن همراه و ... عمل كنترل املا بخشی از عملكرد كلی سیستم بشمار می رود. از آنجا كه كارایی الگوریتم های موجود در زبان های مختلف متفاوت بوده و این راهكارها نیازمند تعریف ساختارها و الگوریتم های متناسب با زبان است، بررسی ساختارها و الگوریتم های كنترل املا در زبان فارسی نیز بسیار ضروری است. در این مقاله انواع خطاهای املایی، ساختار سیستم های كنترل املا و تعدادی از الگوریتم های مورد استفاده در تشخیص و تصحیح خطاهای املایی بررسی شده است. سپس با تعریف یك سیستم كدگذاری بر اساس روش Soundex برای زبان فارسی، یك سیستم كنترل املا در زبان فارسی با كارایی قابل قبول پیاده سازی شده است. سیستم پیشنهادی برای ذخیره كردن لغات در فرهنگ لغت از درخت B استفاده می نماید.
شماره مدرك كنفرانس :
4474716