شماره ركورد كنفرانس :
4418
عنوان مقاله :
طراحي و پياده سازي سيستم تصحيح املا در زبان كردي با استفاده از روش كد گذاريsoundex
پديدآورندگان :
بزرگ پناه ئاسو دانشگاه كردستان , اخلاقيان فردين دانشگاه كردستان , بارخدا وفا دانشگاه صنعتي كرمانشاه
كليدواژه :
تشخيص خطا , تصحيح خطا , سيستم كنترل خطا , روش كد گذاري Soundex
عنوان كنفرانس :
يازدهمين كنفرانس سراسري سيستم هاي هوشمند
چكيده فارسي :
اگرچه براي تشخيص و تصحيح خطا تا كنون الگوريتم هاي زيادي پيشنهاد شده است ولي در اين ميان الگوريتم هايي كه از روشهاي كد گذاري استفاده مي كنند جايگاه ويژهاي دارند. روش كد گذاري Soundex يكي از شناخته شده ترين و پركاربردترين الگوريتم هاي كد گذاري است كه بويژه در زبان هايي كه نظام آوايي خاصي دارند، همچون انگليسي، مفيد واقع شده است. با توجه به نحوه كد گذاري در اين روش و همچنين ساختار ويژه زبان كردي، ميتوان از اين الگوريتم به شكل مناسب در سيستم تصحيح گر املاي كردي استفاده كرد و درصد بالايي از خطاهاي نوشتاري در اين زبان را شناسايي و تصحيح نمود. اساس كد گذاري soundex بر پايه نحوه تلفظ كردن همخوان هاست. در اين روش به چهار همخوان اول مطابق جدول از پيش تعريف شده اي، كد تعلق گرفته در حالي كه به واكه ها هيچ كدي تعلق نمي گيرد. شناسايي و تصحيح خطا بر اساس كد تعلق گرفته به كلمه و مقايسه با كدهاي موجود در پايگاه داده است. مطابق با آمارها و مطالعاتمان، 85.54 درصد از كل خطاهاي موجود در متون كردي مربوط به واكه ها و چند همخوان ويژه زبان كردي مي باشد؛ بدين معنا كه در كلمات مختلف، واكه ها و آن چند همخوان كه شيوه نگارش آنها به هم نزديك است، به اشتباه به جاي همديگر مورد استفاده قرار مي گيرند. بنابراين با استفاده از روش soundex درصد بسيار قابل توجهي از خطاها را مي توان اصلاح نمود. نتايج شبيه سازي ها نشان مي دهد كه 94.36 درصد از كل خطاها با استفاده از اين روش قابل اصلاح مي باشد