شماره ركورد كنفرانس :
2139
عنوان مقاله :
معرفي روشي جديد در سيستم هاي پردازش زبان فارسي با استفاده از اصول دستوري
پديدآورندگان :
شيرواني پريسا نويسنده , زمان محمد اسماعيل نويسنده , يغمايي خشايار نويسنده
كليدواژه :
برچسب زني مؤلفه ها , جملات بالقوه معني دار , مدل زباني بايگرام , تشخيص جملات فارسي , شبه كلمات , پردازش زبان هاي طبيعي , بازشناسي متن
عنوان كنفرانس :
نخستين كنفرانس بين المللي پردازش خط و زبان فارسي
چكيده فارسي :
بازشناسی متون یكی از موضوعات تحقیقاتی در حال رشد در سال های اخیر است. تاكنون الگوریتم های زیادی به این منظور ارائه و پیشنهاد شده اند كه بر بازشناسی شبه كلمات یا حروف متمركز بوده اند. در این مقاله از تركیب دو شاخه علمی پردازش تصاویر و پردازش زبان های طبیعی، یك الگوریم سه مرحله ای به منظور بازشناسی متون فارسی بر مبنای بازشناسی جملات فارسی ارائه می شود. این روش شامل مراحل استخراج شبه كلمات، ساخت كلمات و سپس جملات بالقوه معنی دار و در نهایت استفاده از مدل زبانی بایگرام و چند قاعده گرامری به منظور تشخیص جمله صحیح بر اساس انطباق با گرامر رایج زبان فارسی می باشد. آزمایشات متعدد نشان داد دقت روش ارائه شده برای مرحله استخراج شبه كلمات برابر 92 درصد، برای ساخت كلمات و سپس جملات بالقوه معنی دار 98 درصد و برای تشخیص جمله صحیح با استفاده از مدل زبان بایگرام 80 درصد است.
شماره مدرك كنفرانس :
4474716