شماره ركورد كنفرانس :
3858
عنوان مقاله :
فهم: تشخيصگر اختصارات زبان فارسي
پديدآورندگان :
فيضي درخشي محمدرضا mfeizi@tabrizu.ac.ir دانشيار دانشگاه تبريز , هدايتي آرش Hedayati.arash1361@gmail.com كارشناس ارشد موسسه آموزش عالي نبياكرم(ص) , محمديان مهديه دانشگاه اروميه
كليدواژه :
تشخيص جمله و كلمه , پردازش زبان طبيعي , اختصارات , زبان فارسي
عنوان كنفرانس :
دومين همايش ملي زبان فارسي و اينترنت
چكيده فارسي :
از ديرباز استفاده از اختصارات براي تسريع و تسهيل در ارتباط گفتاري و نوشتاري در زبانهاي مختلف مرسوم بوده است؛ در زبان فارسي نيز همگام با ساير زبانهاي دنيا استفاده از اختصارات و آغازهها به عنوان ابزاري جهت تقويت زبان مرسوم است. شناخت چنين واژههايي گاه براي انسان دشوار است. چراكه فهم صحيح منظور گوينده/ نويسنده از اختصارات بستگي به آگاهي مخاطب از معادل كلمات اختصاري دارد. با توجه به اينكه وجود چنين كلماتي در متن چالشهايي براي پژوهشگران حوزه پردازش زبان طبيعي ايجاد كرده است در اين مقاله سعي شده با بهرهگيري از يك پيكره محقق ساخته، اختصارات موجود در متن شناسايي شوند تا در مراحل مختلف پردازش با ساير كلمات يكسان در نظر گرفته نشود.