شماره ركورد كنفرانس :
3858
عنوان مقاله :
يك مدل تركيبي براي تبديل متن پينگليش به متن فارسي
پديدآورندگان :
بي جن خان محمود mbjkhan@ut.ac.ir استاد دانشگاه تهران , بختياري فرزانه دانشگاه تهران
كليدواژه :
پينگليش , بازشناسي , نگاره , واج , لاتيننويسي
عنوان كنفرانس :
دومين همايش ملي زبان فارسي و اينترنت
چكيده فارسي :
هدف از اين مقاله معرفي يك مدل تركيبي قاعده -بنياد و احتمالاتي براي تبديل متن پينگليش به متن فارسي است. مقالۀ حاضر تلاشي است براي دستيابي به قواعد نگاشت در تبديل متون پينگليش به خط فارسي. براي اين منظورحدود سيزده هزار كلمه پينگليش به همراه معادل فارسي آنهابا دقت بررسي شد و براساس قواعد آزاد از بافت و حساس به بافتِ يك به يك و يك به چندِ حروف پينگليش به نگاره هاي خط فارسي و با استفاده از يك واژگان فارسي كه حاوي تكواژهاي تصريفي باشد و همچنين استفاده از يك مدل زباني سه كلمه اي كه از يك پيكرۀ بزرگ متني فارسي بدست آمده باشد، مي توان كلمات موجود در متن پينگليش را با دقت بالايي به كلمات فارسي تبديل كرد