شماره ركورد كنفرانس :
2139
عنوان مقاله :
استفاده از بازآرايي نحوي جهت بهبود ترجمه ماشيني آماري انگليسي به فارسي
پديدآورندگان :
سعيدي رضا نويسنده , كاهاني محسن نويسنده , جكيان طوسي احمد نويسنده , بهمدي مقدس بهداد نويسنده
كليدواژه :
ترجمه ماشيني آماري , بازآرايي نحوي , مدل زباني , مدل ترجمه , درخت تجزيه
عنوان كنفرانس :
نخستين كنفرانس بين المللي پردازش خط و زبان فارسي
چكيده فارسي :
ترجمه ماشینی آماری به عنوان یكی از بهترین روش ها برای ترجمه از یك زبان به زبان دیگر شناخته می شود. برای زبان هایی كه از لحاظ ساختار دارای شباهت زیادی به یكدیگر هستند خروجی این مترجم بسیار مناسب می باشد. تفاوت های ساختاری میان زبان انگلیسی و فارسی و همچنین عدم وجود پیكره دوزبانه بزرگ باعث شده است كه این روش برای زبان ترجمه انگلیسی به فارسی ترجمه های مطلوبی را تولید نكند. ما در این مقاله سعی كرده ایم با استفاده از رهیافت بازآرایی كلمات، تا حد ممكن شباهت ساختاری میان عبارات انگلیسی و فارسی را افزایش دهیم. در ادامه تاثیر این عمل را بر روی بهبود نتایج خروجی مورد بررسی قرار داده ایم. به همین منظور ابتدا با كمك درخت تجزیه، مجموعه ای از قوانین بازآرایی استخراج شده است. سپس این قوانین به عنوان یك عمل پیش پردازشی بر روی عبارات انگلیسی اعمال گردیده است. نتایج بررسی ها نشان می دهد كه خروجی مترجم پس از اعمال این روش منجر به بهبود كیفیت ترجمه در معیار BLEU شده است.
شماره مدرك كنفرانس :
4474716