شماره ركورد كنفرانس :
144
عنوان مقاله :
شناسايي جملات هم ترجمه با استفاده از طبق هبند آنتروپي بيشينه
پديدآورندگان :
زاري عليمه نويسنده , صدرالديني محمدهادي نويسنده دانشكده مهندسي- دانشگاه شيراز
تعداد صفحه :
6
كليدواژه :
طبقه بند آنتروپي بيشينه , پيكره موازي , همترازي در سطح كلمه , جفت جمله موازي , ترجمه ماشيني آماري
عنوان كنفرانس :
مجموعه مقالات دوازدهمين كنفرانس سيستم هاي هوشمند ايران
زبان مدرك :
فارسی
چكيده فارسي :
منبع اصلي رويكردهاي رايج امروزي در ترجمه ماشيني، متون دوزبانه در اندازه هاي بسيار بزرگ است كه اصطلاحا پيكره موازي خوانده مي شوند. اما اكثر زبان هاي طبيعي با كمبود پيكره هاي موازي روبه رو هستند. بنابراين تلاش براي ساخت پيكره ها ي موازي بيش تر همچنان يك ضرورت مهم در حوزه ترجمه ماشيني محسوب مي شود. شناسايي جملات ه م ترجمه كه جملات موازي نيز خوانده مي شوند، ركن مشترك در اكثر تلاش ها براي ساخت خودكار پيكره هاي موازي است. ما در اينجا از طبقه بند آنتروپي بيشينه جهت شناسايي جملات هم ترجمه استفاده مي كنيم. همچنين براي اين طبقه بند از ويژگي هاي عمومي جمله و ويژگي ها ي مبتن ي بر انجام Giza++ همترازي در سطح كلمه بين دو جمله استفاده مي كنيم. همترازي در سطح كلمه جملات با استفاده از ابزار متن باز مي شود. اين ويژگي ها به تفكيك شرح داده مي شوند و تأثيري كه بر نتيجه طبقه بند مي گذارند، بررسي مي شود. نتايج ارزيابي نشان مي دهد كه طبقه بند آنتروپي بيشينه طراحي شده مي تواند با دقت بالايي جملات را به جملات موازي و جملات غير موازي طبقه بند ي كند.
شماره مدرك كنفرانس :
3817034
سال انتشار :
2014
از صفحه :
1
تا صفحه :
6
سال انتشار :
0
لينک به اين مدرک :
بازگشت