شماره ركورد كنفرانس :
4379
عنوان مقاله :
ترجمه ماشيني آماري با استفاده از برچسب هاي كم عمق نحوي
پديدآورندگان :
سلامي شهرام sh_salami@sbu.ac.ir دانشگاه شهيد بهشتي، دانشكده مهندسي و علوم كامپيوتر , شمس فرد مهرنوش m-shams@sbu.ac.ir دانشگاه شهيد بهشتي، دانشكده مهندسي و علوم كامپيوتر
كليدواژه :
ترجمه ماشيني آماري , مدل سلسله مراتبي , برچسب كلمه , برچسب قطعه
عنوان كنفرانس :
هشتمين كنفرانس فناوري اطلاعات و دانش
چكيده فارسي :
اين مقاله مدل سلسله مراتبي جديدي را براي ترجمه ماشيني آماري پيشنهاد مي دهد كه غيرپايانه ها را با تطابق مرز عبارات مقصد با برچسب هاي كم عمق نحوي در سمت مقصد پيكره آموزش، نام گذاري مي كند. در جايي كه برچسبي براي كل عبارت موجود نباشد، نام غيرپايانه از اتصال برچسب هاي مرزي تعريف مي شود. برچسب گذاري با كلاس كلمات مرزي عبارات قبلا معرفي گرديده است كه مي تواند شكل مبناي مدل پيشنهادي درنظر گرفته شود. ما اين شكل مبنا را در مقاله حاضر با استفاده از برچسب قطعات توسعه مي دهيم. در اين توسعه، اگر برچسب قطعه در مرز عبارت وجود نداشته باشد، از برجسب POS كلمه مرزي استفاده مي شود. با استفاده از برچسب عبارات به جاي كلاس كلمات، قواعد مدل پيشنهادي تعميم داده مي شود. تعدادي آزمايش در ترجمه فارسي به انگليسي انجام شد. با استفاده از معيار BLEU در قياس با مدل SAMT كه از درخت تجزيه نحوي براي برچسب گذاري استفاده مي كند، مدل پيشنهادي بهبود قابل توجهي به دست آورد.