شماره ركورد كنفرانس :
5133
عنوان مقاله :
بهبود عملكرد ترجمه ماشيني عصبي به كمك پالايش پيكره هاي شبه موازي
پديدآورندگان :
صباغ جعفري مجتبي دانشگاه ولي عصر رفسنجان , رمضاني سربندي سجاد دانشگاه ولي عصر رفسنجان
تعداد صفحه :
19
كليدواژه :
ترجمة ماشيني عصبي , پيكرة موازي , شبكة عصبي
سال انتشار :
1400
عنوان كنفرانس :
دومين همايش ملي هوش مصنوعي و محاسبات نرم
زبان مدرك :
فارسي
چكيده فارسي :
باالبردن كيفيت ترجمةماشينيعصبي، نيازمند آموزش آن، با استفاده از جفتپيكرههايموازي بزرگ ميباشد.بسياري از جفت زبانها مانند فارسي و انگليسي، پيكرههاي بزرگي كه مناسب براي آموزش ماشينترجمةعصبي باشد،ندارند. در اين جفت زبان، پيكرة با كيفيت محدود است و يكي ازبا كيفيتترين آنها پيكرة اميركبير استكه تنها ۵۷۵۵۹۲جفتجمله دارد.پيكرههاي ديگري نيز وجود دارد كه ازكيفيت الزم براي استفاده در آموزش مدلهايترجمةعصبي برخوردار نيستند كه به آنها پيكرةشبهموازي ميگوييم. استفاده از پيكرههايشبهموازي در آموزش مدل، كيفيت ترجمه را پايين ميآورد. در اين مقاله در راستاي افزايش كارايي مدلهايترجمه، مبتني بر شبكههايعصبي از روش تصفية پيكرههايشبهموازي استفاده ميكنيم. روش تصفيه جمالت بدين صورت است كه ابتدا يك طرف جمالت پيكرهشبهموازي به طرف دوم ترجمه شده سپس با استفاده از معيارهاي شباهت دو جمله موازي، جمالت تصفيه ميشوند و مدلهاي ترجمة توليد شده را ارزيابي ميكنيم. در روش ديگر براي تصفيه مستقيم، جمالت بدون ترجمه يك طرف به طرف ديگر، از يك شبكةعصبي جهت نگاشت بردارهاي كلمات انگليسي به يك فضاي بردار جديد استفاده كرده و سپس معيارهاي شباهت را بين جمله فارسي و جفت انگليسي آن اعمال ميكنيم. در تمام روشهاي پيشنهادي حد آستانة ميانگين را براي استخراج جمالت باكيفيت درنظر ميگيريم.پيكرههاي ميزان و انصاري را با يكديگر تركيب و سپس تصفيه براي جمالت آن انجام ميشود. ابتدا با پيكرةموازي اميركبير، يك مدل ترجمةعصبي بنام 1 مدل ترجمة اميركبير ايجاد ميكنيم. مقدار بلو در اضافه كردن تصادفي ۵0/30 شده و در روشهاي تصفيهاي كه انجام داديم توانستيم مدلهاي ترجمة باكيفيتتري توليد كنيم. باكيفيتترين مدل ترجمة نهايي در آزمايشات،مقدار بلو برابر0۷/31 به خودش اختصاص داد كه با توجه به افزايش تعداد جمالت و گسترش دايرة لغات آموزشي براي مدل، از كيفيت قابل قبولي برخوردار است.
كشور :
ايران
لينک به اين مدرک :
بازگشت