شماره ركورد كنفرانس
3752
عنوان مقاله
يك مدل بازنمايي برداري واژگان براي ترجمهي ماشيني انگليسي به فارسي با استفاده از يادگيري ژرف
پديدآورندگان
افسر ليلا afsar931@atu.ac.ir دانشجو، علوم رياضي و رايانه، دانشگاه علامه طباطبايي، تهران , كتانفروش سيد علي a_katanforosh@sbu.ac.ir استاديار، گروه علوم كامپيوتر، دانشگاه شهيد بهشتي، تهران , اصغري اسكوئي محمدرضا oskoei@atu.ac.ir استاديار، علوم رياضي و رايانه، دانشگاه علامه طباطبايي، تهران
تعداد صفحه
6
كليدواژه
بازنمايي برداري واژگان , Word2Vec , ترجمهي ماشيني عصبي , يادگيري عميق , پردازش زبان طبيعي
سال انتشار
1395
عنوان كنفرانس
اولين كنفرانس بين المللي مهندسي و علوم كامپيوتر
زبان مدرك
فارسي
چكيده فارسي
يادگيري عميق رويكرد جديدي در زمينهي يادگيري ماشين است. يادگيري عميق ديدگاه نويني براي ترجمهي ماشيني فراهم كرده است. اين ديدگاه به ترجمهي ماشيني عصبي معروف است. آموزش يكپارچهي اين سيستمها براي ترجمهي ماشيني انگليسي به فارسي، نياز به پيكرهي متني موازي بزرگ دارد. متاسفانه در زبان فارسي چنين پيكرهي متني بزرگي در دسترس نيست. بهعنوان يك راهحل جايگزين، دادهي متني بزرگ فارسي، براي بازنمايي برداري واژگان جمعآوري شد. براي بازنمايي برداري واژگان از روش Word2Vec استفاده شد. دو پارامترِ بُعد فضاي برداري و حجم مجموعه دادگان در بازنمايي برداري واژگان در روش Word2Vec تاثير داشتند. مجموعه تستي براي ارزيابي بازنمايي برداري واژگان با استفاده از معيار شباهت كسينوسي ارائه شد. بردارهاي بهدستآمده از روش Word2Vec روي مجموعه تست تعريفشده براي زبان فارسي، ازلحاظ شباهت معنايي و نحوي واژگان عملكرد قابلتوجهي به نمايش گذاشت.
كشور
ايران
لينک به اين مدرک