شماره ركورد كنفرانس
4726
عنوان مقاله
روشي توزيعپذير جهت يافتن عبارات معادل بينزباني در بستر دادههاي حجيم
پديدآورندگان
هاشمي سيد علي alihashemi@stu.yazd.ac.ir دانشگاه يزد , زارع چاهوكي محمدعلي chahooki@yazd.ac.ir دانشگاه يزد , قاسمزاده محمد m.ghasemzadeh@yazd.ac.ir دانشگاه يزد , نظارات امين aminnezarat@gmail.com دانشگاه آزاد اسلامي يزد
تعداد صفحه
6
كليدواژه
بازيابي اطلاعات دوزبانه , دادههاي حجيم , ترجمه ماشيني
سال انتشار
1397
عنوان كنفرانس
چهارمين كنفرانس ملي محاسبات توزيعي و پردازش داده هاي بزرگ
زبان مدرك
فارسي
چكيده فارسي
متون منتشرشده در اينترنت به زبانهاي مختلف نوشتهشدهاند. در حال حاضر توانايي سيستمهاي بازيابي اطلاعات براي جستجوي اطلاعات بينزباني ضعيف است. يكي از بزرگترين موانع اين كار، عدم تطبيق لفظبهلفظ كلمات در زبانهاي مختلف است. به عبارت ديگر ممكن است دو عبارت در دو زبان مختلف هممعني باشند ولي هيچ شباهت تحتاللفظياي نداشتهباشند. در اين مقاله با كمك پيكرههاي يكزبانه و دوزبانه، عبارات معادل در زبانهاي انگليسي و فارسي شناسايي ميشوند. روش ارائهشده قابليت توزيعپذيري دارد. با افزايش حجم پيكرهها بدون افت كارايي كيفيت خروجي بهبود خواهديافت. آزمايش و بررسي اصطلاحات معادل در دادههايي از متون فارسي، انگليسي و تركيبي كه هر متن معادل آن در زبان ديگر نيز وجود دارد، بيانگر دقّت مناسب اين روش است. اين روش به زبان اسكالا پيادهسازيشده و قابلتعميم به زبانهاي ديگر است.
كشور
ايران
لينک به اين مدرک