كليدواژه زبان طبيعي :
بازيابي اطلاعات , بازيابي اطلاعات بين زباني , ماشين ترجمه , جعبه شيشه اي , جعبه سياه , بلو , ميانگين دقت متوسط , ويژوال استوديو
چكيده :
در سال هاي اخير، با افزايش رشد توليد اطلاعات در فضاي اينترنتي، عمليات بازيابي اطلاعات منحصر به زبان انگليسي انجام نمي پذيرد و نياز به كسب اطلاعات در زبان هاي مختلف باعث به وجود آمدن ابزاري به نام نظام بازيابي اطلاعات بين زباني گرديد. مهمترين انگيزه طراحي و ساخت چنين نرم افزارهايي، رفع موانع زباني كاربراني است كه قصد دارند به جز زبان مادري خود در زبانهاي ديگر نيز به جستجو و بازيابي اطلاعات بپردازند، مي باشد. مركز منطقه اي اطلاع رساني علوم و فناوري از زمان تأسيس، پايگاه هاي فارسي و انگليسي مختلفي را توليد نموده است. كاربران غير فارسي به دليل عدم آشنايي با زبان فارسي تنها قادر به استفاده از پايگاه هاي انگليسي اين مركز مي باشند و طبيعتا از منابع غني فارسي اين مركز بي بهره خواهند بود، لذا بايد امكاني فراهم گردد تا اين كاربران بتوانند از منابع فارسي اين نهاد نيز استفاده نمايند. بر اين اساس، هدف از انجام پژوهش حاضر اين بود كه با طراحي يك نرم افزار بازيابي اطلاعات بين زباني به نام «رايسست كيوترنسليت» و تلفيق اين نرم افزار در نظام رايسست، امكاني فراهم گردد تا كاربران غير فارسي زبان نيز بتوانند از منابع فارسي رايسست استفاده كنند. جهت طراحي اين حدود 15000 عنوان و چكيده مقاله فارسي و انگليسي (معادل يكديگر) به عنوان داده ماشين ترجمه و به روش تصادفي از پايگاه اطلاعاتي رايسست استخراج گرديد. پس از انتخاب داده پژوهش، نظام پيشنهاد پرس و جو و ماشين ترجمه طراحي گرديد. نظام پيشنهاد پرس و جو كاربران را قادر مي سازد تا از ميان گزينه هاي پيشنهاد شده گزينه مورد نظر خود را انتخاب نمايند. رمز گشاي اين نظام نيز توسط بسته برنامه نويسي ويژوال استوديو ساخته شد. سپس، نظام ترجمه پرس وجو با استفاده از يك الگوريتم جديد طراحي گرديد، و پس از آن نيز، با به كارگيري API ماشين ترجمه گوگل ترنسليت، ماشين ترجمه فارسي به انگليسي طراحي و به نرم افزار اضافه شد. اين قسمت عناوين اسناد بازيابي شده را جهت كمك بيشتر به كاربران غير فارسي زبان از فارسي به انگليسي ترجمه مي كند. رايسست كيوترنسليت با استفاده از دو روش معمول جعبه شيشه اي و جعبه سياه مورد ارزيابي قرار گرفت. در مدل جعبه شيشه اي، ماشين ترجمه با در نظر گرفتن دو معيار بلو مورد ارزيابي قرار گرفت. در مدل جعبه سياه، نتيجه كلي نظام رايسست كيوترنسليت با معيار ميانگين دقت متوسط و با استفاده از داده استاندارد پزشكي ترك، سنجيده شد، كه با توجه به نمره بدست آمده براي نظام بازيابي اطلاعات تك زبانه (0/54) و رايسست كيوترنسليت (0/41)، عملكرد رايسست كيوترنسليت حدود 75% شبيه به عملكرد نظام بازيابي اطلاعات تك زبانه ارزيابي شد. با توجه به تحليل هاي انجام شده مي توان نتيجه گرفت كه نظام رايسست كيوترنسليت و الگوريتم پيشنهادي ترجمه پرس و جو به صورت خاص، عملكرد قابل قبولي داشته اند.