مرکز منطقه ای اطلاع رساني علوم و فناوري - طراحي و پياده‌سازي يك سامانه‌ بازيابي اطلاعات دوزبانه با استفاده از پيكره‌هاي زباني

شماره ركورد :

546453

عنوان مقاله :

طراحي و پياده‌سازي يك سامانه‌ بازيابي اطلاعات دوزبانه با استفاده از پيكره‌هاي زباني

عنوان فرعي :

Designing and Implementing a Cross-Language Information Retrieval System Using Linguistic Corpora

پديد آورندگان :

نظارات، امين نويسنده مهندسي فنّاوري اطلاعات، دانشگاه آزاد اسلامي، واحد يزد , , موسوي ميانگاه ، طيبه نويسنده ,

اطلاعات موجودي :

فصلنامه سال 1390

رتبه نشريه :

علمي پژوهشي

تعداد صفحه :

از صفحه :

197

تا صفحه :

212

كليدواژه :

بازيابي اطلاعات دوزبانه , پيكره‌هاي زباني , ترجمه خودكار , عامل‌هاي هوشمند , معادل‌هاي واژگاني

چكيده فارسي :

بازيابي اطلاعات بين زباني به فرايندي گفته مي‌شود كه طي آن يك كاربر، جستاري (يك واژه، عبارت، يا حتي جمله‌اي) را به يك زبان جستجو مي‌كند درحالي‌كه انتظار دارد نتايج جستجوي خود را به زبان ديگري دريافت نمايد. يكي از مشكلات عمده‌ كاربران فارسي‌زبان در استفاده از منابع موجود در فضاي سايبر، عدم امكان بازيابي موضوعات مورد نظر است كه اين مساله تا حد زيادي به حجم كم اطلاعات به زبان فارسي در اين فضا برمي‌گردد. استفاده از فرهنگ لغت نيز به‌دليل عدم توانايي در ارايه‌ پاسخ مناسب به تركيبات چندتايي رايج در زبان‌ها كمتر در اين زمينه راه‌گشاست. طرح حاضر كه با هدف يافتن راه‌حلي مناسب براي اين مشكل با تهيه‌ نرم‌افزار آزمايشگاهي مرتبط تعريف شده است، سعي دارد كه با استفاده از پيكره‌هاي يك‌زبانه و دوزبانه و با كمك الگوريتم‌هاي رايانه‌اي راه‌حل منطقي و مقرون به‌صرفه‌اي براي اين مشكل ارايه نمايد. به‌منظور آزمودن كيفيت كار سامانه‌ طراحي‌شده در اين طرح، آزمايشي بر روي تعداد 100 تركيب از زبان فارسي و انگليسي انجام شد كه برونداد سامانه‌ بازيابي اطلاعات براي اين مجموعه از تركيبات بسيار رضايت‌بخش بوده است. يكي از دستاوردهاي اجرايي اين طرح، بالا بردن دقت سامانه‌‌هاي بازيابي اطلاعات در موتورهاي جستجو است كه با استفاده از پيكره و بانك اطلاعاتي، تركيب‌بندي واژه‌ها قابل دسترس است.

چكيده لاتين :

: Information retrieval (IR) is a crucial area of natural language processing (NLP) and can be defined as finding documents whose content is relevant to the query need of a user. Cross-language information retrieval (CLIR) refers to a kind of information retrieval in which the language of the query and that of searched document are different. In fact, it is a retrieval process where the user presents queries in one language to retrieve documents in another language. This paper tried to construct a bilingual lexicon of parallel chunks of English and Persian from two very large monolingual corpora an English-Persian parallel corpus which could be directly applied to cross-language information retrieval tasks. For this purpose, a statistical measure known as Association Score (AS) was used to compute the association value between every two corresponding chunks in the corpus using a couple of complicated algorithms. Once the CLIR system was developed using this bilingual lexicon, an experiment was performed on a set of one hundred English and Persian phrases and collocations to see to what extend this system was effective in assisting the users find the most relevant and suitable equivalents of their queries in either language.

سال انتشار :

1390

عنوان نشريه :

پژوهش نامه پردازش و مديريت اطلاعات

عنوان نشريه :

پژوهش نامه پردازش و مديريت اطلاعات

اطلاعات موجودي :

فصلنامه با شماره پیاپی سال 1390

كلمات كليدي :

#تست#آزمون###امتحان

لينک به اين مدرک :

https://search.ricest.ac.ir/dl/search/defaultta.aspx?DTC=8&DC=546453