شماره ركورد :
2059
عنوان :
شناسايي مسائل و ارائه راهكارهاي زبا‌ن‌شناختي سازمان‌دهي و بازيابي اطلاعات در سامانه اطلاعات علمي ايران (گنج)
شرح پديد آور/مجري (مجريان) طرح :
محمودزاده، زهرا
سال نشر :
1397
چكيده فارسي :
در اين پژوهش ابتدا با بررسي ميداني پايگاه اطلاعات علمي ايران (گنج)، مسائل زبان‌شناختي بازيابي و ساماندهي اطلاعات در اين پايگاه بدست آمد و سپس راهكارهايي ارائه شد. مسائل نمايه‌سازي شامل موارد زير است: ترجمه به فارسي يا انگليسي اطلاعات كتابشناختي، استفاده از معادل‌هاي متعدد براي يك واژه لاتين، يافتن معادل فارسي كليدواژه‌هاي لاتين، تعيين اختصار فارسي براي يك واژه لاتين، نوشتن صورت‌هاي مخفف لاتين به اشكال مختلف، انواع خطاهاي املايي و نگارشي در هر دو سطح فارسي و لاتين، مسائل مربوط به درج علائم رياضي و فرمول‌هاي شيمي در چكيده و عنوان، مطالب نامربوط در چكيده. براي حل مسائل زبان‌شناختي ساماندهي و نمايه‌سازي به نظر مي‌رسد علاوه بر بهبود قابليت نرم‌افزار نمايه‌سازي، لازم است دانش تخصصي در زمينه علوم مختلف و نيز زبان فارسي و زبان‌شناسي به كار گرفته شود. مسائل بازيابي به دو دسته تقسيم مي شوند: الف) صورت‌هاي متفاوت نوشتاري ناشي از كاربرد علامت‌هاي مختلف نوشتاري: تشديد، همزه، تنوين، آوا، نقطه، خط تيره، صورت‌هاي متفاوت كسره اضافه و صورت‌هاي مختلف جمع و صورت‌هاي مختلف اختصارات و ب) صورت‌هاي متفاوت ناشي از مسائل معنايي، صرفي و نحوي: كلمات چندمعنا با املاي يكسان (اما صورت آوايي يكسان يا متفاوت)، صورت‌هاي متفاوت واژگاني با معناي يكسان يا مرتبط و صورت‌هاي كوتاه‌/‌كامل اسامي يا سازمان‌ها. بررسي ادبيات مربوط به بازيابي اطلاعات نشان مي دهد كه بكارگيري روش‌ها و تكنيك‌هاي پردازش زبان طبيعي تاثير معناداري در بهبود دقت و بازخواني سيستم‌هاي بازيابي اطلاعات دارد.
كليدواژه :
پايگاه اطلاعات علمي ايران (گنج) , بازيابي محتوا , ساماندهي متن , ساختار زباني , پردازش متن
سرشناسه :
زهرا محمودزاده
اطلاعات نشر :
تهران پژوهشگاه علوم و فناوري اطلاعات ايران(ايرانداك)
مشخصات ظاهري :
85ص.، جدول، نمودار.
همكار (همكاران) طرح :
دهسرايي، زهرا
كليدواژه - جزئيات :
لينک به اين مدرک :
بازگشت