عنوان :
شناسايي مسائل و ارائه راهكارهاي زبانشناختي سازماندهي و بازيابي اطلاعات در سامانه اطلاعات علمي ايران (گنج)
شرح پديد آور/مجري (مجريان) طرح :
محمودزاده، زهرا
چكيده فارسي :
در اين پژوهش ابتدا با بررسي ميداني پايگاه اطلاعات علمي ايران (گنج)، مسائل زبانشناختي بازيابي و ساماندهي اطلاعات در اين پايگاه بدست آمد و سپس راهكارهايي ارائه شد. مسائل نمايهسازي شامل موارد زير است: ترجمه به فارسي يا انگليسي اطلاعات كتابشناختي، استفاده از معادلهاي متعدد براي يك واژه لاتين، يافتن معادل فارسي كليدواژههاي لاتين، تعيين اختصار فارسي براي يك واژه لاتين، نوشتن صورتهاي مخفف لاتين به اشكال مختلف، انواع خطاهاي املايي و نگارشي در هر دو سطح فارسي و لاتين، مسائل مربوط به درج علائم رياضي و فرمولهاي شيمي در چكيده و عنوان، مطالب نامربوط در چكيده. براي حل مسائل زبانشناختي ساماندهي و نمايهسازي به نظر ميرسد علاوه بر بهبود قابليت نرمافزار نمايهسازي، لازم است دانش تخصصي در زمينه علوم مختلف و نيز زبان فارسي و زبانشناسي به كار گرفته شود.
مسائل بازيابي به دو دسته تقسيم مي شوند: الف) صورتهاي متفاوت نوشتاري ناشي از كاربرد علامتهاي مختلف نوشتاري: تشديد، همزه، تنوين، آوا، نقطه، خط تيره، صورتهاي متفاوت كسره اضافه و صورتهاي مختلف جمع و صورتهاي مختلف اختصارات و ب) صورتهاي متفاوت ناشي از مسائل معنايي، صرفي و نحوي: كلمات چندمعنا با املاي يكسان (اما صورت آوايي يكسان يا متفاوت)، صورتهاي متفاوت واژگاني با معناي يكسان يا مرتبط و صورتهاي كوتاه/كامل اسامي يا سازمانها. بررسي ادبيات مربوط به بازيابي اطلاعات نشان مي دهد كه بكارگيري روشها و تكنيكهاي پردازش زبان طبيعي تاثير معناداري در بهبود دقت و بازخواني سيستمهاي بازيابي اطلاعات دارد.
كليدواژه :
پايگاه اطلاعات علمي ايران (گنج) , بازيابي محتوا , ساماندهي متن , ساختار زباني , پردازش متن
اطلاعات نشر :
تهران پژوهشگاه علوم و فناوري اطلاعات ايران(ايرانداك)
مشخصات ظاهري :
85ص.، جدول، نمودار.
همكار (همكاران) طرح :
دهسرايي، زهرا