مرکز منطقه ای اطلاع رساني علوم و فناوري - بهبود بازيابي اطلاعات بر اساس تشابه معنايي كلمات كليدي با استفاده از رتبه دهي مبتني بر گراف

شماره ركورد كنفرانس :

3822

عنوان مقاله :

بهبود بازيابي اطلاعات بر اساس تشابه معنايي كلمات كليدي با استفاده از رتبه دهي مبتني بر گراف

پديدآورندگان :

جوادي مقدم سيد محمد عضوهيئت علمي ،گروه كامپيوتر، دانشگاه بزگمهر ، قائنات , عبدالرزاق نژاد مجيد عضوهيئت علمي ،گروه كامپيوتر، دانشگاه بزگمهر ، قائنات , قادري فريز مهناز دانشكده مهندسي كامپيوتر ، گروه نرم افزار ، دانشگاه آزاد اسلامي ، بيرجند

تعداد صفحه :

كليدواژه :

اطلاعات آماري , رتبه دهي مبتني بر گراف , كلمه كليدي , كلمات كليدي استخراجي.

سال انتشار :

1396

عنوان كنفرانس :

چهارمين كنفرانس ملي فناوري اطلاعات، كامپيوتر و مخابرات

زبان مدرك :

فارسي

چكيده فارسي :

كلمات كليدي در اسناد متني ، كلماتي از متن اسنادهستند كه بيشترين بار مفهومي متن را به همراه داشته و نيز يك نسخه فشرده متن محسوب مي شود در نتيجه نياز به روش هاي استخراج خودكار كلمات كليدي را به شدت افزايش داده اخيراً روش هاي رتبه بندي مبتني بر گراف كاربرد موفقي در حوزه وب داشته يك مشكل عمده اكثر اين روش ها تأكيد بيش از حد بر پارامترهم جواري كلمات در ايجاد و وزندهي يال هاي گراف متني و صرف نظر از شاخص هاي آماري شده است . در اين پژوهش برانيم شباهت معنايي كلمات كليدي را به صورت فرمت پيچيده تري از متغير TF-IDF (روش وزندهي كلاسيك) به عنوان شاخص آماري بيان كنيم. با تعريف متغير جديد كه بيانگر ترتيب كاهنده از احتمال ارتباطشان با پرس وجوي كاربر است و يك روش مشخص به عنوان رتبه بندي احتمال ؛ الگوريتم معروفBM25 است ، در اين پژوهش اطلاعات آماري روش رتبه بندي احتمال ارتباط كلمات كليدي، از جمله تعداد اسناد مشابه و اسناد كل مجموعه در وزندهي گراف استفاده شده است.هدف اين مقاله اين است كه شباهت معنايي اسناد مختلف با سند مورد نظربررسي كنيم با رتبه بندي كلمات كليدي مجموعه اسناد مرجع ، اسنادي كه داراي كلمات كليدي با بالاترين اولويت اند ، شبيه ترين اسناد به سند مورد بررسي است. مقايسه نتايج روش جديد با روش هاي قبلي افزايش دقت 93%در اسناد استخراج شده مشابه سند مورد بررسي را نشان مي دهد.

كشور :

ايران

لينک به اين مدرک :

https://search.ricest.ac.ir/dl/search/defaultta.aspx?DTC=36&DC=291606