شماره ركورد :
1290725
عنوان مقاله :
ارائه روشي نوين براي استخراج خودكار چهريزه‌ها در جستجوهاي چهريزه‌اي (مورد مطالعه: حوزه زنان و زايمان)
پديد آورندگان :
فرج‌پهلو ، عبدالحسين دانشگاه شهيد چمران اهواز , عصاره ، فريده دانشگاه شهيد چمران اهواز , فخراحمد ، مصطفي دانشگاه شيراز , دهقاني ، ليلا دانشگاه علوم پزشكي بوشهر
از صفحه :
807
تا صفحه :
838
كليدواژه :
بازيابي اطلاعات , چهريزه , جستجوي چهريزه‌اي , استخراج خودكار چهريزه.
چكيده فارسي :
هدف اين پژوهش ابداع و معرفي الگوريتمي نو براي استخراج چهريزه‌هاست كه امكان شناسايي تجربي چهريزه‌ها را با كمك پشتوانه انتشاراتي فراهم مي‌كند. الگوريتم پيشنهادي بر مبناي دو ايده شكل گرفته است: ايده اول اينكه چهريزه در بافت بروز پيدا مي‌كند. بنابراين، براي تشخيص چهريزه در يك بدنه متني بايستي بافت يا بستر آن مورد بررسي قرار گيرد و ايده دوم اين است كه چهريزه نقطه تمركز در يك درخت واژگاني است كه نه بسيار عام و نه بسيار خاص است. در حوزه پزشكي، دامنه زنان و زايمان به‌عنوان بستر آزمون انتخاب گرديد. سه پيكره متني از درون پشتوانه انتشاراتي انتخاب شد. پيكره بستر، از چكيده و عنوان مجموعه مقالات موجود در 20 مجله برتر حوزه انتخاب شد كه در‌برگيرنده 167071 سند بود. پيكره دوم، پيكره منشأ بود كه 2000 مقاله به‌صورت تصادفي از پيكره بستر انتخاب شد. پيكره سوم، پيكره واژگاني است كه با استفاده از يك سرويس تحت وب و معيار رتبه‌بندي واژگان LIDFvalue استخراج گرديد. خروجي حاصل دربرگيرنده ‌514 واژه بود. واژگان تكراري حذف شدند و سرانجام، 480 واژه مهم شناسايي شد. سپس، واژگان در پيكره بستر با كمك مجموعه راهنما يعني »مش » بسط داده شد و پس از آن، بر اساس دو شرط انتقال مبتني بر تكرار يعني بيشتر بودن اسناد مرتبط با واژه در بستر نسبت به منشأ و انتقال مبتني ‌بر رتبه يعني رشد رتبه موجود واژه در پيكره بستر ‌نسبت به منشأ كه نشان‌دهنده عام شدن واژه است، ‌چهريزه‌هاي كانديد استخراج شدند. سرانجام، با استفاده از سه قاعده اخص بودن، جايگزني و اعم بودن، چهريزه‌هاي شناسايي‌شده اصلاح و نام‌گذاري شدند. در نهايت، 26 چهريزه به‌عنوان چهريزه‌هاي حوزه زنان و زايمان شناسايي شدند. ‌با مقايسه الگوريتم پيشنهادي با ديگر الگوريتم‌ها مشخص شد كه ايجاد سه افراز (افراز منشأ و بدنه متني و افراز براي شناسايي واژگان مهم) و مقايسه رفتار واژه در آن‌ها و سپس، ايجاد درخت بر اساس چهريزه‌هاي كانديد، يعني تركيب رويكرد آماري و هرس درخت مي‌تواند نتايج مناسب‌تري نسبت به رويكرد صرفاً آماري يا هرس درخت داشته است. همچنين، مقايسه چهريزه‌هاي خروجي از الگوريتم و چهريزه‌هاي سنتي در اين زمينه نشان داد كه چهريزه‌هاي خروجي الگوريتم، خرد‌تر و براي مرور در ابزارهاي بازيابي اطلاعات مفيد‌تر هستند. همچنين، در اين پژوهش مشخص شد كه چهريزه‌هاي دامنه تخصصي از چهريزه‌هاي عمومي در حوزه پزشكي متفاوت است و مستقل از آن‌ها قابل شناسايي و تعريف ‌است، اما نمي‌توان نتايج را به تمامي دامنه‌هاي پزشكي تعميم داد و نياز است كه پژوهش‌هايي در ديگر حوزه‌ها صورت گيرد.
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات
لينک به اين مدرک :
بازگشت