عنوان مقاله :
ارائه روشي نوين براي استخراج خودكار چهريزهها در جستجوهاي چهريزهاي (مورد مطالعه: حوزه زنان و زايمان)
پديد آورندگان :
فرجپهلو ، عبدالحسين دانشگاه شهيد چمران اهواز , عصاره ، فريده دانشگاه شهيد چمران اهواز , فخراحمد ، مصطفي دانشگاه شيراز , دهقاني ، ليلا دانشگاه علوم پزشكي بوشهر
كليدواژه :
بازيابي اطلاعات , چهريزه , جستجوي چهريزهاي , استخراج خودكار چهريزه.
چكيده فارسي :
هدف اين پژوهش ابداع و معرفي الگوريتمي نو براي استخراج چهريزههاست كه امكان شناسايي تجربي چهريزهها را با كمك پشتوانه انتشاراتي فراهم ميكند. الگوريتم پيشنهادي بر مبناي دو ايده شكل گرفته است: ايده اول اينكه چهريزه در بافت بروز پيدا ميكند. بنابراين، براي تشخيص چهريزه در يك بدنه متني بايستي بافت يا بستر آن مورد بررسي قرار گيرد و ايده دوم اين است كه چهريزه نقطه تمركز در يك درخت واژگاني است كه نه بسيار عام و نه بسيار خاص است. در حوزه پزشكي، دامنه زنان و زايمان بهعنوان بستر آزمون انتخاب گرديد. سه پيكره متني از درون پشتوانه انتشاراتي انتخاب شد. پيكره بستر، از چكيده و عنوان مجموعه مقالات موجود در 20 مجله برتر حوزه انتخاب شد كه دربرگيرنده 167071 سند بود. پيكره دوم، پيكره منشأ بود كه 2000 مقاله بهصورت تصادفي از پيكره بستر انتخاب شد. پيكره سوم، پيكره واژگاني است كه با استفاده از يك سرويس تحت وب و معيار رتبهبندي واژگان LIDFvalue استخراج گرديد. خروجي حاصل دربرگيرنده 514 واژه بود. واژگان تكراري حذف شدند و سرانجام، 480 واژه مهم شناسايي شد. سپس، واژگان در پيكره بستر با كمك مجموعه راهنما يعني »مش » بسط داده شد و پس از آن، بر اساس دو شرط انتقال مبتني بر تكرار يعني بيشتر بودن اسناد مرتبط با واژه در بستر نسبت به منشأ و انتقال مبتني بر رتبه يعني رشد رتبه موجود واژه در پيكره بستر نسبت به منشأ كه نشاندهنده عام شدن واژه است، چهريزههاي كانديد استخراج شدند. سرانجام، با استفاده از سه قاعده اخص بودن، جايگزني و اعم بودن، چهريزههاي شناساييشده اصلاح و نامگذاري شدند. در نهايت، 26 چهريزه بهعنوان چهريزههاي حوزه زنان و زايمان شناسايي شدند. با مقايسه الگوريتم پيشنهادي با ديگر الگوريتمها مشخص شد كه ايجاد سه افراز (افراز منشأ و بدنه متني و افراز براي شناسايي واژگان مهم) و مقايسه رفتار واژه در آنها و سپس، ايجاد درخت بر اساس چهريزههاي كانديد، يعني تركيب رويكرد آماري و هرس درخت ميتواند نتايج مناسبتري نسبت به رويكرد صرفاً آماري يا هرس درخت داشته است. همچنين، مقايسه چهريزههاي خروجي از الگوريتم و چهريزههاي سنتي در اين زمينه نشان داد كه چهريزههاي خروجي الگوريتم، خردتر و براي مرور در ابزارهاي بازيابي اطلاعات مفيدتر هستند. همچنين، در اين پژوهش مشخص شد كه چهريزههاي دامنه تخصصي از چهريزههاي عمومي در حوزه پزشكي متفاوت است و مستقل از آنها قابل شناسايي و تعريف است، اما نميتوان نتايج را به تمامي دامنههاي پزشكي تعميم داد و نياز است كه پژوهشهايي در ديگر حوزهها صورت گيرد.
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات