عنوان مقاله :
ارائه روشي براي برچسب زدن تصاوير موجود در متون علمي فارسي با استفاده از روشهاي پردازش متن
پديد آورندگان :
فخرزاده ، آزاده پژوهشگاه علوم و فناوري اطلاعات ايران (ايرانداك) , رهنما ، محدثه دانشگاه الزهرا (س) - دانشكده فني و مهندسي - گروه مهندسي كامپيوتر , نصيري ، جلالالدين دانشگاه فردوسي مشهد - دانشكده علوم رياضي
كليدواژه :
برچسب زدن تصوير , نشانهگذاري تصوير , بازيابي تصوير , پردازش متن , استخراج فراداده , فناوري اطلاعات
چكيده فارسي :
در اين مقاله يك روش جديد براي برچسبگذاري تصاوير موجود در متون علمي فارسي معرفي ميشود. در اسناد و مقالات علمي، تصاوير حاوي اطلاعلات مهمي هستند و در بسياري از موارد بهتنهايي با بررسي آنها ميتوان به ايده اصلي و يا نتايج مهم مقاله علمي پي برد، بدون اينكه لازم باشد كل مقاله را مطالعه كرد. بهخاطر رشد روزافزون دادههاي تصويري، بازيابي تصاوير از اسناد علمي توجه زيادي را به خود جلب كرده و به يك موضوع روبهرشد در ادبيات تبديل شده است. اولين قدم در بازيابي تصاوير تخصيص برچسبهاي توصيفكننده به هر تصوير است. در اينجا براي استخراج برچسب تصوير از متن سندي كه تصوير به آن تعلق دارد، استفاده شده است. زيرنويس و قسمتي از متن سند كه در آن به تصوير مورد نظر اشاره شده است، در نظر گرفته ميشود. عبارات اسمي در متنِ همراه تصوير با استفاده از پنج روش متفاوتِ فراواني عبارات در سند، معكوس فراواني سند، فراواني كلمه-معكوس فراواني سند، شباهت كسينوسي عبارات با زيرنويس، و تركيب روش فراواني كلمه-معكوس فراواني سند و شباهت كسينوسي با زيرنويس رتبهبندي ميشوند. در هر روش، برچسبهاي انتخابي براي تصوير، عبارات اسمي با رتبه بالاتر در آن روش است. روشهاي معرفيشده با استفاده از داده آزمايشي از پايگاه اطلاعات علمي ايران (گنج) كه منبع اصلي اسناد علمي فارسي است، ارزيابي ميشوند. طبق نتايج بهدستآمده در اين تحقيق روش فراواني كلمه-معكوس فراواني سند بهترين روش براي برچسب زدن تصاويرموجود در اسناد علمي است.
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات