عنوان مقاله :
استخراج ماشيني كليد واژه با مدلسازي موضوعي ال. دي. اِي.: شباهت سنجي با كليد واژههاي استاندارد و ارزيابي كاربران
پديد آورندگان :
شادانپور ، فرزانه دانشگاه خوارزمي , رياحي نيا ، نصرت دانشگاه خوارزمي - گروه علم اطلاعات و دانش شناسي , برنا ، كيوان دانشگاه خوارزمي - گروه علوم كامپيوتر , منتظر ، غلامعلي دانشگاه تربيت مدرس - گروه مهندسي فناوري اطلاعات
كليدواژه :
استخراج ماشيني كليدواژه , مدلسازي موضوعي , ال. دي. اِي. , شباهتسنجي , ارزيابي كاربر
چكيده فارسي :
زمينه و هدف: هدف اين پژوهش، بررسي نتايج استخراج خودكار كليدواژه از فهرست مندرجات كتابهاي الكترونيكي فارسي حوزۀ علوم با استفاده از مدلسازي موضوعي ال. دي. اِي.، سنجش شباهت كليدواژههاي خروجي با كليدواژههاي استاندارد و ارزيابي كاربران از كليدواژههاي استخراجشده بهصورت ماشيني است. روش پژوهش: اين پژوهش كاربردي، از نوع پژوهشهاي متنكاوي و به جنبۀ روشهاي مورداستفاده در آن پژوهش آميخته است. از مدلسازي موضوعي ال. دي. اِي. براي استخراج كليدواژه از فهرستهاي مندرجات كتابها استفادهشده و نتايج كاربرد مدل با دو روش سنجش كسينوس شباهت و پژوهش كيفي توسط كاربران مورد ارزيابي قرار گرفته است. يافتهها: فهرستهاي مندرجات مورد بررسي با ميانگين پيراسته ۲۶۰.۰۲ كلمه از متون با طول متوسط محسوب ميشوند و حدود ۲۰ درصد از كلمات آنها را ايستواژهها تشكيل دادهاند. ميان كليدواژههاي استاندارد سرعنواني و كليدواژههاي خروجي مدل ال. دي. اِي. كسينوس شباهت، ۰.۰۹۳۲، بسيار پايين به دست آمد. توافق كامل كاربران نشان داد كليدواژههاي خروجي مدل موضوعي ال. دي. اِي. حوزه موضوعي كل پيكره را نشان ميدهند، اما ازنظر كاربران به ترتيب كليدواژههاي سرعنواني استاندارد، كليدواژههاي مستخرج از مدل در زيرحوزههاي موضوعي و كليدواژههاي مستخرج از مدل با كل پيكره در توصيف موضوعات هر تك مدرك موفقاند. نتيجهگيري: كليدواژههاي بهدستآمده از مدل موضوعي ال. دي. اِي. را ميتوان در مجموعههاي ناشناخته بهمنظور استخراج محتواي موضوعي ناآشكار كل مجموعه به كار برد، اما براي ربط دقيق موضوع به مدرك در پيكرههاي بزرگ با موضوعات ناهمگن و متنوع، نميتوان از اين روش استفاده كرد. اين روش در رويههاي رسمي توصيف موضوعي تكتك مدارك بهصورت مستقل ميتواند بهعنوان يك سيستم پيشنهاددهنده كليدواژه به نيروي انساني نمايهساز به كار گرفته شود.
عنوان نشريه :
تعامل انسان و اطلاعات
عنوان نشريه :
تعامل انسان و اطلاعات