عنوان مقاله :
استخراج ويژگيها و بسط لغتنامه در انديشه كاوي مورد استفاده در متون فارسي
پديد آورندگان :
گلپر رابوكي، عفت دانشگاه قم - گروه رياضي , ضرغامي فر، ساقي السادات دانشگاه قم - گروه فني و مهندسي , رضايي نور، جلال دانشگاه قم - گروه فني و مهندسي
كليدواژه :
استخراج ويژگي , انديشهكاوي , بسط لغتنامه انديشهكاوي , برچسب ادات سخن , برچسب نحوي , انتشار دوگانه
چكيده فارسي :
انديشهكاوي به تحليل اظهار نظرات كاربران جهت استخراج نظرات، احساسات و خواستههاي كاربران در يك حوزه خاص ميپردازد. دانستن نظرات افراد در يك حوزه خاص ميتواند نقش مهمي در تصميمگيريهاي كلان آن حوزه ايفا كند. به طور كلي انديشهكاوي در سه سطح سند، جمله و ويژگي به استخراج نظرات كاربران ميپردازد. انديشهكاوي در سطح ويژگي به دليل تحليل جهتگيري جنبههاي مختلف يك حوزه از دو سطح ديگر بيشتر مورد توجه قرار دارد. در اين مقاله روشي به منظور استخراج ويژگيها و بسط لغتنامه انديشهكاوي ارائه شده است. اين لغتنامه به منظور تعيين جهتگيري نظرات كاربران مورد استفاده قرار ميگيرد. روش پيشنهادي شامل چهار گام اصلي است. در گام نخست لغتنامه انديشهكاوي براي زبان فارسي ايجاد ميشود. گام دوم مرحله پيشپردازش شامل تقطيع، ايجاد برچسبهاي ادات سخن و برچسب وابستگي نحوي اسناد است. گام سوم استخراج ويژگيها و بسط لغتنامه با استفاده از روش انتشار دوگانه است و در گام چهارم ويژگيها و قطبيت كلمات حاوي نظر استخراج شده در مرحله قبلي اصلاح شده و در نهايت قطبيت ويژگيها تعيين ميگردد. براي ارزيابي روش پيشنهادي، نتايج حاصل را با روش استخراج ويژگي بر اساس تكرار در متون فارسي كه قبلاً ارائه شده است مقايسه خواهيم نمود. نتايج به دست آمده نشان ميدهد كه روش ارائهشده در اين مقاله نسبت به روش استخراج ويژگي بر اساس تكرار در متون فارسي عملكرد بهتري دارد.
عنوان نشريه :
مهندسي برق و مهندسي كامپيوتر ايران
عنوان نشريه :
مهندسي برق و مهندسي كامپيوتر ايران