شماره ركورد كنفرانس :
3712
عنوان مقاله :
دسته بندي متون فارسي با استفاده از روش آناليز معنايي پنهان احتمالاتي
پديدآورندگان :
زماني محسن دانشگاه آزاد اسلامي واحد بوشهر , ديانت روح الله دانشگاه قم , صادق زاده مهدي دانشگاه آزاد اسلامي
تعداد صفحه :
۸
كليدواژه :
برچسب زني موضوعي , مفهوم پنهان , آناليز معنايي پنهان احتمالاتي , كلمات كليدي
سال انتشار :
۱۳۹۱
عنوان كنفرانس :
اولين همايش ملي كاربرد سيستم هاي هوشمند (محاسبات نرم) در علوم و صنايع
زبان مدرك :
فارسي
چكيده فارسي :
دسته بندي موضوعي، محتمل ترين موضوعي كه محتواي متن بدان اشاره دارد را مشخص مي كند. براي نيل به اين هدف، در مقاله حاضر با استفاده از روش آناليز معنايي پنهان احتمالاتي كه بر پايه روش آناليز معنايي پنهان پايه گذاري شده است و از مباني احتمالات و قوانين بيزين استفاده مي كند، براي عمليات دسته بندي متون فارسي كه از پايگاه داده همشهري تهيه شده است و با استفاده از روش فاصله يابي اقليدسي در فضاي ماتريس هاي كاهش بعد يافته دست آمده از روش فوق بهره گرفته شده است. همچنين از روش TF-IDF جهت تهيه كلمات كليدي موجود در مجموعه متون مورد استفاده ، به كار گرفته شده است. در مرحله هرس، علاوه بر كلمات دستوري مانند حروف اضافه و ربط، كلمات كليدي زايد نيز به صورت دستي حذف مي شوند. پس از مشخص شدن كلمات كليدي تمام متون پيمايش شده و براي هر متن يك بردار تهيه شده و ماتريس ورودي مربوط به روش آناليز معنايي پنهان احتمالاتي فراهم مي آيد. پس از اعمال روش بر روي داده هاي آموزش و داده هاي آزمون ، بردارهاي حاصل را با بردار هاي مرحله آموزش مقايسه كرده، برداري كه كمترين فاصله را با بردار متن مرحله آموزش دارد، بر چسب دسته مربوط به متن را مشخص يم نمايد. نتايج حاصل شده در اين مقاله نشان ميدهد كه روش بكار رفته در بهبود عملكرد سيستم نقش موثري دارد.
كشور :
ايران
لينک به اين مدرک :
بازگشت