شماره ركورد :
1320806
عنوان مقاله :
ارائه روشي جديد براي تعبيه اسناد جهت دسته‌بندي متون خبري
پديد آورندگان :
رحيمي ، زهرا دانشگاه صنعتي اميركبير - دانشكده مهندسي رايانه و فناوري اطلاعات , همايونپور ، محمدمهدي دانشگاه صنعتي اميركبير - دانشكده مهندسي رايانه و فناوري اطلاعات
از صفحه :
137
تا صفحه :
148
كليدواژه :
بازنمايي سند , تعبيه سند , تعبيه كلمه , هم رخدادي كلمات , اطلاعات موضوعي , دسته‌بندي متن
چكيده فارسي :
يكي از كاربردهاي مهم در پردازش زبان طبيعي، دسته‌بندي متون است. براي دسته بندي متون خبري بايد ابتدا آنها را به شيوه مناسبي بازنمايي كرد. روش هاي مختلفي براي بازنمايي متن وجود دارد ولي بيشتر آنها روش هايي همه منظوره هستند و  فقط از اطلاعات هم‌رخدادي محلي و مرتبه اول كلمات براي بازنمايي استفاده مي نمايند. در اين مقاله روشي  بي ناظر براي بازنمايي متون خبري ارائه شده است كه از اطلاعات هم‌رخدادي سراسري و اطلاعات موضوعي  براي بازنمايي اسناد استفاده مي نمايد. اطلاعات موضوعي علاوه بر اينكه بازنمايي انتزاعي تري از متن ارائه مي دهد حاوي اطلاعات هم‌رخدادي هاي مراتب بالاتر نيز هست. اطلاعات هم‌رخدادي سراسري و موضوعي مكمل يكديگرند. بنابراين در اين مقاله به‌منظور توليد بازنمايي غني تري براي دسته بندي متن، هر دو بكارگرفته شده اند. روش پيشنهادي بر روي پيكره هاي R8  و 20-Newsgruops كه از پيكره هاي شناخته شده براي دسته بندي متون هستند آزمايش شده و با روش هاي مختلفي مقايسه گرديد. در مقايسه با روش پيشنهادي با ساير روش‌ها افزايش دقتي به ميزان افزايش 3%  مشاهده گرديد.
عنوان نشريه :
پردازش علائم و داده ها
عنوان نشريه :
پردازش علائم و داده ها
لينک به اين مدرک :
بازگشت