عنوان مقاله :
ارائه روشي جديد براي تعبيه اسناد جهت دستهبندي متون خبري
پديد آورندگان :
رحيمي ، زهرا دانشگاه صنعتي اميركبير - دانشكده مهندسي رايانه و فناوري اطلاعات , همايونپور ، محمدمهدي دانشگاه صنعتي اميركبير - دانشكده مهندسي رايانه و فناوري اطلاعات
كليدواژه :
بازنمايي سند , تعبيه سند , تعبيه كلمه , هم رخدادي كلمات , اطلاعات موضوعي , دستهبندي متن
چكيده فارسي :
يكي از كاربردهاي مهم در پردازش زبان طبيعي، دستهبندي متون است. براي دسته بندي متون خبري بايد ابتدا آنها را به شيوه مناسبي بازنمايي كرد. روش هاي مختلفي براي بازنمايي متن وجود دارد ولي بيشتر آنها روش هايي همه منظوره هستند و فقط از اطلاعات همرخدادي محلي و مرتبه اول كلمات براي بازنمايي استفاده مي نمايند. در اين مقاله روشي بي ناظر براي بازنمايي متون خبري ارائه شده است كه از اطلاعات همرخدادي سراسري و اطلاعات موضوعي براي بازنمايي اسناد استفاده مي نمايد. اطلاعات موضوعي علاوه بر اينكه بازنمايي انتزاعي تري از متن ارائه مي دهد حاوي اطلاعات همرخدادي هاي مراتب بالاتر نيز هست. اطلاعات همرخدادي سراسري و موضوعي مكمل يكديگرند. بنابراين در اين مقاله بهمنظور توليد بازنمايي غني تري براي دسته بندي متن، هر دو بكارگرفته شده اند. روش پيشنهادي بر روي پيكره هاي R8 و 20-Newsgruops كه از پيكره هاي شناخته شده براي دسته بندي متون هستند آزمايش شده و با روش هاي مختلفي مقايسه گرديد. در مقايسه با روش پيشنهادي با ساير روشها افزايش دقتي به ميزان افزايش 3% مشاهده گرديد.
عنوان نشريه :
پردازش علائم و داده ها
عنوان نشريه :
پردازش علائم و داده ها