شماره ركورد كنفرانس :
4579
عنوان مقاله :
مدلسازي عبارات ظاهرنشده با استفاده از يادگيري عميق
عنوان به زبان ديگر :
فاقد عنوان و چكيده لاتين
پديدآورندگان :
قاضي زاهدي امين دانشگاه صنعتي شاهرود - دانشكده مهندسي كامپيوتر و فناوري اطلاعات , زاهدي مرتضي دانشگاه صنعتي شاهرود - دانشكده مهندسي كامپيوتر و فناوري اطلاعات , فاتح منصور دانشگاه صنعتي شاهرود - دانشكده مهندسي كامپيوتر و فناوري اطلاعات
كليدواژه :
خوشهبندي , يادگيري دنباله به دنباله , شبكه عصبي عميق , استخراج عبارات كليدي
چكيده فارسي :
عبارت كليدي نشاندهنده و بيانگر مفاهيم اساسي براي يك متن است. در بسياري از كاربردهاي پردازش متن، نياز به استخراج عبارات كليدي با كيفيت مناسب است. در روشهاي قديمي مدلسازي متن، معاني و مفاهيم مرتبط با متن اهميت ويژهاي نداشتهاند. درنتيجه ساختار اصلي مدل، بر اساس كلمات ظاهرشده در سند شكلگرفته است. طبق تحقيقات اخير، اسناد همخوشه اشتراك مناسبي در عبارات كليدي مستقيماً ظاهرنشده در سند متني دارند. در اين تحقيق، مدلي جهت استخراج مفاهيم اساسي متن با استفاده از تخمين متون مشابه و اضافه كردن عبارات كليدي به لايههاي مخفي شبكه عميق، ارائهشده است. اين مدلسازي بر اساس تشابه خوشهاي با يك شبكه عميق شكلگرفته است. اين ساختار، سعي در كشف عبارات ظاهرنشده و سپس تخمين بهتر عبارات كليدي با يك RNN را دارد. اين روش بهطور قابلتوجهي مشكل عدم بازنمايي مفاهيم اساسي و عدم وجود عبارات كليدي بهطور مستقيم را حل ميكند. روش پيشنهادي روي چهار دادگان متداول در اين حوزه آزمايش شده است. نتايج اين آزمايشها، بهبود حدود 14 درصدي نسبت به روشهاي معمول TF-IDF, KEA و RNN را نشان ميدهد.