شماره ركورد كنفرانس :
4768
عنوان مقاله :
يادگيري نمايش ساختاريافته از طريق يادگيري تقويتي و شبكههاي با حافظه بلندمدت-كوتاه مدت
عنوان به زبان ديگر :
Learning structured representation via reinforcement learning and long-short term memory networks
پديدآورندگان :
علوي نيلوفر nilooalavi504@it.uut.ac.ir دانشجوي كارشناسي ارشد، دانشكده مهندسي فناوري اطلاعات و كامپيوتر، دانشگاه صنعتي اروميه، اروميه، ايران , طهمورث نژاد جعفر j.tahmores@it.uut.ac.ir استاديار، دانشكده مهندسي فناوري اطلاعات و كامپيوتر، دانشگاه صنعتي اروميه، اروميه، ايران
كليدواژه :
هوش مصنوعي , پردازش زبان طبيعي , طبقهبندي متن , يادگيري تقويتي , يادگيري نمايش جديد
عنوان كنفرانس :
اولين كنفرانس ملي كسب و كارهاي نوين و هوشمند داده كاوي و پردازش تصاوير
چكيده فارسي :
مدلهاي طبقهبندي متن براي دستهبندي متون در گروههاي سازمانيافته استفاده ميشوند. محتواي اين متون توسط مدلهاي يادگيري ماشين آناليز شده و بر همين اساس برچسبگذاري ميشوند. يادگيري نمايش يكي از مسائل مهم در حوزه پردازش زبان طبيعي ميباشد كه تاثير زيادي در طبقهبندي متن دارد. برخلاف روشهاي قبلي كه ساختار خاصي استفاده نميكنند، در اين مقاله به منظور يادگيري نمايش ساختاريافته، يك روش جديدي مبتني بر يادگيري تقويتي پيشنهاد ميشود كه هدف آن شناسايي ساختارهاي مناسب و مرتبط با تسك است. در روش پيشنهادي از مدلهاي ID-LSTM، HS-LSTM و تركيبي از اين دو مدل براي ايجاد نمايش ساختاريافته استفادهشده است. در مدل ID-LSTM فقط كلمات مهم و مرتبط با تسك در نمايش نهايي وجود دارند و كلمات غير مرتبط حذف ميشوند. در مدل HS-LSTM نيز، ساختارهاي به شكل عبارت در يك جمله شناسايي ميشوند. در تركيب اين دو مدل، خروجي مدل اول كه يك نمايش خلاصهتري ميباشد به عنوان ورودي به مدل دوم داده ميشود تا عبارتهاي بهينهتري براي طبقهبندي شناسايي شوند. به منظور ارزيابي روش پيشنهادي، آزمايشاتي بر روي دو دسته از ديتاستها انجامشده و نتايج حاصل بيانگر اين هستند كه روش پيشنهادي توانايي يادگيري نمايشهاي مرتبط با تسك را از طريق مشخص كردن ساختارها و كلمات مهم دارد.
چكيده لاتين :
Text classification models are used to categorize texts in organized groups. The content of these texts is analyzed by machine learning models and is accordingly labeled. Representation learning is a fundamental problem in natural language processing, which has a great impact on the text classification. Unlike most existing representation models that either use no structure, in this paper, in order to learn a structured representation, a new method based on reinforcement learning is proposed, with the aim of identifying appropriate and task-relevant structures. The proposed method uses the ID-LSTM, HS-LSTM and a combination of these two models to build structured sentence representations. In the ID-LSTM, there are only important, task-relevant words in the final Representation, and irrelevant words are removed. Also, the HS-LSTM discovers phrase structures in a sentence. In the combination of these two models, the output of the first model, which is a purified and condensed representation, is given as input to the second model to identify more optimal phrases for classification. In order to evaluate the performance of our presented method, experiments are conducted on two categories of datasets and the results show that proposed method has the ability to learn sentence representation by discovering important words and structures.