عنوان مقاله :
مرجعگزيني در زبان فارسي با استفاده از شبكه عصبي عميق
پديد آورندگان :
سهلاني ، حسين دانشگاه صنعتي مالك اشتر , حورعلي ، مريم دانشگاه صنعتي مالك اشتر , مينايي بيدگلي ، بهروز دانشگاه علم و صنعت ايران - دانشكده مهندسي كامپيوتر
كليدواژه :
مرجعگزيني , گراف , شناسايي موجوديت نامدار , استخراج اطلاعات از متن , شبكههاي عصبي عميق
چكيده فارسي :
در حال حاضر با توجه به كثرت شبكههاي اجتماعي و شبكههاي خبري تلويزيوني، راديويي، اينترنتي و غيره، خواندن تمام متون مختلف و بهتبع آن تحليل آنها و دستيابي به ارتباطات اين متون نيازمند صرف هزينه زماني و انساني بسيار بالا است كه در عصر كنوني با استفاده از فنهاي مختلف پردازش زبان طبيعي صورت ميگيرد، يكي از چالشهاي موجود در اين زمينه پايينبودن دقت سامانههاي مرجعگزيني است كه سبب كشف روابط ناصحيح و يا عدم كشف روابط صحيح ميشود. مراحل كلي حل مسأله مرجعگزيني از سهگامِ شناسايي موجوديت هاي نامدار، استخراج ويژگيهاي موجوديت هاي نامدار و مرجعگزيني آنها تشكيل شده است. موجوديت هاي نامدار ويژگيهاي فراواني دارند، وجود ويژگيهاي مختلف (متناسب و متناقض با مرجع) در گرافها اين امكان را ميدهند كه بتوان حد آستانهاي را از تركيب ويژگيهاي مختلف استخراج كرد. در مقاله ارائهشده ابتدا پيشپردازشهاي مختلف روي پيكره پژوهشگاه خواجهنصير [1] انجام گرفت؛ سپس با استفاده از الگوريتمهاي مبتني بر شبكه عصبي عميق دادههاي موجود به بردارهاي عددي تبديل شدند و پس از آن با استفاده از گراف و با ويژگيهايي كه در متن مقاله عنوانشده هرس اوليه انجام گرفت؛ درواقع رويكردهاي مبتني بر گراف، موجوديتها را همچون مجموعهاي از عناصر مرتبط با يكديگر ميشناسد كه تحليل روابط ميان موجوديتهاي اوليه در گراف و وزندهي به اين ارتباطها، منجر به استخراج ويژگيهاي سطح بالاتر و مرتبطتري ميشود و نيز تناقضات ايجادشده بر اساس كمبود اطلاعات را تا حدودي كاهش ميدهد. سپس با استفاده از شبكههاي عصبي، روي پيكره مورداشاره در [30] (پيكره آزمون اپسلا) مرجعگزيني انجام گرفت كه نتايج حاصل بيانگر بهبود روش پيشنهادي (رسيدن به دقت 62.09) است كه در متن مقاله بهطور مشروح بيانشده است.
عنوان نشريه :
پردازش علائم و داده ها
عنوان نشريه :
پردازش علائم و داده ها