عنوان مقاله :
بازيابي و رتبهبندي افراد خبره با استفاده از مدل ترجمه مبتنيبر خوشهبندي
عنوان به زبان ديگر :
Retrieve and Rank the Experts Using a Cluster-based Translation Model
پديد آورندگان :
دهقان، مهدي دانشگاه شهيد بهشتي - دانشكده مهندسي و علوم كامپيوتر، تهران , آبين، احمدعلي دانشگاه شهيد بهشتي - دانشكده مهندسي و علوم كامپيوتر، تهران
كليدواژه :
بازيابي افراد خبره , مدل ترجمه , خوشهبندي , مدلسازي موضوعي , فاصلهي واژگاني , سيستمهاي پاسخ به پرسش
چكيده فارسي :
استخراج دانش از ميان دادههاي موجود در وب باتوجه به حجم و تنوع بالاي آن به يك چالش در حوزهي بازيابي اطلاعات تبديل شدهاست. در اين ميان، مسألهي بازيابي و رتبهبندي افراد خبره با هدف بازيابي و رتبهبندي افراد خبره در زمينهي موضوع پرسوجوي كاربر، بهعنوان يكي از مهمترين مسائل موجود در اين حوزه توجه بسياري از پژوهشگران را به خود جلب نمودهاست. مهمترين چالش در مسئلهي بازيابي افراد خبره تشخيص ميزان ارتباط بين كلمات پرسوجو و سندهاي نوشتهشده توسط نامزدهاي خبرگي است. يك مشكل اساسي در اين حوزه فاصلهي واژگاني ميان كلمات پرسوجو و سندهاي نامزدهاي خبرگي است. در اين مقاله دو مدل ترجمهي جديد براي مدلسازي فاصلهي واژگاني ارائه شدهاست. مدل اول يك مدل احتمالاتي مبتنيبر خوشهبندي و مدل دوم مبتنيبر مدلسازي موضوعي است. در هر دو مدل، كلمات پرسوجو به مجموعهاي از كلمات مرتبط با پرسوجو كه بيشتر نشاندهندهي يك زمينهي خبرگي هستند ترجمه شدهاست. پس از ترجمهي كلمات، از يك مدل تركيب كننده بهمنظور بازيابي استفاده شدهاست. مدلهاي ارائهشده برروي مجموعهي آزمون Stack Overflow ارزيابي و تحليل شدهاست. نتايج بهدستآمده بيانگر افزايش ميانگين متوسط دقت روش ارائهشده در مقايسه با ساير روشهاي بازيابي افراد خبره است.
چكيده لاتين :
With respect to the increasing volume and variety of information available on the Web, it is very difficult to find the required knowledge through the massive amount of data. Question-answering systems have been created to make easy knowledge accessing through massive amounts of data. The most important factor in the issue of expert finding is the ability to detect the relationship between query words and documents written by the candidate experts. A challenging issue in this area is the vocabulary gap between query words and the documents of the candidate experts. In this paper, two new translation models are proposed to solve the problem of the vocabulary gap. First model, a cluster-based probabilistic model, and another is based on topic modeling. In these models, the query words are translated into a collection of query-related words, which are written in documents written by more candidate experts. Then, using these words and using a simple composite model, we have retrieved the experts. The proposed models are implemented and evaluated on the Stackoverflow test set and finally, we have analyzed the outputs. The results indicate an increase in the Mean Average Precision of the proposed method compared with other methods of expert finding.
عنوان نشريه :
مهندسي برق دانشگاه تبريز