عنوان مقاله :
دستهبندي پرسشها با استفاده از تركيب دستهبندها
عنوان به زبان ديگر :
Question Classification using Ensemble Classifiers
پديد آورندگان :
قائمي، هادي دانشگاه فردوسي مشهد - آزمايشگاه فناوري وب معنايي , كاهاني، محسن دانشگاه فردوسي مشهد - آزمايشگاه فناوري وب معنايي - گروه مهنسي كامپيوتر
كليدواژه :
دستهبندي پرسشها , مبتني برقانون , مبتني بر يادگيري , نمايش پراكنده , ماشين بردار پشتيبان , پرسش و پاسخ
چكيده فارسي :
هدف از توليد و گسترش سامانههاي پرسش و پاسخ، ايجاد پاسخ دقيق براي پرسش دادهشده به زبان طبيعي است. يكي ازمهمترين بخشهاي سامانههاي پرسش و پاسخ، دستهبندي پرسش است. عمل دستهبندي پرسش، پيشبيني نوع پاسخ مورد نياز براي پرسش دادهشده به زبان طبيعي است. كارهاي انجامشده در اين زمينه را ميتوان در دو دسته مبتني بر قانون و مبتني بر يادگيري تقسيم كرد. در اين مقاله يك معماري جديد براي دستهبندي تركيبي پرسشها ارائه شده است، نتايج هريك از دستهبندها توسط پنچ روش رأيگيري وزندار، فضاي دانش رفتار، بيز ساده، كليشه تصميم و دمپستر شفر تركيب شده و خروجي نهايي را شكل ميدهد. اين روش تركيبي متشكل از دو دستهبند مبتني بر يادگيري ماشين (ماشين بردار پشتيبان و نمايش پراكنده) و يك دستهبند مبتني بر قانون استفاده شده است. عمليات دستهبندي مبتني بر يادگيري با توجه به مجموعه ويژگيهاي استخراج شده از پرسشها انجام ميپذيرد. اين ويژگيها براساس ساختار لغوي و نحوي پرسشها استخراج شدهاند. در پايان نتايج حاصل از دستهبندها با روشهاي معمول در تركيب دستهبندهاي تكطبقه تركيب شدهاند و نتايج حاصل بيانكننده بهبود عمليات دستهبندي نسبت به روشهاي موجود است.
چكيده لاتين :
Question answering systems are produced and developed to provide exact answers to the question posted in natural language. One of the most important parts of question answering systems is question classification. The purpose of question classification is predicting the kind of answer needed for the question in natural language. The literature works can be categorized as rule-based and learning-based methods. This paper proposes a novel architecture for hybrid classification of questions. The results of the classifiers were combined by five methods of Weighted Voting, Behavior Knowledge space, Naive Bayes, Decision Template and Dempster-Shafer. The method uses a combination of two classifiers based on machine learning (Support Vector Machine and Sparse Representation) and one rule-based classifier. The learning-based classification uses the set of features extracted from the questions. The features are extracted on the basis of the lexical and syntactic structure of the questions. The results from the classifiers were combined by the methods that are common in the combination of one-class classifiers and the Obtained results indicate the improvement of the classification operations in comparison with the present methods.
عنوان نشريه :
پردازش علائم و داده ها
عنوان نشريه :
پردازش علائم و داده ها