شماره ركورد :
1178872
عنوان مقاله :
ارائه ي يك مدل جهت دسته‌بندي متون فارسي با استفاده از تركيب روش هاي دسته بندي
پديد آورندگان :
جمالي، ايمان دانشگاه آزاد اسلامي واحد علوم و تحقيقات، بوشهر , ميرعابديني، جواد دانشگاه آزاد اسلامي، تهران مركزي , هارون آبادي، علي دانشگاه آزاد اسلامي، تهران مركزي
تعداد صفحه :
11
از صفحه :
34
از صفحه (ادامه) :
0
تا صفحه :
44
تا صفحه(ادامه) :
0
كليدواژه :
ماشين بردار پشتيبان , دسته‌بندي متون , انتخاب ويژگي , تحليل مؤلفه اصلي
چكيده فارسي :
براي دسته­بندي متن از تكنيك­هاي استخراج اطلاعات، پردازش زبان طبيعي و يادگيري ماشين به طور وسيع استفاده مي‌شود به طور كلي هدف يك دسته بند متون، دسته­بندي اسناد در قالب تعداد معيني از دسته­هاي از پيش تعيين شده مي­باشد. هر سند مي‌تواند در يك، چند و يا هيچ دسته‌اي قرار بگيرد. در مورد هر سند به اين سؤال پاسخ داده خواهد شد كه اين سند در كدام يك از دسته­ها قرار مي‌گيرد. اين موضوع مي‌تواند در قالب يك يادگيري خودكار قرار گيرد تا با استفاده از آن بتوان هر سند را به طور خودكار به دسته­اي نسبت داد. در اين مقاله، بعد از انتخاب مجموعه داده و پاك­سازي متون به كمك روش نرمال شده فركانس كلمه- معكوس فركانس سند (norm TF-IDF) به ويژگي­ها وزن داده مي­شود و در طي دو مرحله ويژگي­ها با استفاده از روش­هاي فركانس سند (DF) و مربع چي (SChi) انتخاب مي­شوند و بعد با استفاده از روش تحليل مؤلفه اصلي (PCA) ابعاد ويژگي­ها كاهش داده مي­شود و در مرحله بعد با استفاده از تركيب 21 ماشين بردار پشتيبان (SVM) به پياده سازي مدل پيشنهادي مي­پردازيم و در نهايت صحت مدل را با روش اعتبار سنجي 10 مرحله‌اي ارزيابي مي­كنيم نتايج تجربي نشان مي­دهد كه اين مدل مي­تواند عمل دسته­بندي متون را براي هفت دسته با صحت 91.86 انجام دهد كه نسبت به كارهاي پيشين انجام گرفته صحت بالاتري دارد.
چكيده لاتين :
This Article has no English Abstract
سال انتشار :
1396
عنوان نشريه :
مهندسي مخابرات جنوب
فايل PDF :
8217901
لينک به اين مدرک :
بازگشت