شماره ركورد كنفرانس :
3822
عنوان مقاله :
بررسي دستهبندي متون چند برچسبي و تأثير برچسبها در ساختار سلسله مراتبي
پديدآورندگان :
شفيعزاده مرتضي دانشجوي كارشناسي ارشد هوش مصنوعي و رباتيكز دانشگاه شهيد اشرفي اصفهاني , بهرامي مهين دانشجوي كارشناسي ارشد هوش مصنوعي و رباتيكز دانشگاه شهيد اشرفي اصفهاني
كليدواژه :
دادههاي چند برچسبي , دستهبندي متون , الگوريتمهاي دستهبندي.
عنوان كنفرانس :
چهارمين كنفرانس ملي فناوري اطلاعات، كامپيوتر و مخابرات
چكيده فارسي :
امروزه با افزايش حجم دادهها، امكان جمعآوري و طبقهبندي سريع دادهها توسط انسان غيرممكن شده است و نياز به طبقهبندي و تحليل خودكار از جايگاه ويژهاي برخوردار است. دستهبندي يكي از مهمترين فرآيندهاي موردمطالعه در حوزه يادگيري ماشين و دادهكاوي است كه در برنامههاي كاربردي فراواني ازجمله دستهبندي متن، تشخيص پزشكي، بيوانفورماتيك و... مورداستفاده قرار ميگيرد. مسائل دستهبندي را ميتوان بر اساس تعداد برچسبهاي منتسب به هر يك از دادهها به دودسته كلي مسائل دستهبندي تك برچسبي و مسائل دستهبندي چند برچسبي تقسيم كرد. در مسائل دستهبندي تك برچسبي، هر داده داراي يك برچسب منحصربهفرد است. اكثر مطالعات صورت گرفته در حوزه يادگيري ماشين مربوط به اين نوع مسائل دستهبندي بوده است؛ اما مسائل مهم زيادي وجود دارد كه حل آنها مستلزم انجام دستهبندي چند برچسبي است. در اين مسائل، هر داده ممكن است به بيش از يك برچسب منتسب شود. در طبقهبندي دادهها، ابتدا طي يك فرآيند نمونههاي آموزشي به همراه برچسبهاي آنها به يك الگوريتم يادگيري داده ميشود تا ارتباط بين نمونهها و برچسبها را ياد بگيرد و سپس برچسب دادههاي آزمايشي را پيشبيني كند. دادههاي چند برچسبي دادههايي هستند كه در آن نمونهها ميتوانند بيش از يك برچسب كلاس داشته باشند، بهعبارتديگر هر نمونه توسط يك مجموعه از برچسبها نمايش دادهها ميشود. در اين گزارش به بررسي الگوريتمهاي Naïve-Bayse، ML-KNN، Random Forests، SVM، RBM و شبكههاي عصبي مصنوعي براي دستهبندي دادههاي چند برچسبي ميپردازيم. با ارزيابي روشهاي پيشنهادي بر روي مجموعه دادههاي مختلف به اين نتيجه ميرسيم كه با استفاده از كاهش بعد فضاي برچسبي الگوريتمها ازلحاظ دقت و صحت پيشبيني از كارايي بهتري برخوردار است.