شماره ركورد كنفرانس
4415
عنوان مقاله
طبقه بندي محتوايي صفحات وب با استفاده از راهكارهاي خوشه بندي
پديدآورندگان
رجب زاده شهرستاني معصومه Masoumeh_rajabzadeh@yahoo.com موسسه آموزش عالي ديلمان - لاهيجان , احمدي آبكناري فاطمه Fateme.Abkenari@gilan.pnu.ac.ir دانشگاه پيام نور رشت , اكباتاني فرد غلامحسين Ekbatanifard@gmail.com دانشگاه آزاد اسلامي واحد لاهيجان
تعداد صفحه
12
كليدواژه
الگوريتم هاي خوشه بندي , ارزيابي خوشه بندي , بازيابي اطلاعات , طبقه بندي صفحات وب.
سال انتشار
1395
عنوان كنفرانس
نخستين كنفرانس ملي تحقيقات بين رشته اي در مهندسي كامپيوتر، برق، مكانيك و مكاترونيك
زبان مدرك
فارسي
چكيده فارسي
از آنجا كه حجم اطلاعات بر روي وب روز به روز در حال افزايش است سازماندهي اين اطلاعات به منظور دسترسي سريع كاربران به محتواي مورد نظر يك نياز ضروري مي باشد. با توجه به رشد سريع وب، فراهم كردن روشي خودكار براي تقسيم بندي و طبقه بندي صفحات وب يك نياز ضروري مي باشد. در اين مقاله چندين روش خوشه بندي صفحات وب مورد بررسي قرار گرفته است. اين روش ها شامل خوشه بندي اسناد براساس تركيب تگ هاي HTML، روش يادگيري ماشين K نزديكترين همسايه، روش خوشه بندي بر اساس الگوريتم K-Means و خوشه بندي بر اساس پيوندهاي خروجي است. سپس با استفاده از تمامي اين الگوريتم ها، دسته بندي صفحات وب مطابق با گروه بندي هاي از پيش تعيين شده انجام شده و پس از قرارگيري صفحات در گروه ها و دسته هاي مربوط به خود، ميزان درستي كار هر كدام از اين الگوريتم ها را از طريق روش هاي ارزيابي خوشه بندي سنجيده شده و با ساير الگوريتم ها مقايسه شده و درصد موفقيت هر يك را در گروه هاي مختلف محاسبه كرده و در نهايت به معرفي موفق ترين گروه در اين آزمايش پرداخته خواهد شد. اين طبقه بندي بوسيله 100 صفحه وب متعلق به 4 دسته آموزشي، پزشكي، خبري، ورزشي است
كشور
ايران
لينک به اين مدرک