شماره ركورد كنفرانس :
3376
عنوان مقاله :
تحليل كاربران وب با استفاده از الگوريتم هاي خوشهبندي
عنوان به زبان ديگر :
Web Users Analysis Using Clustering Algorithms
پديدآورندگان :
زهره شكراللهي زهره x z.shokrollahi2012@gmail.com مؤسسه آموزش عالي جهاددانشگاهي اصفهان , كريمي اصغر AS.karimi52@gmail.com مؤسسه آموزش عالي جهاددانشگاهي اصفهان
كليدواژه :
وب پژوهي , خوشهبندي , الگوريتم k-ميانگين , الگوريتم خوشهبندي دومرحلهاي , الگوريتم كوهونن.
عنوان كنفرانس :
چهارمين كنفرانس بين المللي وب پژوهي
چكيده فارسي :
با توسعهي سريع شبكه جهاني وب و افزايش حجم اطلاعات، وب¬ پژوهي به حوزه تحقيقاتي مهمي تبديل شد. تحقيقات در وب پژوهي به طور عمده به دو دستهي كاوش محتواي وب و كاوش استفاده از وب دستهبندي ميشود. يك موضوع مهم در كاوش استفاده از وب، خوشهبندي كاربران به عبارت ديگر گروهبندي اين كاربران به خوشههايي بر اساس ويژگيهاي مشترك آنها است. در اين مقاله با استفاده از سه روش k-ميانگين، كوهونن و خوشهبندي دومرحلهاي كاربران را به گروههايي با ويژگيهاي مشابه خوشهبندي كرده و جهت افزايش كيفيت خوشهبندي از روش تحليل مؤلفه اصلي و براي ارزيابي كيفيت خوشهبندي از معيار سيلهوت استفاده نموديم. در بين اين سه روش k-ميانگين با دو خوشه بالاترين كيفيت را داشته و مجموعه داده با استفاده از اين روش خوشهبندي و تحليل شد. نتايج و يافتههاي اين تحقيق با بهينهسازي خوشهبندي ميتواند براي دانشجويان، طراحان وب و ارائهدهندگان خدمات و تبليغات اينترنتي مفيد بوده و به ارائهي خدمات هدفمند و سفارشي به كاربران منجر شود.
چكيده لاتين :
With the rapid development of the World Wide Web and increasing the volume of information, Web research has become an important research area. Web mining research is mainly categorized into two types of web content mining and web usage mining. An important topic in web usage mining is the clustering of users in other words, grouping these users into clusters based on their common features. In this paper, using k-means, Kohonen, and TwoStep methods, we clustered the users into groups with similar characteristics and used the principal component analysis method to enhance clustering quality and use the silhouette criterion to assess clustering quality. Among these three methods, k-means with two clusters had the highest quality and the data set was clustered and analyzed using this method. By analyzing the clusters, can get a better understanding of the users and provide custom and more convenient services for them.