عنوان مقاله :
استفاده از الگوريتم بهينهسازي گرگ خاكستري در خوشهيابي كلاندادهها
عنوان به زبان ديگر :
Using Grey Wolf Optimization Algorithm in Big Data Clustering
پديد آورندگان :
بهروان، ايمان دانشگاه بيرجند - دانشكده مهندسي برق و كامپيوتر، بيرجند، ايران , ظهيري، حميد دانشگاه بيرجند - دانشكده مهندسي برق و كامپيوتر، بيرجند، ايران , رضوي، محمد دانشگاه بيرجند - دانشكده مهندسي برق و كامپيوتر، بيرجند، ايران , ترازارتي، روبرتو موسسه علوم و فناوري اطلاعات - آزمايشگاه استخراج اطلاعات و داده كاوي، پيزا، ايتاليا
كليدواژه :
كلانداده , خوشهيابي خودكار ر , وشهاي هوش جمعي , الگوريتم بهينهسازي گرگ خاكستري
چكيده فارسي :
امروزه حجم بسيار زيادي از اطلاعات و دادهها از منابع مختلف نظير گوشيهاي هوشمند، شبكههاي اجتماعي، تكنولوژيهاي عكاسي و ساير منابع توليد ميشود. بررسي و پردازش اين حجم عظيم از اطلاعات چالش دهههاي اخير است كه به آن كلانداده گفته ميشود. يكي از روشهاي پركاربرد استخراج اطلاعات، خوشهيابي است. خوشهيابيِ كلاندادهها چالش بزرگي است كه توجه بسياري از محققين را به خود جلب كرده است. در اين پژوهش ابتدا يك روش خوشهيابي غير خودكار (براي حالتي كه تعداد خوشهها از قبل مشخص است) و سپس يك روش خوشهيابي خودكار (قادر به يافتن تعداد خوشهها) با استفاده از الگوريتم بهينهسازي گرگ خاكستري براي خوشهيابي كلاندادهها ارائه شده است. روش خوشهيابي خودكار يك روش دو مرحلهايست كه در مرحلهي اول يك ساختار درخت گونه از الگوريتم مورد نظر براي يافتن تعداد خوشهها اجرا ميشود و در مرحلهي دوم الگوريتم اصلي فضا را براي يافتن موقعيت مراكز خوشهها جستوجو ميكند. عملكرد روش ارائه شده بر روي 13 مجموعه دادهي مصنوعي و 2 مجموعه كلاندادهي واقعي مربوط به مسيرهاي طي شده توسط خودروها در سطح شهر پيزا مورد ارزيابي قرار گرفته و نتايج آن بررسي شده است. نتايج به دست آمده نشان از دقت بالاي اين الگوريتم در خوشهيابي دادههاي بزرگ و حجيم دارد.
چكيده لاتين :
The huge amount of data created constantly with increasing rate from different sources such as smart phones, social media, imaging technologies and etc. becomes difficult to be analyzed by conventional data analytic tools. For this reason a new field of research called Big Data Analytics is growing faster in the research and industrial communities. Clustering big datasets is one of the important challenges which attracts more and more attentions among researchers. In this paper first a method for non-automatic big data clustering (when the number of clusters is known) and then a two-stage method for big data automatic clustering (able in finding the number of clusters) based on grey wolf optimization algorithm are introduced. In the first stage the algorithm tries to find the number of clusters using a tree structure and in the second stage the main algorithm searches the solution space to find the position of centroids. The methodology is tested on 13 synthetics and 2 real big mobility datasets. The achieved results show its effectiveness in big data clustering.
عنوان نشريه :
مهندسي برق دانشگاه تبريز