شماره ركورد :
1141258
عنوان مقاله :
استفاده از الگوريتم بهينه‌سازي گرگ خاكستري در خوشه‌يابي كلان‌داده‌ها
عنوان به زبان ديگر :
Using Grey Wolf Optimization Algorithm in Big Data Clustering
پديد آورندگان :
بهروان، ايمان دانشگاه بيرجند - دانشكده مهندسي برق و كامپيوتر، بيرجند، ايران , ظهيري، حميد دانشگاه بيرجند - دانشكده مهندسي برق و كامپيوتر، بيرجند، ايران , رضوي، محمد دانشگاه بيرجند - دانشكده مهندسي برق و كامپيوتر، بيرجند، ايران , ترازارتي، روبرتو موسسه علوم و فناوري اطلاعات - آزمايشگاه استخراج اطلاعات و داده كاوي، پيزا، ايتاليا
تعداد صفحه :
22
از صفحه :
41
تا صفحه :
62
كليدواژه :
كلان‌داده , خوشه‌يابي خودكار ر , وش‌هاي هوش جمعي , الگوريتم بهينه‌سازي گرگ خاكستري
چكيده فارسي :
امروزه حجم بسيار زيادي از اطلاعات و داده‌ها از منابع مختلف نظير گوشي‌هاي هوشمند، شبكه‌هاي اجتماعي، تكنولوژي‌هاي عكاسي و ساير منابع توليد مي‌شود. بررسي و پردازش اين حجم عظيم از اطلاعات چالش دهه‌هاي اخير است كه به آن كلان‌داده گفته مي‌شود. يكي از روش‌هاي پركاربرد استخراج اطلاعات، خوشه‌يابي است. خوشه‌يابيِ كلان‌داده‌ها چالش بزرگي است كه توجه بسياري از محققين را به خود جلب كرده است. در اين پژوهش ابتدا يك روش خوشه‌يابي غير خودكار (براي حالتي كه تعداد خوشه‌ها از قبل مشخص است) و سپس يك روش خوشه‌يابي خودكار (قادر به يافتن تعداد خوشه‌ها) با استفاده از الگوريتم بهينه‌سازي گرگ خاكستري براي خوشه‌يابي كلان‌داده‌ها ارائه شده است. روش خوشه‌يابي خودكار يك روش دو مرحله‌ايست كه در مرحله‌ي اول يك ساختار درخت گونه از الگوريتم مورد نظر براي يافتن تعداد خوشه‌ها اجرا مي‌شود و در مرحله‌ي دوم الگوريتم اصلي فضا را براي يافتن موقعيت مراكز خوشه‌ها جست‌وجو مي‌كند. عملكرد روش ارائه شده بر روي 13 مجموعه داده‌ي مصنوعي و 2 مجموعه كلان‌داده‌ي واقعي مربوط به مسيرهاي طي شده توسط خودروها در سطح شهر پيزا مورد ارزيابي قرار گرفته و نتايج آن بررسي شده است. نتايج به دست آمده نشان از دقت بالاي اين الگوريتم در خوشه‌يابي داده‌هاي بزرگ و حجيم دارد.
چكيده لاتين :
The huge amount of data created constantly with increasing rate from different sources such as smart phones, social media, imaging technologies and etc. becomes difficult to be analyzed by conventional data analytic tools. For this reason a new field of research called Big Data Analytics is growing faster in the research and industrial communities. Clustering big datasets is one of the important challenges which attracts more and more attentions among researchers. In this paper first a method for non-automatic big data clustering (when the number of clusters is known) and then a two-stage method for big data automatic clustering (able in finding the number of clusters) based on grey wolf optimization algorithm are introduced. In the first stage the algorithm tries to find the number of clusters using a tree structure and in the second stage the main algorithm searches the solution space to find the position of centroids. The methodology is tested on 13 synthetics and 2 real big mobility datasets. The achieved results show its effectiveness in big data clustering.
سال انتشار :
1399
عنوان نشريه :
مهندسي برق دانشگاه تبريز
فايل PDF :
8113205
لينک به اين مدرک :
بازگشت