شماره ركورد كنفرانس :
4227
عنوان مقاله :
استخراج زيرگراف‌هاي تكرارشونده با توزيع متوازن بار در نگاشت-كاهش مبتني بر واحد پردازش گرافيكي
عنوان به زبان ديگر :
Load Balanced Frequent Subgraph Mining using GPU based MapReduce
پديدآورندگان :
عطارباشي مهدي mahdiattarbashi@yahoo.com دانشگاه آزاد اسلامي مشهد; , دلداري حسين hdeldari@yahoo.com دانشگاه آزاد اسلامي مشهد; , بهره‌پور داود BAHREPOUR@IEEE.ORG دانشگاه آزاد اسلامي مشهد;
تعداد صفحه :
20
كليدواژه :
نگاشت-كاهش , استخراج زيرگراف‌هاي تكرارشونده , هادوپ , كودا , واحد پردازش گرافيكي , توزيع متوازن
سال انتشار :
1395
عنوان كنفرانس :
چهارمين كنفرانس ملي پژوهش هاي كاربردي در مهندسي كامپيوتر و پردازش سيگنال - cesp95
زبان مدرك :
فارسي
چكيده فارسي :
با گسترش روز افزون داده‌ها، چالش‌هاي بنياديني براي به دست آوردن اطلاعات از مجموعه عظيمي از داده‌ها ظهور پيدا كرده است. استخراج زيرگرافهاي تكرارشونده يكي از مسائل مهم در كاوش مجموعه بزرگي از گراف¬ها است. اين موضوع در زمينه‌هاي كاربردي زيادي نظير: انفورماتيك پزشكي، شبكه‌هاي اجتماعي و تركيبات شيميايي و غيره داراي اهميت زيادي نيز مي‌باشد. هادوپ يك رويكرد بسيار قابل قبول براي مديريت حجم عظيمي از داده‌ها است و همچنين براي تسريع محاسبات، استفاده از امكانات موازي‌سازي GPU بسيار مناسب است. با مجتمع سازي GPU درون هادوپ مي‌توان از مزاياي هر دو به صورت همزمان استفاده نمود. در اين مقاله، با در نظر گرفتن يك روش بخش‌بندي بر اساس تراكم گراف‌ها به كمك الگوريتم WFD و با استفاده از هادوپ تكراري مبتني بر GPU، روش نويني به نام CH-FSM براي استخراج زيرگراف‌هاي تكرارشونده در مقياس بزرگ ارائه مي‌گردد. از نظر برگرداندن تمامي زيرگرافهاي تكرارشونده براي حداقل درجه پشتيباني مشخص‌شده، CH-FSM يك روش كامل مي‌باشد. نتايج آزمايشهاي جامع انجام گرفته بر روي مجموعه‌هاي داده واقعي و مصنوعي نشان مي‌دهد كه روش CH-FSM به تسريع 5/1 برابري در مقابل آخرين روش ارائه شده براي استخراج كامل زيرگراف‌هاي تكرارشونده مبتني بر نگاشت-كاهش دست يافته است.
چكيده لاتين :
In this paper, by considering a density based partitioning technique using GPU based iterative Hadoop, we propose a novel approach called CH-FSM for large-scale frequent subgraph mining. Our optimal partitioning method aims to balance computational load on a collection of machines. We partition the collection of graphs among worker nodes according to graph density with an optimal heuristic algorithm (WFD) to achieve load balancing. In terms of returning all the frequent subgraphs for a given user-defined support, CH-FSM is complete. Our extensive experimental results on real-world and synthetic datasets reveal, that our CH-FSM method speedups up to 1.5 over the state-of-the-art method in MapReduce based frequent subgraph mining.
كشور :
ايران
لينک به اين مدرک :
بازگشت