شماره ركورد كنفرانس :
4227
عنوان مقاله :
استخراج زيرگرافهاي تكرارشونده با توزيع متوازن بار در نگاشت-كاهش مبتني بر واحد پردازش گرافيكي
عنوان به زبان ديگر :
Load Balanced Frequent Subgraph Mining using GPU based MapReduce
پديدآورندگان :
عطارباشي مهدي mahdiattarbashi@yahoo.com دانشگاه آزاد اسلامي مشهد; , دلداري حسين hdeldari@yahoo.com دانشگاه آزاد اسلامي مشهد; , بهرهپور داود BAHREPOUR@IEEE.ORG دانشگاه آزاد اسلامي مشهد;
كليدواژه :
نگاشت-كاهش , استخراج زيرگرافهاي تكرارشونده , هادوپ , كودا , واحد پردازش گرافيكي , توزيع متوازن
عنوان كنفرانس :
چهارمين كنفرانس ملي پژوهش هاي كاربردي در مهندسي كامپيوتر و پردازش سيگنال - cesp95
چكيده فارسي :
با گسترش روز افزون دادهها، چالشهاي بنياديني براي به دست آوردن اطلاعات از مجموعه عظيمي از دادهها ظهور پيدا كرده است. استخراج زيرگرافهاي تكرارشونده يكي از مسائل مهم در كاوش مجموعه بزرگي از گراف¬ها است. اين موضوع در زمينههاي كاربردي زيادي نظير: انفورماتيك پزشكي، شبكههاي اجتماعي و تركيبات شيميايي و غيره داراي اهميت زيادي نيز ميباشد. هادوپ يك رويكرد بسيار قابل قبول براي مديريت حجم عظيمي از دادهها است و همچنين براي تسريع محاسبات، استفاده از امكانات موازيسازي GPU بسيار مناسب است. با مجتمع سازي GPU درون هادوپ ميتوان از مزاياي هر دو به صورت همزمان استفاده نمود. در اين مقاله، با در نظر گرفتن يك روش بخشبندي بر اساس تراكم گرافها به كمك الگوريتم WFD و با استفاده از هادوپ تكراري مبتني بر GPU، روش نويني به نام CH-FSM براي استخراج زيرگرافهاي تكرارشونده در مقياس بزرگ ارائه ميگردد. از نظر برگرداندن تمامي زيرگرافهاي تكرارشونده براي حداقل درجه پشتيباني مشخصشده، CH-FSM يك روش كامل ميباشد. نتايج آزمايشهاي جامع انجام گرفته بر روي مجموعههاي داده واقعي و مصنوعي نشان ميدهد كه روش CH-FSM به تسريع 5/1 برابري در مقابل آخرين روش ارائه شده براي استخراج كامل زيرگرافهاي تكرارشونده مبتني بر نگاشت-كاهش دست يافته است.
چكيده لاتين :
In this paper, by considering a density based partitioning technique using GPU based iterative Hadoop, we propose a novel approach called CH-FSM for large-scale frequent subgraph mining. Our optimal partitioning method aims to balance computational load on a collection of machines. We partition the collection of graphs among worker nodes according to graph density with an optimal heuristic algorithm (WFD) to achieve load balancing. In terms of returning all the frequent subgraphs for a given user-defined support, CH-FSM is complete. Our extensive experimental results on real-world and synthetic datasets reveal, that our CH-FSM method speedups up to 1.5 over the state-of-the-art method in MapReduce based frequent subgraph mining.