شماره ركورد كنفرانس :
3974
عنوان مقاله :
استخراج افزايشي الگوهاي پرتكرار از داده هاي قطعي
پديدآورندگان :
ميرمحمدصادقي زهرا msaadeghi.zahra@gmail.com دانشجوي كارشناسي ارشد، دانشكده ي مهندسي كامپيوتر، دانشگاه آزاد اسلامي واحد نجف آباد , زماني بروجني فرساد f.zamani@khuisf.ac.ir استاديار، دانشكده فني مهندسي، دانشگاه آزاد اسلامي واحد اصفهان (خوراسگان)،
كليدواژه :
داده هاي قطعي , استخراج افزايشي الگوهاي پر تكرار , كاهش هزينه بازسازي , درخت Spo-tree
عنوان كنفرانس :
ششمين كنفرانس ملي ايده هاي نو در مهندسي برق
چكيده فارسي :
پيدا كردن الگوهاي پرتكرار نقش مهمي را در داده كاوي و كشف دانش ايفا ميكند. در بسياري از برنامههاي كاربردي، پايگاه دادهها اغلب با اضافه، حذف و يا تغيير تراكنش ها روبرو هستند و در نتيجه الگوهاي پرتكرار استخراج شده از آن ها بايد بهروزرساني شوند. اخيرا الگوريتم SPO-tree جهت كاوش افزايشي الگوهاي پرتكرار ارائه شده است. با وجود اينكه اين الگوريتم يكي از راهكارهاي موثر براي استخراج افزايشي الگوهاي پرتكرار مبتني بر FP-tree در دادههاي قطعي است، با اين حال به دليل اينكه در اين الگوريتم شرط بازسازي درخت پس از ورود هر تراكنش بررسي مي گردد، عمليات بازسازي درخت هزينه محاسباتي بالايي را در برخواهد داشت. از طرفي چون بازسازي بر اساس اطلاعات محلي انجام ميگيرد امكان دارد شاخهاي بارها بازسازي شود. در اين مقاله راهكاري جهت برطرف نمودن محدوديتهاي فوق ارائه شده است كه در آن شرط بازسازي درخت پس از استخراج بلوكي از داده هاي افزايشي بررسي ميگردد. نتايج آزمايشات بر روي مجموعه دادگان متراكم و غير متراكم نشان مي دهد كه زمان استخراج الگوهاي پرتكرار در الگوريتم پيشنهادي نسبت به الگوريتم SPO-tree در دو حالت استخراج ايستا وپوياي الگوهاي پر تكرار از داده هاي قطعي، بهبود قابل توجهي داشته است.