شماره ركورد كنفرانس :
3299
عنوان مقاله :
الگوريتم كشف توالي هاي پرتكرار مبتني بر روشهاي Eclat و SPAM
پديدآورندگان :
سلطاني آزاده دانشگاه بجنورد - گروه مهندسي كامپيوتر , سلطاني محمود دانشگاه مهندسي فناوريهاي نوين قوچان - گروه مهندسي كامپيوتر
كليدواژه :
داده كاوي , الگوهاي پرتكرار , تواليهاي پرتكرار
عنوان كنفرانس :
اولين كنفرانس بين المللي فناوري هاي نوين در علوم
چكيده فارسي :
الگوريتمهاي كشف الگوهاي پرتكرار، به دنبال يافتن روابط جالب و نهفته بين داده ها هستند؛ اين درحاليست كه توجهي
به زمان، توالي و ترتيب دادهها ندارند. به منظور پوشش اين نقطه ضعف، مسئله كشف تواليهاي پرتكرار مطرح شده است كه تا
كنون الگوريتمهاي متنوعي براي آن ارائه شده است. در بين اين روشها، الگوريتم SPAM كه رويكردي عمودي دارد، در پايگاه
دادههاي بزرگ و فشرده، داراي كارايي بيشتري است. SPAM در هر مرحله، بدون نياز به گذرهاي هزينه بر از مجموعه داده،
تواليهاي كانديد را توليد ميكند و با شمارش آنها، تعداد تكرار و در نتيجه تواليهاي پرتكرار را مييابد. در الگوريتم پيشنهادي
سعي شده است به كمك روش Eclat و با اعمال محدوديت بر روي تواليهاي كانديد و كاهش تعداد آنها، زمان اجراي روش
SPAM بهبود داده شود. آزمايشهاي انجام شده نشان ميدهند روش پيشنهادي، زمان اجرا و حافظه مصرفي را كاهش داده
است.
چكيده لاتين :
Pattern mining algorithms aim to find interesting relations among data. However, they do not take into account the sequential ordering of events. To address this issue, sequential pattern mining task was proposed for which several efficient algorithms have been introduced. Among these algorithms, SPAM, a vertical based approach, is more efficient in dense and large datasets. It generates candidate patterns and calculates their supports without performing costly database scans. To improve the efficiency of SPAM, we propose an approach for pruning candidate sequences using Eclat. Experimental results show that our proposed approach is more efficient than SPAM in terms of runtime and memory.