Title of article :
MINING FUZZY TEMPORAL ITEMSETS WITHIN VARIOUS TIME INTERVALS IN QUANTITATIVE DATASETS
Author/Authors :
Mahnaz Kadkhoda، Mahnaz Kadkhoda نويسنده Department of Computer Engineering, Center of Excellence on Soft Computing and Intelligent Information Processing, Ferdowsi University of Mashhad, Mashhad, Iran , , Mohammad-R. Akbarzadeh-T، Mohammad-R. Akbarzadeh-T نويسنده Department of Computer Engineering, Center of Ex- cellence on Soft Computing and Intelligent Information Processing, Ferdowsi Univer- sity of Mashhad, Mashhad, Iran , , S. Mahmoud Taheri، S. Mahmoud Taheri نويسنده S. Mahmoud Taheri, S. Mahmoud Taheri
Issue Information :
دوماهنامه با شماره پیاپی 0 سال 2016
Abstract :
هدف از اين تحقيق ارايه روشي جديد جهت كشف الگو هاي زماني پرتكرار در زيرمجموعه هايي پيوسته ازمجموعه داده هاي مقداري مي باشد. ذكر اين نكته لازم است كه گرچه اين الگوهاي زماني ممكن است در بازه هاي زماني مشخص داراي تعداد تكراربالايي بوده واز پشتيبان بالايي برخوردار باشند، الزاما اين امر در كل مجموعه داده صدق نميكند. به همين دليل نيز استخراج اين الگوها با الگوريتم هاي كلاسيك موجود تقريبا غير ممكن است. اين مقاله، دقيقا به اين مشكل مي پردازد و الگوريتمي جديد بنام FSLIM (استخراج الگوهاي زباني صلب فازي)به منظور استخراج SLI ها (الگوي زباني صلب)از مجموعه داده هاي مقداري ارايه مينمايد.SLI مفهوم جديدي است كه در اين مقاله به عنوان بخشي اساسي از حل مسيله معرفي شده است. روش پيشنهادي شامل دو مرحله است: در مرحله اول، با استفاده از نظريه مجموعه هاي فازي هر مقدارعددي به يك مقدار كلاميتبديل ميشود و در مرحله دوم، همهSLI ها استخراج ميشوند. در پايان، كارآيي FSLIM از نظرزمان اجرا، مقياس پذيري و تعداد الگوهاي زماني پرتكراردر مجموعه داده هاي آزمايشگاهي با دو الگوريتم كلاسيك مقايسه شدهاست. همچنين به منظورنشان دادن قابليتFSLIM در كشف دانش پنهان كه با استفاده از روشهاي كلاسيك قابل استخراج نيست، الگوريتمپيشنهادي برروي مجموعه داده هاي واقعي ترافيك شهر مشهد نيزاجرا شده است.
Abstract :
This research aims at proposing a new method for discovering fre-
quent temporal itemsets in continuous subsets of a dataset with quantitative
transactions. It is important to note that although these temporal itemsets
may have relatively high support or occurrence within particular time inter-
vals, they do not necessarily get similar support across the whole dataset, which
makes it almost impossible to extract them using the existing traditional al-
gorithms. This paper directly addresses this problem and introduces a new
algorithm called Fuzzy Solid Linguistic Itemset Mining (FSLIM) to discover
Solid Linguistic Itemsets (SLIs) within a quantitative dataset. SLI is a new
concept introduced here as an essential part of the solution presented in this
paper. The proposed method consists of two phases. In the first phase, fuzzy
set theory is used to transform each quantitative value to a linguistic item; and
in the second phase, all SLIs are extracted. Finally, the efficiency of FSLIM is
compared in terms of execution time, scalability and the number of frequent
patterns with those of two classic approaches on synthetic datasets. The pro-
posed approach is also applied to an actual Mashhad Urban Traffic dataset in
order to illustrate FSLIMʹs ability in discovering the hidden knowledge that
could not be extracted by traditional methods.
Journal title :
Iranian Journal of Fuzzy Systems (IJFS)
Journal title :
Iranian Journal of Fuzzy Systems (IJFS)