شماره ركورد :
916801
عنوان مقاله :
تحليل خوشه‌بندي فازي داده‌هاي تركيبي و مقايسه آن با دندروگرام اكتشافي داده‌هاي تركيبي ژئوشيمي رسوبات آبراهه‌اي منطقه انار
عنوان فرعي :
Fuzzy clustering analysis of compositional data and comparing it with exploratory compositional data dendrogram, case study: Anar region stream sediments geochemistry
پديد آورندگان :
معینی، حمید نويسنده دانشكده مهندسی معدن-دانشگاه یزد Moini, Hamid , محمدتراب، فرهاد نويسنده دانشكده مهندسی معدن-دانشگاه یزد Mohammadtorab, ّFarhad , كیخای حسین پور، مجید نويسنده دانشكده مهندسی معدن-دانشگاه یزد Keykha Hosseinpour, Majid
اطلاعات موجودي :
دوفصلنامه سال 1395 شماره 12
رتبه نشريه :
علمي پژوهشي
تعداد صفحه :
9
از صفحه :
11
تا صفحه :
19
كليدواژه :
الگوريتم fanny , تبديل clr , رسوبات آبراهه‌اي , دندروگرام داده‌هاي تركيبي , فاصله آيچيسون , منطقه انار
چكيده فارسي :
از روش‌های مهم در داده‌كاوی نظارت نشده داده‌های ژئوشیمیایی، انواع روش‌های خوشه‌بندی است كه چنانچه روی متغیرها انجام شوند منجر به كاهش ابعاد داده‌ها می‌شوند. در میان انواع روش‌های خوشه‌بندی، نوع فازی آن به دلیل ویژگی‌های خاص منطق فازی و انعطاف بیشتر در تعیین گروه‌های داده مشابه، در سالیان اخیر بسیار مورد توجه قرار گرفته است. در این پژوهش از الگوریتم فازی منعطف به نام FANNY به منظور خوشه‌بندی متغیرهای داده‌های ژئوشیمی رسوبات آبراهه‌ای كه خاصیت تركیبی دارند، استفاده شده است. با تحقیقات گسترده محققان علم آمار و ارائه روش‌های جدید بازكردن داده‌های تركیبی، مشخص شده است كه فاصله‌ها و روابط دیگری بر فضای این نوع داده‌ها حاكم است كه برای درك بهتر آنها نیاز به انتقال ایزومتریك به فضای اقلیدسی است تا قابل استفاده و تفسیر با روابط كلاسیك آماری باشند. در پژوهش حاضر، پس از آماده‌سازی داده‌های ژئوشیمی رسوبات آبراهه‌ای منطقه انار كرمان (به عنوان مثالی از داده‌های تركیبی با ابعاد زیاد) ابتدا دندروگرام اكتشافی روی متغیرها در فضای سیمپلكس و با استفاده از پارتیشن دودوئی ترتیبی(SBP) پیش فرض، محاسبه و ترسیم شد كه با بكارگیری این روش، تعداد 4 خوشه با متغیرهای مشابه شناسایی شد. سپس دوباره با استفاده از الگوریتم fanny، همان متغیرهای داده‌های باز شده با تبدیل clr خوشه‌بندی شد. نتایج خوشه‌بندی متغیرها با الگوریتم fanny انطباق قابل قبولی با دندروگرام اكتشافی داده‌های تركیبی نشان داد. در صورتی كه SBP مورد نیاز برای بالانس‌های دندروگرام اكتشافی در مختصات ایزومتریك با شناخت كامل‌تر از متغیرها و نه بصورت پیش فرض تعیین شود نتایج دندروگرام دقت بسیار بهتری خواهد داشت.
چكيده لاتين :
Summary One of the most important methods in unsupervised datamining is clustering  that when applied on variables leads to dimension reduction. Among all of them, fuzzy clustering methods are preferred because of special features and better flexibility in partitioning groups.  In this study, FANNY algorithm proposed by Kauffmann and Rousseuw has been applied in variable clustering of the  geochemical stream sediments that have a compositional nature. Referring to the extensive recent researches and novel methods presented in opening  compositional data, another definition of distance is needed for them to be transformed isometrically to the euclidean space to be interpretable with classical operations. In this case study after preparation of geochemical stream sediments data of Anar region in Kerman, first the exploratory dendrogram of the simplex space was plotted and 4 clusters were obtained. Then using fanny algorithm, clr-transformed variables were clustered. It showed an acceptable conformity with the dendrogram results. In case of determining the balances of SBP manually instead of default and with a prior knowledge, the results of exploratory dendrogram would be more precise.      Introduction Geochemical exploration based on stream sediment analysis, is one of the most important methods in assessing mineral potentials in prospecting brownfield areas. Different statistical methods have been developed to identify the pattern of groups of associated geochemical elements in the last decades. In this research, stream sediments data clustering of Anar exploratory region have been analyzed with a particular perspective of the closed nature of geochemical datasets using two known methods, fuzzy clustering and exploratory dendrogram.   Methodology and Approaches First, using R software compositions-package, exploratory dendrogram of compositional data was calculated and plotted based on ward criterion and default sequential binary partition balances in simplex space. Due to applying this method, 4 clusters were detected. Then by applying  fanny algorithm (cluster package) –one of the most flexible ones in fuzzy clusterings –on clr- transformed data, 4 clusters with the best silhouette were determined. The fuzzification degree was selected in a way that would be near to crisper methods like dendrogram in order to compare the results.     Results and Conclusions Although different methods applied on transformed compositional data, their similar results showed very good conformity with lithology and geological structures. It presented a good separation in simplex space. If the balances in SBP are to be defined manually, the reduced dimensions of the variables would be more informative.
سال انتشار :
1395
عنوان نشريه :
روش هاي تحليلي و عددي در مهندسي معدن
عنوان نشريه :
روش هاي تحليلي و عددي در مهندسي معدن
اطلاعات موجودي :
دوفصلنامه با شماره پیاپی 12 سال 1395
كلمات كليدي :
#تست#آزمون###امتحان
لينک به اين مدرک :
بازگشت