• شماره ركورد
    1377708
  • عنوان مقاله

    خوشه بندي فازي چند هسته اي كلان داده ها در چارچوب نگاشت كاهش هدوپ

  • پديد آورندگان

    آذركسب ، اميد دانشگاه خواجه نصيرالدين طوسي , خواسته ، حسين دانشگاه صنعتي خواجه نصيرالدين طوسي , اميري ، مصطفي دانشگاه خواجه نصيرالدين طوسي

  • از صفحه
    85
  • تا صفحه
    103
  • كليدواژه
    داده هاي كلان , خوشه بندي , منطق فازي , يادگيري چند هسته اي , هدوپ , نگاشت كاهش
  • چكيده فارسي
    يك راه حل منطقي براي لحاظكردن همپوشاني خوشه ها، انتساب مجموعه اي از درجه عضويت به هر داده است. به دليل كمشدن افرازها و كوچك شدن فضاي جستجو، خوشه بندي فازي عموما داراي سربار محاسباتي كمتري بوده، تشخيص و مديريت داده هاي مبهم، نويزدار و داده هاي پرت نيز در آن به سهولت انجام ميگيرد. ازاينرو خوشه بندي فازي از نوع پيشرفته روش هاي خوشه بندي به شمار مي رود. اما روش هاي خوشه بندي فازي در مواجه با روابط غيرخطي داده ها ناتوانند. روش پيشنهادي اين مقاله مي كوشد تا مبتني بر ايده هاي امكان پذيري، از يادگيري چند هسته اي در چارچوب نگاشت كاهش هدوپ براي تشخيص خوشه هاي خطي جدايي ناپذير با ساختار كلان داده هاي پيچيده، استفاده كند. مدل يادگيري چند هسته اي قادر به كشف روابط پيچيده بين دادهاي بوده و در عين حال هدوپ ما را قادر خواهد ساخت تا به جاي تعامل با سيستم عامل و پردازنده، با يك كلاستر منطقي از پردازش ها و گره هاي انباره داده تعامل داشته باشيم و عمده كار را بر عهده فريمورك بيندازيم. به طور خلاصه مدل سازي روابط غيرخطي داده ها با استفاده از مدل يادگيري چند هسته اي، تعيين مقادير مناسب براي پارامترهاي فازيسازي و امكانپذيري، و ارائه الگوريتم در مدل نگاشت كاهش هدوپ از دستاوردهاي كليدي مقاله حاضر مي باشد. آزمايش ها برروي يكي از مجموعه داده هاي پر استفاده مخزن يادگيري UCI و همچنين برروي ديتاست شبيه ساز CloudSim پياده سازي شده است و نتايج قابل قبولي به دست آمده است. طبق مطالعات منتشر شده، مخزن يادگيري UCI براي مقاصد رگرسيون و خوشه بندي كلان داده، و مجموعه داده CloudSim براي شبيه سازي موارد مربوط به رايانش ابري، محاسبه تأخيرهاي زماني و زمان بندي انجام وظايف معرفي شده اند.
  • عنوان نشريه
    فناوري اطلاعات و ارتباطات ايران
  • عنوان نشريه
    فناوري اطلاعات و ارتباطات ايران