شماره ركورد كنفرانس :
4726
عنوان مقاله :
كاربرد روش هاي آماري در تحليل و پردازش داده هاي بزرگ
پديدآورندگان :
ابطحي آسيه Asieh_abtahi@yahoo.com 1 استاد يار، گروه رياضي و آمار، واحد شيراز، دانشگاه آزاد اسلامي، شيراز،ايران
كليدواژه :
داده بزرگ , مدل سازي لگاريتم خطي , نظريه يادگيري , درخت رده بندي رگرسيوني.
عنوان كنفرانس :
چهارمين كنفرانس ملي محاسبات توزيعي و پردازش داده هاي بزرگ
چكيده فارسي :
با گسترش علم در زمينه هاي مختلف، هر روز با انبوهي از اطلاعات مواجه خواهيد شد. ذخيره سازي و نتيجه گيري از اين اطلاعات به دست آمده خود سبب پيدايش علوم جديدي شده است. داده بزرگ و تحليل داده بزرگ يكي از اين موارد است كه در دهه ي اخير مورد توجه محققان زيادي قرار گرفته است. . داده هاي بزرگ به عنوان مجموعه داده هايي شناخته شده است كه توانايي برنامه هاي كاربردي و تكنولوژي هاي معمول را در مديريت و تجزيه و تحليل دچار چالش كرده است. وجود هرگونه خطا و اشتباهي در تحليل داده ها مي تواند به نتيجه گيري هاي نادرستي منجر گردد. استفاده از روش هاي آماري زمينه هاي علمي، براي تجزيه و تحليل داده هاي عيني را فراهم مي سازد و منجر به ارائه ي نتايج با معنا و معتبر از اطلاعات جمع آوري شده مي گردد. حجم ، مقياس و ساختار داده هاي حال حاضر چالش هاي آماري ايجاد كرده است. براي درك قوي از اطلاعات موجود در داده هايي با حجم زياد استفاده از روش هاي كلاسيك آماري به تنهايي كارا نيست. ايجاد ارتباط بين روش هاي آماري و علوم رايانه اي، سبب مي شود كه روش هاي كارا و سريعي براي استخراج اطلاعات نهفته ي مجموعه اي بزرگ از داده ها ارائه گردد و منجر به طيف گسترده اي ازبينش ها و منافع شود. با كمك آمار و ساير رشته هاي وابسته به آن مانند داده كاوي، يادگيري ماشين، شبكه هاي عصبي، تحليل شبكه هاي اجتماعي، پردازش سيگنال، تشخيص الگو، روشهاي بهينه ساز ي و تجسم رويكردها مي توان اطلاعات نهفته ي مجموعه اي بسيار بزرگ از داده ها را به دست آورد. تركيب مدل سازي لگاريتم خطي به عنوان يك روش آماري با رده بندي درخت رگرسيوني كه از تكنيك هاي .يادگيري ماشين يكي از روشهايي است كه در تحليل داده هاي رسته اي نقش مهمي دارند و در اين تحقيق مورد بررسي قرار داده شده است.