شماره ركورد :
1775
عنوان :
بكارگيري سيستمهاي NOSQL به عنوان ابزار پردازش كلان داده ها در جستجو و بازيابي تمام متن
شرح پديد آور/مجري (مجريان) طرح :
پهلوان زاده، بهاره
سال نشر :
1398
تنالگان :
مركز منطقه اي اطلاع رساني علوم و فناوري
چكيده فارسي :
امروزه داده ها به عنوان يك دارائي ملي شناخته مي شوند. همچنين پردازش، تحليل و استفاده از داده به عنوان يك عامل كليدي براي رشد كليه سازمانها تبديل شده است و موجب مزيت رقابتي در كسب و كارها، محرك نوآوري، افزايش رقابت و اثرات مثبت اجتماعي خواهد شد. مركز منطقه اي اطلاع رساني علوم و فناوري نيز از اين قضيه مستثني نمي باشد و با توجه به افزايش حجم داده ها بصورت تصاعدي براي مثال در طي سال اخير رشد 50 %داده هاي آن را بر بستر پايگاه داده رابطه اي Server SQL Microsoft شاهد بوديم و همچنين با لحاظ نمودن ماموريتهاي اين مركز در ارائه خدمات از طريق پايگاههاي داده مقاالت تمام متن و موتور جستجوي اختصاصي آن، نياز به ارائه راهكارهاي نوين پردازشي يك ضرورت محسوب ميشود. در اين پژوهش با توجه به ورود تكنولوژيهاي نويني همچون پايگاههاي داده غير رابطه اي و سيستمهاي NOSQL در عصر داده هاي حجيم، ضمن كسب دانش كار با سيستمهاي نوظهور NOSQL به بررسي بكارگيري و ارزيابي آنها در قياس با پايگاه داده رابطه اي موجود بعنوان راهكاري احتمالي براي حل مشكالت آتي و پيش رو در اثر رشد تصاعدي داده هاي مبتني بر سند مركز منطقه اي پرداخته شده است. براي ارزيابي مزايا و معايب پايگاههاي داده غير رابطه اي در قياس با پايگاههاي داده رابطه اي، معيار زمان بازيابي و معيار جديد كيفيت بازيابي تعريف گرديد و پايگاه هاي داده رابطه اي SQL Microsoft و MariaDB و پايگاه هاي داده غير رابطه اي MongoDB و Elasticsearch مقايسه گرديدند. نتايج پژوهش برتري چشمگير ElasticSearch و Server SQL Microsoft نسبت به دو پايگاه داده ديگر از ديدگاه معيارهاي زمان بازيابي و كيفيت بازيابي را نشان داد. همچنين مشاهده شد كه با افزايش تعداد شاردها در Search Elastic؛ Elasticsearch برتري خود را نسبت به ساير پايگاههاي داده افزايش مي دهد.
چكيده انگليسي :
Today, data is known as a national asset. Also, data processing and analysis have become a key factor for the development of all organizations, resulting in competitive advantage for the businesses, increased competition, and positive social impacts. Center is not an exception; considering the progressive increase in data volume (for example, data has increased 50% over the Microsoft SQL Server relational database). Also, considering the mission of this center in providing services through full-text articles databases, and its specific search engine, offering a novel processing approach is a necessity. In this study, considering the emergence of novel technologies like non-relational databases and NOSQL systems in the big data era, the knowledge required to work with NOSQL systems is achieved, and they are compared with the existing relational databases as a probable approach for solving the future problems resulting from progressive document-based data in the center. To evaluate the advantages and disadvantages of the non-relational databases compared to the relational databases, the retrieval time and retrieval quality measures are introduced, and the Microsoft SQL, and MariaDB relational databases are compared with MongoDB and Elasticsearch non-relational databases. The results indicate superiority of ElasticSearch and Microsoft SQL Server compared to the other databases in terms of retrieval time and retrieval quality. Also, it is observed that by increasing the number of shards in EalsticSearch, its superiority over other databases increases.
كليدواژه :
پردازش و تحليل داده ها , كلان داده ها , پايگاه داده رابطه اي , پايگاه داده غير رابطه اي , (سيستمهاي NOSQL)
اطلاعات نشر :
شيراز مركز منطقه اي اطلاع رساني علوم و فناوري
مشخصات ظاهري :
جدول، رنگي، مصور، نمودار
فروست :
مركز منطقه اي اطلاع رساني علوم و فناوري
كليدواژه - جزئيات :
لينک به اين مدرک :
بازگشت