عنوان مقاله :
طراحي سامانه نيمه خودكار ساخت هستي شناسي به كمك تحليل هم رخدادي واژگان و روش C-value ( مطالعه موردي: حوزه علم سنجي ايران)
عنوان به زبان ديگر :
Designing Semiautomatic System in Ontology Structure by Co-occurrence Word Analysis and C-value Method (Case Study: The Field of Scientometrics of Iran
پديد آورندگان :
احمدي، حميد دانشگاه شهيد چمران اهواز - گروه علم اطلاعات و دانش شناسي , حيدري مقدم، غلامرضا دانشگاه شهيد چمران اهواز - گروه علم اطلاعات و دانش شناسي , عصاره، فريده دانشگاه شهيد چمران اهواز - گروه علم اطلاعات و دانش شناسي , حسيني بهشتي، ملوك السادت پژوهشگاه علوم و فناوري اطلاعات ايران - ايرانداك - پژوهشكده مديريت دانش
كليدواژه :
هستي شناسي , حوزه ي علم سنجي ايران , هم رخدادي واژگان , روش C- value , خوشه بندي اسناد
چكيده فارسي :
هستي شناسي ها ابزار بيان رسمي مفاهيم و روابط موجود در قلمرويي خاص هستند. در سال هاي اخير تلاش هاي زيادي براي طراحي روش هاي يادگيري و خودكار سازي فرايند ساخت هستي شناسي انجام شده است. از آنجا كه هستي شناسي را مجموعه مفاهيم و روابط آن مي دانيم، استخراج مفاهيم و روابط معنايي ميان اين مفاهيم از اهميت بسياري برخودار است. ساخت انواع هستي شناسي براي انواع قلمروها و كاربردهاي گوناگون، فرايندي پرهزينه و زمان بَر بوده و خودكارسازي اين فرايند، گام مهمي در رفع آن است. عدم وجود دانش پايه مانند اصطلاح نامه ها يا پايگاه هاي دانش حوزه ها، اكتساب دانش براي ساخت هستي شناسي آن حوزه ها مشكل خواهد بود. در پژوهش حاضر روشي نيمه خودكاري براي اكتساب دانش در حوزه علم سنجي ايران ارائه شده كه قادر است اطلاعات اين حوزه را استخراج كرده و در فرايندي، دانش موجود را براي ساخت هستي شناسيِ آن پردازش كند. بدين منظور ابتدا اسناد مرتبط با حوزه ي مورد نظر گردآوري شده و به روش متن كاوي، نمايه سازي خودكار گرديد. سپس در مرحله بعدي با استفاده از روش C-value مفاهيم اصلي، استخراج شده است، آنگاه با استفاده از روش خوشه بندي k- means ، اسناد مربوطه، خوشه بندي شدند و براي هر خوشه با محاسبه وزن مفاهيم، براساس روش TF-IDF، مفاهيم كليدي مناسب استخراج گرديد. در پايان با استفاده از روش تحليل هم رخدادي واژگان، سلسله مراتب مفاهيم حوزه، استخراج شده و هستي شناسي مربوطه ساخته شده است. نتايجِ به دست آمده، نشان مي دهند كه اين روش در مقايسه با روش هاي مشابه دقت بسياري در يادگيري ساخت هستي شناسي داشته است.
چكيده لاتين :
Ontologies are the means of expression of formal concepts and relations in the specific regions. It have recently tried to design the learning methods and automation process of constructing of Ontology. Whereas Ontology containing concepts and the relations، extracting of concepts، the semantic relations among concept are important.
Constructing of various Ontology for various regions and different applications are expensive and time-consuming processe. Automation of this prose is important step. The lack of knowledge such as treasures or database of knowledge domains، will make it difficult to gain knowledge of ontology in different domains.
in present study a semi-automatic method was suggested in order to gain knowledge in the Iran scinetometrics domains. this method can extract information of this domain and processing exiting knowledge for constricting Ontology in a proses.، therefore، at first، the documents of Domain were collected and then automated indexing by text mining
methods. text maing then، it was in the next step by using C-value method، main oncepts were extract.، than by using k-means clustering، relater documents were clustered، and based on TF-IDF method، main concepts were estrect for each cluster. Finally by using co-word analyses the hierarchy of concepts were extract and related ontology were construct. The results showed that this method in compare with other has had a lot accuracy in ontology building learning.
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات
عنوان نشريه :
پژوهش نامه پردازش و مديريت اطلاعات