شماره ركورد
1269301
عنوان مقاله
معرفي يك پيكرة متني تخصصي: پيكرة پژوهشنامه
پديد آورندگان
علايي ابوذر، الهام پژوهشگاه علوم و فناوري اطلاعات ايران (ايرانداك)، تهران، ايران , پاكنيت، نصراله پژوهشگاه علوم و فناوري اطلاعات ايران (ايرانداك)، تهران، ايران , حجتپناه، علياصغر پژوهشگاه علوم و فناوري اطلاعات ايران (ايرانداك)، تهران، ايران , زالي، مجتبي پژوهشگاه علوم و فناوري اطلاعات ايران (ايرانداك)، تهران، ايران , آقالويي آغميوني، محمدهادي پژوهشگاه علوم و فناوري اطلاعات ايران (ايرانداك)، تهران، ايران
تعداد صفحه
19
از صفحه
271
از صفحه (ادامه)
0
تا صفحه
289
تا صفحه(ادامه)
0
كليدواژه
پيكره , نرمالسازي , برچسبگذاري اجزاي واژگاني كلام
چكيده فارسي
بسياري از پژوهشهاي زبانشناسي و برنامهريزيهاي زباني با استفاده از پيكرههاي زباني انجام ميشود. در اين پژوهش پيكرهاي با استفاده از متون مقالههاي پژوهشنامة پردازش و مديريت اطلاعات ساخته شده است. اين پيكره شامل بيش از 600 مقاله (بيش از چهار ميليون واژه) است. موضوع اين مقالهها كتابداري و اطلاعرساني، علم اطلاعات و دانششناسي، فناوري اطلاعات، زبانشناسي، زبانشناسي رايانشي، اصطلاحشناسي، هستانشناسي و ساير حوزههاي پردازش اطلاعات است. متون مقالهها تخصصي و ميانرشتهاي است و براي پردازشهايي كه مستلزم بهرهگيري از متون تخصصي است، ارزشمند است. براي ساخت پيكره پس از نمونهگيري و وارد كردن دادهها در پيكره، فرادادة مقالهها وارد پيكره شد. سپس نرمالسازي ماشيني و به دنبال آن برچسبگذاري ماشيني (نوعاً برچسبگذاري اجزاي واژگاني كلام) انجام شد. در نهايت تعداد قابل توجهي از فايلهاي برچسبخورده در پيكره به صورت رندوم انتخاب شد و الگوهاي زباني براي اصلاح ماشيني و دستي برچسبها استخراج و در پيكره به كار برده شد.
سال انتشار
1400
عنوان نشريه
پژوهش هاي زبان شناسي تطبيقي
فايل PDF
8584530
لينک به اين مدرک