• شماره ركورد
    1269301
  • عنوان مقاله

    معرفي يك پيكرة متني تخصصي: پيكرة پژوهش‌نامه

  • پديد آورندگان

    علايي ابوذر، الهام پژوهشگاه علوم و فناوري اطلاعات ايران (ايرانداك)، تهران، ايران , پاك‌نيت، نصراله پژوهشگاه علوم و فناوري اطلاعات ايران (ايرانداك)، تهران، ايران , حجت‌پناه، علي‌اصغر پژوهشگاه علوم و فناوري اطلاعات ايران (ايرانداك)، تهران، ايران , زالي، مجتبي پژوهشگاه علوم و فناوري اطلاعات ايران (ايرانداك)، تهران، ايران , آقالويي آغميوني، محمدهادي پژوهشگاه علوم و فناوري اطلاعات ايران (ايرانداك)، تهران، ايران

  • تعداد صفحه
    19
  • از صفحه
    271
  • از صفحه (ادامه)
    0
  • تا صفحه
    289
  • تا صفحه(ادامه)
    0
  • كليدواژه
    پيكره , نرمال‌سازي , برچسب‌گذاري اجزاي واژگاني كلام
  • چكيده فارسي
    بسياري از پژوهش‌هاي زبان‌شناسي و برنامه‌ريزي‌هاي زباني با استفاده از پيكره‌هاي زباني انجام مي‌شود. در اين پژوهش پيكره‌اي با استفاده از متون مقاله‌هاي پژوهش‌نامة پردازش و مديريت اطلاعات ساخته شده است. اين پيكره شامل بيش از 600 مقاله (بيش از چهار ميليون واژه) است. موضوع اين مقاله‌ها كتابداري و اطلاع‌رساني، علم اطلاعات و دانش‌شناسي، فناوري اطلاعات، زبان‌شناسي، زبان‌شناسي رايانشي، اصطلاح‌شناسي، هستان‌شناسي و ساير حوزه‌هاي پردازش اطلاعات است. متون مقاله‌ها تخصصي و ميان‌رشته‌اي است و براي پردازش‌هايي كه مستلزم بهره‌گيري از متون تخصصي است، ارزشمند است. براي ساخت پيكره پس از نمونه‌گيري و وارد كردن داده‌ها در پيكره، فرادادة مقاله‌ها وارد پيكره شد. سپس نرمال‌سازي ماشيني و به دنبال آن برچسب‌گذاري ماشيني (نوعاً برچسب‌گذاري اجزاي واژگاني كلام) انجام شد. در نهايت تعداد قابل توجهي از فايل‌هاي برچسب‌خورده در پيكره به صورت رندوم انتخاب شد و الگوهاي زباني براي اصلاح ماشيني و دستي برچسب‌ها استخراج و در پيكره به كار برده شد.
  • سال انتشار
    1400
  • عنوان نشريه
    پژوهش هاي زبان شناسي تطبيقي
  • فايل PDF
    8584530