• شماره ركورد
    1377732
  • عنوان مقاله

    نور-قطعه: يك دادگان معيار براي ارزيابي رو شهاي جداساز واژگان عربي در دامنه ي متون فقهي

  • پديد آورندگان

    الشهيب ، هدي دانشگاه علم و صنعت ايران - دانشكده مهندسي كامپيوتر , مينايي ، بهروز دانشگاه علم و صنعت ايران - گروه مهندسي كامپيوتر , شناسا ، محمد ابراهيم دانشگاه آزاد اسلامي واحد تهرا ن شمال - دانشكده مهندسي برق و كامپيوتر , حسيني ، علي پژوهشكده علوم اسلامي و انساني ديجيتال (نور) - آزمايشگاه هوش مصنوعي , ، - -

  • از صفحه
    153
  • تا صفحه
    164
  • كليدواژه
    جداسازي واژگان , زبان عربي , حاشيه‌نويسي , دادگان , برچسب‌گذاري صرفي
  • چكيده فارسي
    زبان عربي ريخت‌‌شناسي بسيار غني و پيچيده‌اي دارد كه براي تحليل زبان عربي و به ويژه در متون عربي سنتي مانند متون تاريخي و مذهبي بسيار مفيد است و در فهم معناي متون كمك مي‌كند. در مجموعه داده‌هاي ريخت‌شناسي تنوع برچسب و تعداد نمونه‌هاي دادگان به ارزيابي روش‌هاي ريخت‌شناسي كمك بيشتري مي‌كند، در اين پژوهش مجموعه داده ريخت‌شناسي كه ارائه مي‌كنيم شامل حدود ۲۲۳۶۹۰ كلمه از كتاب شرائع الاسلام در 52 باب فقهي است و توسط متخصصين برچسب‌گذاري شده است اين مجموعه دادگان با داشتن از نظر حجم و تنوع كلمات نسبت به ساير دادگان هاي موجود برتر مي باشد و تا جايي كه مي دانيم هيچ دادگاني از متون فقهي عربي در اين زمينه وجود ندارد. براي ارزيابي دادگان، سامانه فراسه را بر روي متون اعمال كرديم و كيفيت جداسازي واژه ها را از طريق چهار معيار بر روي سامانه فراسه گزارش كرديم.
  • عنوان نشريه
    فناوري اطلاعات و ارتباطات ايران
  • عنوان نشريه
    فناوري اطلاعات و ارتباطات ايران