شماره ركورد
1377732
عنوان مقاله
نور-قطعه: يك دادگان معيار براي ارزيابي رو شهاي جداساز واژگان عربي در دامنه ي متون فقهي
پديد آورندگان
الشهيب ، هدي دانشگاه علم و صنعت ايران - دانشكده مهندسي كامپيوتر , مينايي ، بهروز دانشگاه علم و صنعت ايران - گروه مهندسي كامپيوتر , شناسا ، محمد ابراهيم دانشگاه آزاد اسلامي واحد تهرا ن شمال - دانشكده مهندسي برق و كامپيوتر , حسيني ، علي پژوهشكده علوم اسلامي و انساني ديجيتال (نور) - آزمايشگاه هوش مصنوعي , ، - -
از صفحه
153
تا صفحه
164
كليدواژه
جداسازي واژگان , زبان عربي , حاشيهنويسي , دادگان , برچسبگذاري صرفي
چكيده فارسي
زبان عربي ريختشناسي بسيار غني و پيچيدهاي دارد كه براي تحليل زبان عربي و به ويژه در متون عربي سنتي مانند متون تاريخي و مذهبي بسيار مفيد است و در فهم معناي متون كمك ميكند. در مجموعه دادههاي ريختشناسي تنوع برچسب و تعداد نمونههاي دادگان به ارزيابي روشهاي ريختشناسي كمك بيشتري ميكند، در اين پژوهش مجموعه داده ريختشناسي كه ارائه ميكنيم شامل حدود ۲۲۳۶۹۰ كلمه از كتاب شرائع الاسلام در 52 باب فقهي است و توسط متخصصين برچسبگذاري شده است اين مجموعه دادگان با داشتن از نظر حجم و تنوع كلمات نسبت به ساير دادگان هاي موجود برتر مي باشد و تا جايي كه مي دانيم هيچ دادگاني از متون فقهي عربي در اين زمينه وجود ندارد. براي ارزيابي دادگان، سامانه فراسه را بر روي متون اعمال كرديم و كيفيت جداسازي واژه ها را از طريق چهار معيار بر روي سامانه فراسه گزارش كرديم.
عنوان نشريه
فناوري اطلاعات و ارتباطات ايران
عنوان نشريه
فناوري اطلاعات و ارتباطات ايران
لينک به اين مدرک