عنوان :
طراحي يك روش هوشمند تجزيه رشتههاي مرجع در زبان فارسي
شرح پديد آور/مجري (مجريان) طرح :
نصراله پاكنيت
شناسه هاي افزوده :
جلاليمنش،عمار همكار طرح
چكيده فارسي :
يك رشته مرجع را ميتوان به عنوان مجموعهاي از مولفهها مانند نام نويسندگان، عنوان، محل نشر، سال نشر، شماره صفحات و ... در نظر گرفت. در حاليكه تجزيه رشتههاي مرجع موجود در انتهاي يك مدرك علمي توسط كاربر انساني به راحتي انجامپذير است، تنوع موجود در فرمتهاي نگارش رشتههاي مرجع در كنار اشتباهات رخ داده توسط نويسندگان در نگارش اين رشتهها، خودكارسازي انجام اين عمليات را سخت كرده است. روشهاي زيادي براي خودكارسازي تجزيه رشتههاي مرجع ارائه شده است اما اين روشها وابسته به زبان بوده و امكان استفاده از يك روش ارائه شده براي يك زبان در زباني ديگر منجر به نتايجي اشتباه ميشود. تحقيقات صورت گرفته بيانگر اين است كه تاكنون هيچ روشي براي خودكارسازي تجزيه رشتههاي مرجع در زبان فارسي ارائه نشده است. با توجه به اين مهم و نقش گسترده اين مساله در ساخت خودكار شبكههاي استنادي مدارك علمي و فرايندهاي بازيابي اطلاعات، در اين طرح پژوهشي به اين مساله پرداخته شده است. در اين راستا، پس از بررسي پيشينه مسئله، از روش يادگيري ماشين بردار پشتيبان به عنوان يك دستهبند چند دستهاي استفاده شده و يك روش هوشمند براي مساله تجزيه رشتههاي مرجع در زبان فارسي ارائه شده است. با توجه به اهميت انتخاب ويژگيهاي مناسب براي استفاده در دستهبند ماشين بردار پشتيبان، در اين پژوهش اين مهم با توجه به ويژگيهاي استفاده شده در زبان انگليسي و ويژگيهاي زبان فارسي و ارجاعدهي در اين زبان انجام شده است. روش ارائه شده پيادهسازي شده و با استفاده از مجموعه دادهاي شامل 922 رشته مرجع فارسي ايجاد شده در اين پژوهش آموزش داده شده و مورد آزمايش قرار گرفته است. نتايج به دست آمده نشانگر مقدار 92% براي پارامترهاي دقت، فراخواني و معيار اف ميباشد.
كليدواژه :
تجزيه رشتههاي مرجع , هوشمندسازي , يادگيري ماشين , دستهبندي چند كلاسه , ماشين بردار پشتيبان , ساخت خودكار شبكههاي اجتماعي
سرشناسه :
پاكنيت، نصراله
اطلاعات نشر :
تهران پژوهشگاه علوم و فناوري اطلاعات ايران(ايرانداك)
مشخصات ظاهري :
111ص.، جدول، نمودار.
همكار (همكاران) طرح :
نصيري، جلالالدين