عنوان :
طراحي يك الگوريتم همانندجو براي تشخيص متون بازنويسي شده در زبان فارسي
شرح پديد آور/مجري (مجريان) طرح :
نصراله پاكنيت
چكيده فارسي :
پيشرفت تكنولوژي موجب آسان شدن انتشار و دسترسي به مدارك علمي و در نتيجه سهولت انجام سرقت علمي شده است. با توجه به اين موضوع، مراكز علمي متمايل به آگاهي از ميزان همانندي مدارك علمي جديد اعضا خود به مدارك علمي موجود ميباشند. همانندي ميتواند به شكلهاي همانندي آشكار (به صورت رونوشت تحتاللفظي از يك منبع بدون تغيير) و همانندي مستتر (به شكلهاي بازنويسي متن موجود در يك منبع، ترجمه متن موجود در يك منبع از يك زبان ديگر و سرقت ايده از منبعي ديگر) باشد. روشها و نرمافزارهاي زيادي براي همانندجويي ارائه شده اما از يك طرف، با توجه به قواعد و ويژگيهاي خاص هر زبان، استفاده از روشها و نرمافزارهاي همانندجوي موجود براي ساير زبانها به منظور همانندجويي در زبان فارسي ناممكن بوده و يا منجر به ارائه نتايجي نادقيق خواهد شد. از طرف ديگر، تحقيقات قابل دسترس انجام شده در زمينه همانندجويي در متون فارسي، تنها همانندي آشكار را در نظر گرفتهاند. با توجه به اهميت موضوع، در اين طرح پژوهشي، به بررسي متداولترين همانندي مستتر يعني بازنويسي متن موجود در يك منبع ديگر در متون فارسي پرداخته خواهد شد. در اين راستا، در ابتدا روشهاي همانندجوي موجود براي ساير زبانها و ابزارهاي موجود براي پردازش زبان فارسي مورد بررسي واقع ميشوند. در ادامه، با توجه به ابزارهاي موجود، دو الگوريتم براي همانندجويي در متون فارسي بازنويسي شده طراحي خواهد شد. الگوريتم اول طراحي شده در دسته روشهاي همانندجويي معنايي و الگوريتم دوم در دسته روشهاي همانندجويي فازي قرار ميگيرند. در الگوريتم همانندجوي معنايي پيشنهادي براي بررسي همانندي دو واژه از لغتنامه و در الگوريتم فازي پيشنهادي از ماتريس همرخدادي لغات استفاده شده است. در خاتمه، روشهاي پيشنهادي پيادهسازي گشته و با انجام آزمايشاتي كيفيت الگوريتمهاي ارائه شده بررسي شده است.
كليدواژه :
همانندجو , سرقت علمي , تطبيق متن , همانندجويي , متون بازنويسي شده
سرشناسه :
پاكنيت، نصراله
اطلاعات نشر :
تهران پژوهشگاه علوم و فناوري اطلاعات ايران(ايرانداك)
مشخصات ظاهري :
112ص.،جدول، نمودار.