شماره ركورد :
2078
عنوان :
طراحي يك الگوريتم همانندجو براي تشخيص متون بازنويسي شده در زبان فارسي
شرح پديد آور/مجري (مجريان) طرح :
نصر‌اله پاك‌نيت
سال نشر :
1396
چكيده فارسي :
پيشرفت تكنولوژي موجب آسان شدن انتشار و دسترسي به مدارك علمي و در نتيجه سهولت انجام سرقت علمي شده است. با توجه به اين موضوع، مراكز علمي متمايل به آگاهي از ميزان همانندي مدارك علمي جديد اعضا خود به مدارك علمي موجود مي‌باشند. همانندي مي‌تواند به شكل‌هاي همانندي آشكار (به صورت رونوشت تحت‌اللفظي از يك منبع بدون تغيير) و همانندي مستتر (به شكل‌هاي بازنويسي متن موجود در يك منبع، ترجمه متن موجود در يك منبع از يك زبان ديگر و سرقت ايده از منبعي ديگر) باشد. روش‌ها و نرم‌افزارهاي زيادي براي همانندجويي ارائه شده اما از يك طرف، با توجه به قواعد و ويژگي‌هاي خاص هر زبان، استفاده از روش‌ها و نرم‌افزارهاي همانندجوي موجود براي ساير زبان‌ها به منظور همانندجويي در زبان فارسي ناممكن بوده و يا منجر به ارائه نتايجي نادقيق خواهد شد. از طرف ديگر، تحقيقات قابل دسترس انجام شده در زمينه همانندجويي در متون فارسي، تنها همانندي آشكار را در نظر گرفته‌اند. با توجه به اهميت موضوع، در اين طرح پژوهشي، به بررسي متداول‌ترين همانندي مستتر يعني بازنويسي متن موجود در يك منبع ديگر در متون فارسي پرداخته خواهد شد. در اين راستا، در ابتدا روش‌هاي همانندجوي موجود براي ساير زبان‌ها و ابزارهاي موجود براي پردازش زبان فارسي مورد بررسي واقع مي‌شوند. در ادامه، با توجه به ابزارهاي موجود، دو الگوريتم‌ براي همانندجويي در متون فارسي بازنويسي شده طراحي خواهد شد. الگوريتم اول طراحي شده در دسته روش‌هاي همانندجويي معنايي و الگوريتم دوم در دسته روش‌هاي همانندجويي فازي قرار مي‌گيرند. در الگوريتم همانندجوي معنايي پيشنهادي براي بررسي همانندي دو واژه از لغت‌نامه و در الگوريتم فازي پيشنهادي از ماتريس هم‌رخدادي لغات استفاده شده است. در خاتمه، روش‌هاي پيشنهادي پياده‌سازي گشته و با انجام آزمايشاتي كيفيت الگوريتم‌هاي ارائه شده بررسي شده است.
كليدواژه :
همانندجو , سرقت علمي , تطبيق متن , همانندجويي , متون بازنويسي شده
سرشناسه :
پاك‌نيت، نصر‌اله
اطلاعات نشر :
تهران پژوهشگاه علوم و فناوري اطلاعات ايران(ايرانداك)
مشخصات ظاهري :
112ص.،‌جدول، نمودار.
كليدواژه - جزئيات :
لينک به اين مدرک :
بازگشت