شماره ركورد كنفرانس :
4004
عنوان مقاله :
يك روش مبتني بر رشته جهت تشخيص استفاده مجدد از كدهاي برنامه نويسي
پديدآورندگان :
ستوده خير آبادي زهرا zahra.setoodeh@shirazu.ac.ir دانشجوي كارشناسي ارشد، بخش مهندسي و علوم كامپيوتر دانشكده مهندسي، دانشگاه شيراز، شيراز , فخراحمد سيد مصطفي fakhrahmad@shirazu.ac.ir استاديار بخش مهندسي و علوم كامپيوتر دانشكده مهندسي دانشگاه شيراز شيراز , موسوي سيد محمدرضا smmosavi@shirazu.ac.ir استاديار بخش مهندسي و علوم كامپيوتر دانشكده مهندسي دانشگاه شيراز شيراز
كليدواژه :
تشخيص كپي , تطابق رشته , كدهاي برنامه نويسي , استفاده مجدد كد , برنامه نويسي بزرگ
عنوان كنفرانس :
دومين همايش ملي محاسبات تكاملي و هوش جمعي
چكيده فارسي :
كپي كردن كدهاي برنامه نويسي به عنوان ساده ترين روش استفاده مجدد از كد، در بيشتر پروژه هاي بزرگ اتفاق مي افتد. به صورت معمول كد كپي شده از
ساير قسمت هاي نرم افزار و يا كتابخانه هاي متن باز بعد از انتقال، تا حدود زيادي تغيير داده مي شود. مطالعات اخير نشان داده است كه اين روش استفاده مجدد
منجر به افزايش قابل توجه احتمال بروز خطا مي شود و بنابراين كشف قسمتهايي از كد كه كپي شده اند، اهميت فراواني دارد.
از طرف ديگر تشخيص كپي كردن كد به عنوان يك تقلب شايع در دانشگاه ها اهميت روز افزوني يافته است. اگر مجموعهاي شامل تعداد زيادي برنامه باشد،
تشخيص كدهاي مورد استفاده مجدد قرار گرفته به صورت دستي و توسط انسان غيرعملي است، بدين ترتيب نياز به ابزاري خودكار و دقيق براي تشخيص
احساس ميشود.
در اين مقاله، يك رويكرد مبتني بر رشته براي تشخيص اين مساله در كدهاي برنامهنويسي ارائه شده است. مدل پيشنهادي شامل سه فاز اصلي است؛ ابتدا
تمام كدها با پيشپردازش خاصي به الگويي مشابه تبديل ميشوند. سپس جداسازي كلمات انجام شده و درنهايت با مقايسهاي كه بين توكنها انجام ميگيرد،
نتيجه اعلام ميگردد. جهت ارزيابي مدل ارائهشده از مجموعه داده مسابقات جهاني Soco2014استفادهشده است. مقايسه نتايج بدست آمده با نتايج گروههاي
شركتكننده در مسابقه نويدبخش بوده و حاكي از عملكرد مناسب و قابلقبول سيستم پيشنهادي ميباشد