شماره ركورد كنفرانس :
3712
عنوان مقاله :
كاربرد زنجيره ماركوف در ارزيابي و شناسايي شباهت دو فايل متني
پديدآورندگان :
سرلك ولي الله دانشگاه بين الم , گودرزي ميترا دانشگاه پيام نور , مدني مير مرسل دانشگاه آزاد اسلامي , سلطاني فهرج سپيده دانشگاه بين الم
كليدواژه :
ادغام فايل , زنجيره ماركوف , مقايسه فايل هاي متني , بردار شاخص , ماتريس گذار , Bigram N-gram كاراكتر
عنوان كنفرانس :
اولين همايش ملي كاربرد سيستم هاي هوشمند (محاسبات نرم) در علوم و صنايع
چكيده فارسي :
در ايم مقاله پژوهشي هدف مقايسه و ارزيابي و محاسبه درصد شباهت دو فايل از نوع متني با استفاده از زنجيره هاي ماركوف بررسي مي شود كه روش بكار گرفته شده تازه و ايده اي است. متد و راه حل كلي شباهت و ارزيابي دو فايل متني بدين صورت است كه از هر فايل يك بردار شاخص استخراج مي گردد، سپس با ادغام دو برداري شاخص، بردار شاخص مرجع يا اصلي ايجاد گردد. با استفاده از بردار شاخص مرجع براي هر فايل يك ماتريس گذار ايجاد مي شود. نهايتا با مقايسه و بررسي دو ماتريس گذار تفاوت هر دو فايل تعيين شده و درصد شباهت آنها محاسبه مي گردد. دقت و صحت و درصد شباهت اين روش و متد بسيار بالا مي باشد و تمام كاراكترهاي مورد استفاده در هر فايل ( از جمله Space و Enter و Tab ....) در مقايسه در نظر گرفته مي شوند.