شماره ركورد كنفرانس :
2491
عنوان مقاله :
مدل سازي عدم قطعيت در سنجش شباهت لغوي محتواي منابع وب فارسي
پديدآورندگان :
آهنگربهان حميد نويسنده , منتظر غلام علي نويسنده دانشكده فني و مهندسي-دانشگاه تربيت مدرس تهران
كليدواژه :
شباهت سنجي لغوي , نظريه مجموعه فازي , متن فارسي , دستبرد ادبي
عنوان كنفرانس :
مجموعه مقالات بين المللي وب پژوهي
چكيده فارسي :
در دنیاي كنونی، كاربران به راحتی م یتوانند با رونوشت برداري از منابع وبی، سند و نوشته اي بدون ارجاع به مرجع اصلی به نام خود
ارائه دهند كه این عمل مصداقی از دستبرد ادبی است. تاكنون روش ها و سنجه هاي مختلفی در سامانه هاي دستبرد ادبی براي ارزیابی
مشابهت دو سند و تشخیص دستبرد ادبی ارائه شده كه تنها به صورت قطعی میزان شباهت بین دو متن را سنجیده و به نوع محتواي
متون چندان توجهی نمی كردند. در این مقاله با توجه به كیفی بودن عوامل اثرگذار بر سنجش شباهت بین دو متن، روش جدیدي با
استفاده از نظریۀ مجموعه فازي ارائه شده است. در این روش ابتدا، واژه هاي هر متن به دو دسته عمومی و حوزه محور(تخصصی)
بخش بندي شده و سپس براي هر دسته سنجه ها و ویژگ یها متناسب آن مستخر جشده و در نهایت با استفاده از سیستم استنتاج
فازي، میزان شباهت لغوي بین دو محتواي صفحه وب ارزیابی می شود. روش مذكور بر روي مقاله هاي یادگیري الكترونیكی مورد
ارزیابی قرار گرفته كه با دقت بیش از 75 % امكان شناسایی محتواي اسناد مشابه را داراست و به همین دلیل توانمندي لازم براي
استفاده در حوزه شناسایی محتواي منابع وبی مشابه و همین طور تشخیص دستبرد محتوایی را داراست.
شماره مدرك كنفرانس :
3817008