شماره ركورد كنفرانس :
4726
عنوان مقاله :
بهبود الگوريتم ژنتيك با الگوريتم شبيهسازي تبريد براي انتخاب ويژگيها در تشخيص نويسنده اسناد متني
پديدآورندگان :
رسولي آذر كيوان kayvan_r4231@yahoo.com گروه مهندسي كامپيوتر، واحد اروميه، دانشگاه آزاد اسلامي ، اروميه، ايران , سليمانيان قره چپق فرهاد bonab.farhad@gmail.com گروه مهندسي كامپيوتر، واحد اروميه، دانشگاه آزاد اسلامي ، اروميه، ايران
كليدواژه :
الگوريتم شبيهسازي تبريد , الگوريتم ژنتيك , بهينهسازي , سبك نوشتاري , تشخيص نويسنده متون
عنوان كنفرانس :
چهارمين كنفرانس ملي محاسبات توزيعي و پردازش داده هاي بزرگ
چكيده فارسي :
عصر ارتباطات و گسترش استفاده از نامههاي الكترونيكي، پيامهاي فوري، اسناد، وبلاگها، مقالات خبري، صفحات خانگي، تالارهاي گفتگو و اسناد چاپي، متن را به اصليترين وسيلهي ارائه و انتقال اطلاعات تبديل كرده است. بطور كلي تشخيص نويسنده متون تلاشي براي نشان دادن خصوصيات توليدكننده يا نويسنده يك تكه از اطلاعات زباني تعريف ميشود، بهطوري كه بتوان بين متون مختلف كه نوشتهي افراد مختلفاند، تمايز قائل شويم. شناسايي نويسنده متن از روي نثر سبك و شيوه نوشتاري، يا به عبارت ديگر ويژگيهاي نهفته در متون نوشته شده توسط وي Writeprintميباشد. تركيب خصوصيات نوشتاري مانند طول كلمات، چينش پاراگرافها، پرمايگي واژگان، استفاده از كلمات تابعي و غيره writeprintرا تشكيل ميدهند. از طريق اين خصيصههاي سبك شناختي، كه معمولا در طول نوشتار يك فرد ثابت هستند شناسايي هويت نويسنده متون انجام ميگيرد.در ارائه روشهاي تشخيص نويسنده متون نكته حائز اهميت، انتخاب ويژگيهاي كليدي و حذف ويژگيهاي اضافي و غيرمرتبط در تشخيص نويسنده متون ميباشد. لذا از اينرو ما در اين مقاله روشي براساسبهبود الگوريتم ژنتيك با الگوريتم شبيهسازي تبريد براي انتخاب ويژگيها در تشخيص نويسنده اسناد متني ارائه داديم. كه در روش پيشنهادي از الگوريتم شبيهسازي تبريد براي انتخاب ويژگيهاي كليدي و از الگوريتم ژنتيك، نويسنده متون را براساس ويژگيهاي كليدي تشخيص داديم. ارزيابي نتايج حاصله بيانگر دقت بالا و نتايج بهينه روش پيشنهادي در مقايسه باروشهاي استخراج ويژگيهاي متون درتشخيص هويت نويسنده اسناد متني ميباشد.