شماره ركورد :
1205286
عنوان مقاله :
ارائه فرايندي جهت يكپارچه‌سازي و تشخيص تكرار براي بهبود كيفيت داده‌ها
پديد آورندگان :
ملامحمد ، نيلوفر دانشگاه آزاد اسلامي واحد قزوين - دانشكده مهندسي برق و فناوري اطلاعات , دانشپور ، نگين دانشگاه تربيت دبير شهيد رجايي - دانشكده مهندسي كامپيوتر
از صفحه :
109
تا صفحه :
120
كليدواژه :
كيفيت داده‌ , عوامل كيفيت داده‌ها , پاك‌سازي داده‌ها
چكيده فارسي :
اطلاعات در محيط‌ هاي كاري امروزي و تصميم گيري‌ ها نقشي اساسي دارند. با توجه به اهميت تصميم گيري، اطمينان از كيفيت داده‌ هاي موجود ضروري است. با استفاده از روش‌ هاي پاك‌سازي داده مي‌توان كيفيت داده‌ ها را بهبود بخشيد. در اين مقاله فرايندي در جهت كشف انواع ركورد هاي تكراري و متناقض، يكپارچه‌سازي و تشخيص تكرار براي بهبود كيفيت داده‌ها ارائه مي‌شود. فرايند پيشنهادي شامل بخش‌هايي ازجمله كد كردن داده‌ها و خوشه‌بندي با استفاده از الگوريتم اميد رياضي بيشينه‌سازي، ساخت نشانه براي ركوردها، ادغام روش‌هاي كدكردن داده‌ها و ساخت نشانه و ايجاد قوانين انجمني با استفاده از الگوريتم Fpgrowth است. نتايج آزمايش‌ها نشان مي دهد در فرايند پيشنهادي به‌طور متوسط معيار فراخواني 96%، صحت 99%، دقت 95% و امتياز اف 95% شده است. روش پيشنهادي با يك روش شناسايي تكرار و خطا، مقايسه شده است كه نتايج حاصل نشان‌دهنده‌ي افزايش 13% فراخواني، 1% صحت و 6% امتياز اف است.
عنوان نشريه :
رايانش نرم و فناوري اطلاعات
عنوان نشريه :
رايانش نرم و فناوري اطلاعات
لينک به اين مدرک :
بازگشت