عنوان مقاله :
تشخيص هوشمند و خودكار غلط هاي تايپي در پايگاه دادههاي بزرگ بدون استفاده از لغتنامه
عنوان به زبان ديگر :
The Intelligent and Automatic Detection of Type Errors in Large Databases without using Dictionary
پديد آورندگان :
زعفراني معطر، الناز دانشگاه آزاد اسلامي واحد تبريز - گروه مهندسي كامپيوتر , فيضي درخشي، محمدرضا دانشگاه تبريز - دانشكده مهندسي برق و كامپيوتر - گروه مهندسي كامپيوتر , روحاني، آزاده دانشگاه آزاد اسلامي واحد خسروشاه - گروه مهندسي كامپيوتر
كليدواژه :
تشخيص غلط هاي تايپي , غلط هاي املايي , فازي
چكيده فارسي :
غلط هاي تايپي يكي از مشكلات مهم در سيستمهاي كامپيوتري و سيستمهاي پايگاهدادهاي است. وجود غلط هاي تايپي در پايگاهدادهها نه تنها از نظر صحت پايگاهداده مشكلساز هستند، بلكه باعث ميشوند به هنگام ضرورت نتوان ركورد وارد شده را بازيابي كرد. همين امر گاه باعث ميشود كه كاربر مجدداً همان ركورد را وارد پايگاهداده نمايد كه منجر به وجود آمدن افزونگي ميگردد. روشهاي موجود تشخيص غلط ها، مبتني بر لغتنامه هستند. بدين معني كه از يك لغتنامه بزرگ كه همه لغات آن صحيح فرض ميشوند استفاده ميكنند و اگر كلمهاي در لغتنامه نباشد بهعنوان غلط تايپي شناخته ميشود. تهيه لغتنامهاي بزرگ و با دقت بالا بسيار پرهزينه و زمانبر است. بهعلاوه چنين لغتنامهاي مختص يك زمينه خاص (مثلاً محيط پزشكي) است و قابلاستفاده و در زمينههاي ديگر (مثلاً جامعهشناسي) نيست. در اين مقاله روشي ارائه ميشود كه بدون نياز به لغتنامه ميتواند غلط هاي تايپي را تشخيص دهد. روش پيشنهادي با چند معيار مرسوم ارزيابي شده است. نتايج آزمايشها نشاندهنده دقت 93.5 درصدي براي اين روش است. علاوهبر دقت بالاي روش پيشنهادي، عدمنياز به لغتنامه يك ويژگي منحصر به فرد براي آن بهشمار ميرود.
چكيده لاتين :
Type errors are one of the main problems in computer systems and database systems. Existence of type errors within databases, not only causes accuracy problem for database, but also leads user to re-enter the record into database because the entered record could not be found. It results in redundancy. The existing error detection methods are based on dictionary. It means that they use a large dictionary whose all words are assumed true and if a word is not in the dictionary, it is detected as a type error. Providing a large dictionary with high precision is expensive and time consuming. In addition, such a dictionary belongs to a special field (for example, medical environment) and is not applicable in other fields (such as sociology). In this paper, a method is presented that could detect type errors without requiring a dictionary. The proposed method has been evaluated with some common criteria. The experimental results show 93.5 percent precision for this method. In addition to the high precision of the proposed method, not requiring a dictionary is considered as its unique feature.
عنوان نشريه :
مهندسي برق دانشگاه تبريز
عنوان نشريه :
مهندسي برق دانشگاه تبريز