شماره ركورد كنفرانس :
4848
عنوان مقاله :
استخراج متن از تصاوير طبيعي
عنوان به زبان ديگر :
Text extraction from natural images
پديدآورندگان :
عصاري محمد امين arshad.arak@gmail.com دانشگاه پيام نور; , رمضان پور محمدرضا ramezanpour@mau.ac.ir دانشگاه آزاد اسلامي واحد مباركه; , جاسبي سميه sjassbi@gmail.com دانشگاه آزاد اسلامي واحد علوم و تحقيقات;
كليدواژه :
تشخيص لبه , مكان يابي متن , تشخيص متن.
عنوان كنفرانس :
چهارمين كنفرانس ملي فناوري در مهندسي برق، كامپيوتر
چكيده فارسي :
پيشرفت هاي اخير در زمينه فناوري ديجيتال منجر به افزايش توليد پايگاه داده هايي حاوي اطلاعات چندرسانه اي شامل تصاوير و ويدئوها، علاوه بر اطلاعات متني گشته است. اسناد چندرسانه اي با داده هاي متني تعبيه شده در آن ها، موجب ايجاد مسائل چالش برانگيز زيادي در تشخيص و تجزيه و تحليل اسناد شده است. جملات متن در يك تصوير مي توانند از نظر فونت، اندازه، جهت و رنگ متفاوت باشند. همچنين در پس زمينه متن مي تواند اشياء مختلف با رنگ هاي متفاوت وجود داشته باشد كه باعث پيچيدگي پس زمينه گردند. اين امر منجر به توسعه روش هاي جديدي براي مقابله با اين چالش ها گشته است. يكي از پارامترهايي كه اطلاعات خوبي از تصوير را نگه مي دارد، لبه ها هستند كه با انجام عمليات لبه گيري، مي توان بيشتر مشخصه هاي متني در تصوير را كشف و با درصد اطمينان بالايي مكان متن را تشخيص داد. در اين مقاله، در ابتدا به مفاهيم پايه اي استخراج متن در تصوير پرداخته شده ، سپس الگوريتم هاي موجود بررسي شده است. در بخش بعدي تكنيك هاي مختلف استخراج متن از تصوير مبتني بر ويژگي هاي مكاني و فركانسي مورد بررسي قرار گرفته است. در پايان نيز مقايسه اي بين تكنيك هاي موجود و بيان مزايا و معايب آن ها صورت گرفته است.
چكيده لاتين :
Recent advances in the field of digital technology have led to an increase in the production of databases containing multimedia information, including images and videos, in addition to textual information. Multimedia documents with their embedded text data have created many challenging issues in document recognition and analysis. Text sentences in a single image can be different in terms of font, size, direction and color. Also, in the background of the text there can be objects of different colors that make the background complex. This has led to the development of new ways to cope with these challenges. One of the parameters that holds good information on the image is the edges that, by performing the editing operations, can detect most of the text attributes in the image and identify with high confidence in the location of the text. In this paper, we first discuss the basic concepts of text extraction in an image, then the existing algorithms are examined. In the next section, different techniques of extracting text from an image based on spatial and frequency characteristics are investigated. Finally, there is a comparison between existing techniques and the expression of their advantages and disadvantages.