شماره ركورد :
1122914
عنوان مقاله :
بهبود روش درهم‌تنيدگي تصوير‌ مبتني بر يادگيري با درنظر‌ گرفتن وزن‌هاي مختلف براي زمينه و پيش ‌زمينه
عنوان به زبان ديگر :
Enhancement of Learning Based Image Matting Method with Different Background/Foreground Weights
پديد آورندگان :
امين طوسي، محمود دانشگاه حكيم سبزواري، سبزوار - دانشكده رياضي و علوم كامپيوتر
تعداد صفحه :
16
از صفحه :
75
تا صفحه :
90
كليدواژه :
قطعه‌بندي تصوير , درهم‌تنيدگي تصوير , استخراج رگ , يادگيري ماشين , استخراج متن از تصوير
چكيده فارسي :
استخراج دقيق پيش زمينه در تصوير، درهم‌تنيدگي تصوير ناميده مي‌شود. از جمله روش‌هاي معروف در اين حوزه روش درهم‌تنيدگي مبتني بر يادگيري است. در اين شيوه داده‌هاي آموزشيِ دو طبقه در قالب يك نقشه سه‌گانه كه شامل نقاط آموزشي برچسب‌دار (زمينه و پيش‌زمينه) و نقاط بدون برچسب هستند، به سامانه داده مي‌شوند. ميزان تعلق هر پيكسل به زمينه يا پيش‌زمينه بر اساس داده‌هاي آموزشي و كمينه‌سازي يك تابع هدف مشخص مي‌شود. در تابع هدف تمامي كارهاي منتشر‌شده، ميزان جريمه تخطي از مقادير درست براي داده‌هاي آموزشي -خواه متعلق به زمينه باشند يا پيش‌زمينه- يكسان در نظر گرفته شده است. در اين مقاله با درنظر‌گرفتن وزن متفاوت براي داده‌هاي آموزشي دو طبقه، اين شيوه بهبود داده شده و كارايي آن در دو كاربرد متفاوت، نشان داده شده است. كاربرد نخست، دقيق‌تر‌كردن جداسازي متن از تصوير و كاربرد دوم، دقيق‌تر‌كردن خروجي روش‌هاي استخراج رگ‌هاي خوني شبكيه چشم در كناره‌هاي رگ‌هاي شناسايي‌شده است. در كاربرد نخست، متني فارسي كه بر روي زمينه داراي بافت ناهموار درج شده با يك روش معمول آستانه‌گذاري استخراج شده و سپس خروجي قطعه‌بندي‌شده با روش پيشنهادي دقيق‌تر شده است. در كاربرد دوم، ابتدا با يك روش موجود شناسايي رگ، قسمت‌هايي از تصوير كه به‌احتمال زياد متعلق به دو دسته رگ و غير رگ هستند، برچسب‌گذاري مي‌شوند. تعيين دقيق‌تر تعلق پيكسل‌هاي مرز رگ‌هاي استخراج‌شده به هر يك از دو دسته رگ يا غير آن توسط روش‌ پيشنهادي انجام مي‌شود. نتايج كمّي و ديداري، كارايي شيوه پيشنهادي را نشان داده است
چكيده لاتين :
The problem of accurate foreground estimation in images is called Image Matting. In image matting methods, a map is used as learning data, which is produced by those pixels that are definitely foreground, definitely background ,and unknown. This three-level pixel map is often referred to as a trimap, which is produced manually in alpha matte datasets. The true class of unknown pixels will be estimated by minimizing of an objective function. Several methods for image matting has been proposed. The learning–based method is one the pioneering works which is the basis of many other approaches in the field of image matting. In this method it is assumed that each pixel’s alpha value is a linear combination of its associated neighboring pixels. A Laplacian matrix in the objective function shows the similarity of the pixels. The coefficients of the linear combination are estimated with a local learning process by minimizing a quadratic cost function. The method of Lagrange multiplier and ridge regression technique are used for estimation of alpha values. In this objective function the violation of the predefined training pixels’ alpha values from their true values is controlled by a penalty term. Considering this coefficient as infinity, forces the matte (alpha) value to be 1 for the labeled foreground pixels and 0 for background. The weight of this penalty term still was taken equal for all training samples. In this paper the performance of the matting method is increased by considering different weights for different learning pixels. The good performance of the proposed method is demonstrated in two applications. The first application is improving the quality of a text extraction method and the second application is enhancement of an eye retinal segmentation system. In the first application, a Persian text which is fused onto a textured background is extracted by a thresholding method. After that the segmented output is enhanced by the proposed matting method. In the second application, segmentation is done with an existing vessel extraction method. The edges’ pixels of detected vessels that may be classified inaccurately are classified by the proposed image matting method. Subjective and objective comparisons show the better performance of the proposed method.
سال انتشار :
1398
عنوان نشريه :
پردازش علائم و داده ها
فايل PDF :
7755306
لينک به اين مدرک :
بازگشت