عنوان مقاله :
بهبود روش درهمتنيدگي تصوير مبتني بر يادگيري با درنظر گرفتن وزنهاي مختلف براي زمينه و پيش زمينه
عنوان به زبان ديگر :
Enhancement of Learning Based Image Matting Method with Different Background/Foreground Weights
پديد آورندگان :
امين طوسي، محمود دانشگاه حكيم سبزواري، سبزوار - دانشكده رياضي و علوم كامپيوتر
كليدواژه :
قطعهبندي تصوير , درهمتنيدگي تصوير , استخراج رگ , يادگيري ماشين , استخراج متن از تصوير
چكيده فارسي :
استخراج دقيق پيش زمينه در تصوير، درهمتنيدگي تصوير ناميده ميشود. از جمله روشهاي معروف در اين حوزه روش درهمتنيدگي مبتني بر يادگيري است. در اين شيوه دادههاي آموزشيِ دو طبقه در قالب يك نقشه سهگانه كه شامل نقاط آموزشي برچسبدار (زمينه و پيشزمينه) و نقاط بدون برچسب هستند، به سامانه داده ميشوند. ميزان تعلق هر پيكسل به زمينه يا پيشزمينه بر اساس دادههاي آموزشي و كمينهسازي يك تابع هدف مشخص ميشود. در تابع هدف تمامي كارهاي منتشرشده، ميزان جريمه تخطي از مقادير درست براي دادههاي آموزشي -خواه متعلق به زمينه باشند يا پيشزمينه- يكسان در نظر گرفته شده است. در اين مقاله با درنظرگرفتن وزن متفاوت براي دادههاي آموزشي دو طبقه، اين شيوه بهبود داده شده و كارايي آن در دو كاربرد متفاوت، نشان داده شده است. كاربرد نخست، دقيقتركردن جداسازي متن از تصوير و كاربرد دوم، دقيقتركردن خروجي روشهاي استخراج رگهاي خوني شبكيه چشم در كنارههاي رگهاي شناساييشده است. در كاربرد نخست، متني فارسي كه بر روي زمينه داراي بافت ناهموار درج شده با يك روش معمول آستانهگذاري استخراج شده و سپس خروجي قطعهبنديشده با روش پيشنهادي دقيقتر شده است. در كاربرد دوم، ابتدا با يك روش موجود شناسايي رگ، قسمتهايي از تصوير كه بهاحتمال زياد متعلق به دو دسته رگ و غير رگ هستند، برچسبگذاري ميشوند. تعيين دقيقتر تعلق پيكسلهاي مرز رگهاي استخراجشده به هر يك از دو دسته رگ يا غير آن توسط روش پيشنهادي انجام ميشود. نتايج كمّي و ديداري، كارايي شيوه پيشنهادي را نشان داده است
چكيده لاتين :
The problem of accurate foreground estimation in images is called Image Matting. In image matting methods, a map is used as learning data, which is produced by those pixels that are definitely foreground, definitely background ,and unknown. This three-level pixel map is often referred to as a trimap, which is produced manually in alpha matte datasets. The true class of unknown pixels will be estimated by minimizing of an objective function. Several methods for image matting has been proposed. The learning–based method is one the pioneering works which is the basis of many other approaches in the field of image matting. In this method it is assumed that each pixel’s alpha value is a linear combination of its associated neighboring pixels. A Laplacian matrix in the objective function shows the similarity of the pixels. The coefficients of the linear combination are estimated with a local learning process by minimizing a quadratic cost function. The method of Lagrange multiplier and ridge regression technique are used for estimation of alpha values. In this objective function the violation of the predefined training pixels’ alpha values from their true values is controlled by a penalty term. Considering this coefficient as infinity, forces the matte (alpha) value to be 1 for the labeled foreground pixels and 0 for background. The weight of this penalty term still was taken equal for all training samples. In this paper the performance of the matting method is increased by considering different weights for different learning pixels. The good performance of the proposed method is demonstrated in two applications. The first application is improving the quality of a text extraction method and the second application is enhancement of an eye retinal segmentation system. In the first application, a Persian text which is fused onto a textured background is extracted by a thresholding method. After that the segmented output is enhanced by the proposed matting method. In the second application, segmentation is done with an existing vessel extraction method. The edges’ pixels of detected vessels that may be classified inaccurately are classified by the proposed image matting method. Subjective and objective comparisons show the better performance of the proposed method.
عنوان نشريه :
پردازش علائم و داده ها