ساخت مجموعه داده تصاوير متن منظره فارسي، مناسب براي تشخيص و بازشناسي متن در تصاوير

پديد آورندگان

علي مرادي ، فاطمه پژوهشگاه ارتباطات و فناوري اطلاعات , رحماني ، فرزانه پژوهشگاه ارتباطات و فناوري اطلاعات , ربيعي ، ليلا پژوهشگاه ارتباطات و فناوري اطلاعات , خوانساري ، محمد دانشگاه تهران - دانشكده علوم و فنون نوين , مازوچي ، مجتبي پژوهشگاه ارتباطات و فناوري اطلاعات

از صفحه

تا صفحه

كليدواژه

تشخيص متن , بازشناسي متن , تصاوير متن منظره , مجموعه داده متن منظره فارسي , يادگيري عميق

چكيده فارسي

تشخيص متن در تصاوير از مهم ترين منابع تحليل محتواي تصاوير است. گرچه در زبان هايي همچون انگليسي و چيني تحقيقاتي در زمينه تشخيص و بازشناسي متن مبتني بر يادگيري عميق انجام شده است اما براي زبان فارسي مانعي جدي براي توسعه چنين مدل هايي وجود دارد. اين مانع، نبود مجموعه داده آموزشي با تعداد بالا است تامين داده با تصاوير واقعي مانند تصاوير تابلوهاي هدايت مسير و تابلوهاي فروشگاهي به دليل عدم تنوع متون و زمان بر بودن حاشيه نويسي دستي كه تعداد داده ها را با محدوديت مواجه مي كند مناسب و كافي نيست در اين مقاله ما ابزارهاي لازم براي ساخت مجموعه داده تصاوير ساختگي متن منظره فارسي با پارامترهايي همچون رنگ ،اندازه، فونت و چرخش متن طراحي و ايجاد مي كنيم همچنين با اين ابزارها يك مجموعه داده بزرگ و متنوع شامل ۶۱۰۰ تصوير متن منظره و ۴۰۲۲۰ تصوير كلمات بريده شده ساخته شده است. مزيت روش ما نسبت به تصاوير واقعي ساخت خودكار تصاوير به تعداد دلخواه و بدون نياز به حاشيه نويسي دستي مي باشد يك مدل انتها به انتهاي تشخيص و بازشناسي با مجموعه داده ايجاد شده آموزش داده شد و مورد ارزيابي قرار گرفت صحت و بازيابي اين مدل به ترتيب برابر 51,17% و 55,79% حاصل شد. طبق بررسي ما اين اولين مجموعه داده تصاوير متن منظره فارسي به صورت آزاد و با تعداد بالا است.

عنوان نشريه

فناوري اطلاعات و ارتباطات ايران

عنوان نشريه

فناوري اطلاعات و ارتباطات ايران

لينک به اين مدرک

https://search.isc.ac/dl/search/defaultta.aspx?DTC=8&DC=1330228