شماره ركورد كنفرانس :
3704
عنوان مقاله :
روش جديد براي شناسايي خودكار زبان درمتون دو زبانه فارسي و انگليسي با قلمهاي متفاوت تا سطح كلمه
عنوان به زبان ديگر :
aa New Method for language identification ib bilingual document persian and english withe differnt fonts to word level
پديدآورندگان :
حاتمي عين اله einolah.hatami@gmail.com دانشگاه آزاد تهران شمال; , صادق زاده مهدي m.sadeghzadeh@mhriau.ac.ir دانشگاه آزاد ماهشهر;
كليدواژه :
شناسايي زبان نوشتار , متون چند زبانه چابي , شناسايي نوري حروف , شناسايي زبان فارسي و انگليسي
عنوان كنفرانس :
پنجمين كنفرانس بين المللي در مهندسي برق و كامپيوتر با تاكيد بر دانش بومي
چكيده فارسي :
در متون چابي كه شامل چندين زبان نوشتاري ميباشد.شناسايي زبان نوشتاري اولين گام در سيستم شناسايي نوري حروف ميباشد. در اين مقاله يك روش جديد و موثر براي شناسايي زبان نوشتاري خطوط و كلمات در متون چابي دو زبانه فارسي و انگليسي روبش شده ارائه شده است.ابتدا خطوط متني و كلمات از تصوير جداسازي ميشوند و سپس براي جداسازي اين دو زبان و استخراج ويژگيها از دو روش مبتني بر طرح پروفايل افقي استفاده شده است. در روش اول نسبت ميانگين به واريانس تعداد نقاط روشن از هر كلمه نسبت به محيط محاط شده را محاسبه ميكنيم و در تكنيك دوم هر خط به سه ناحيه بالايي،مياني و پاييني تقسيم مي شود كه آنگاه نقطه ماكسيمم مطلق و بزرگترين نقطه ماكسيمم نسبي بعدي ناحيه مياني را بر اساس پروفايل افقي بدست ميآوريم. خطوط نوشتاري و كلمات با قلم ها و اندازه هاي متفاوت براي تست سيستم پيشنهادي استفاده شدهاند. اين الگوريتم بر روي 75 صفحه روبششده متفاوت كه شامل 1250 خط متني و 20400 كلمه از دو زبان نوشتاري ميباشد بادقت99.85تست شده است.
چكيده لاتين :
شناسايي زبان نوشتار ،متون چند زبانه چابي ،شناسايي نوري حروف،شناسايي زبان فارسي و انگليسي