عنوان مقاله :
روشي دومرحلهاي براي بازشناسي كلمات دستنوشته فارسي بهكمك بلوكبندي تطبيقي گراديان تصوير
عنوان فرعي :
A two-step method for offline handwritten Farsi word recognition using adaptive division of gradient image
پديد آورندگان :
بايسته تاشك، الهام نويسنده دانشگاه شاهرود، شاهرود، ايران Bayesteh Tashak, Elham , احمديفرد ، عليرضا نويسنده دانشگاه شاهرود، شاهرود، ايران Ahmadifard, Alireza , خسروي ، حسين نويسنده دانشگاه شاهرود، شاهرود، ايران Khosravi, Hossein
اطلاعات موجودي :
دوفصلنامه سال 1394 شماره 25
كليدواژه :
الگوريتم خوشهبندي ISOCLUS , بازشناسي كلمه دستنوشته , لگوريتم DTW , ويژگي نمايه , ويژگي هيستوگرام گراديان
چكيده فارسي :
در اين مقاله يك روش دومرحله اي براي بازشناسي كلمات دستنوشته فارسي ارايه شده است. در مرحله اول براي افزايش دقت و كاهش بار محاسباتي، الگوريتمي براي كاهش كلمات فرهنگ لغت قابل مقايسه با كلمه مورد آزمون ارايه شده است. براي اين منظور كلمات موجود در فرهنگ لغت توسط الگوريتم هاي خوشهبندي، دستهبندي ميشوند. خوشهبندي در اين مرحله بر اساس ويژگي هايي كه شكل كلي كلمه را توصيف مي كنند، ميباشد. در مرحله دوم يك روش جديد جهت استخراج ويژگي هيستوگرام گراديان تصوير كلمه پيشنهاد شده است كه اين روش پيشنهادي تناظر بين نمونه هاي مختلف تصاوير يك كلمه دست نوشته را بهتر نشان مي دهد. با مقايسه بردار ويژگي استخراجشده از كلمه ورودي و بردار ويژگي كلمات نامزد (بهدستآمده از مرحله اول) در يك طبقهبند K نزديك ترين همسايه بهترين نامزد براي كلمه ورودي شناسايي ميشود.
نتايج پيادهسازي روش پيشنهادي بر روي پايگاه داده "ايرانشهر" نشان ميدهد كه مرحله كاهش فرهنگ لغت و روش جديد جهت استخراج ويژگي هيستوگرام گراديان، دقت و سرعت سامانه را بهطور قابل ملاحظه اي هم از لحاظ دقت و تا حدودي از لحاظ سرعت بهبود ميبخشد.
چكيده لاتين :
This paper presented a two step method for offline handwritten Farsi word recognition. In first step, in order to improve the recognition accuracy and speed, an algorithm proposed for initial eliminating lexicon entries unlikely to match the input image. For lexicon reduction, the words of lexicon are clustered using ISOCLUS and Hierarchal clustering algorithm. Clustering is based on the features that describe the shape of word generally. In second step, a new method proposed to extract histogram of gradient image which this showed well the correspondence between different samples of handwritten word images. The gradient feature vectors of input words are compared with gradient feature vectors of candidate words using K nearest neighbor classifications.
The recognition result on handwritten words of IRANSHAR dataset showed that the lexicon reduction step and the new method of extracting gradient feature increased recognition accuracy and speed by removing classifier confusion.
عنوان نشريه :
پردازش علائم و داده ها
عنوان نشريه :
پردازش علائم و داده ها
اطلاعات موجودي :
دوفصلنامه با شماره پیاپی 25 سال 1394
كلمات كليدي :
#تست#آزمون###امتحان