شماره ركورد كنفرانس :
4163
عنوان مقاله :
معرفي سامانة استانداردساز و خطاياب متون علمي پژوهشگاه علوم و فناوري اطلاعات ايران
عنوان به زبان ديگر :
An Introduction to the Standardization and Spell Checking of Scientific Texts of the Institute of Information Science and Technology of Iran
پديدآورندگان :
حسيني بهشتي ملوكالسادات beheshti@irandoc.ac.ir پژوهشگاه علوم و فتاوري اطلاعات ايران , هاشمي افتخارسادات دانشگاه تربيت مدرس
كليدواژه :
استانداردسازي , خطايابي , پردازش ماشيني متن , گنج ايرانداك.
عنوان كنفرانس :
چهارمين همايش ملي زبان شناسي رايانشي
چكيده فارسي :
اصلاح خط فارسي، دغدغهاي است كه از شصت سال پيش تاكنون ذهن صاحبنظران عرصة زبان و زبانشناسي را به خود معطوف كردهاست. انواع سبكهاي نگارشي كه حاصل تنوع سليقة نويسندگان است كار پردازش ماشيني زبان و ترجمة ماشيني را با چالش و دشواري مواجه كردهاست. حالآنكه اين تنوع در متون علمي گاه سبب از دست رفتن معنا و يا فحواي كلام ميشود. استانداردسازي متون علمي امري است كه امروزه مورد استقبال بسيار قرار گرفتهاست. پژوهش حاضر با بررسي شيوههاي نگارش به زبان فارسي اعم از نشانهگذاريها و قواعد نگارشي واژه، سامانهِ استانداردساز و خطاياب متون علمي فارسي پژوهشگاه علوم و فناوري اطلاعات ايران را نيز معرفي ميكند و چگونگي كار با آن را توضيح ميدهد. اين سامانه متون نوشتاري علمي و تخصصي فارسي بهويژه چكيدههاي گنج ايرانداك را بهلحاظ صحت نگارشي و املايي بررسي ميكند و بهصورت يكدست و استاندارد درميآورد.
چكيده لاتين :
The reform of the Persian alphabet and writing is a concern that has attracted the minds of linguists during the past sixty years. The variety of writing styles that results from the diversity of writers tastes has challenged the processing of machine language and machine translation. However, this variation in scientific texts sometimes leads to the loss of the meaning. The standardization of scientific texts is an issue that has been widely welcomed today. The present paper introduces a system standardizing and spells checking the Persian scientific texts, especially the Ganj Database of Irandoc. The system is installed and run on a computer as a Win Form Application. The present article is the result of a research project.