شماره ركورد كنفرانس :
4029
عنوان مقاله :
بهبود برچسب زني متون فارسي با استفاده از روش هاي تركيبي نحوي و معنايي
پديدآورندگان :
رشادي فريناز دانشجوي كارشناسي ارشد ، گروه كامپيوتر ، واحد ميبد ، دانشگاه آزاد اسلامي ، ميبد ، ايران , كارگر محمد جواد عضو هيئت علمي گروه كامپيوتر ، واحد ميبد ، دانشگاه آزاد اسلامي ، ميبد ، ايران
كليدواژه :
برچسبگذاري اجزاي كلام , پيكره زبان فارسي , تجزيه¬ي وابستگي , برچسب گذاري نحوي
عنوان كنفرانس :
دومين همايش ملي چشم انداز تكنولوژي كامپيوتر و شبكه در 2030
چكيده فارسي :
يكي از ملزومات استفاده از روشهاي آماري در پردازش زبان طبيعي، دسترسي به دادههاي زباني شامل پيكرههاي متني، پيكرههاي درختي، واژگانها، بانكهاي صوتي و غيره ميباشد. از سوي ديگر، بسياري از زبانشناسان در پژوهشهاي خود از پيكرههاي زباني بهره ميگيرند و به بررسي ويژگيها و كشف قواعد زبان از طريق اطلاعات موجود در دادههاي زباني ميپردازند. هدف از اين پژوهش، بررسي چالشها و مشكلات برچسبگذاري خودكار اجزاي واژگاني كلام در زبان فارسي و استفاده از پيكره متني زبان فارسي (پيكره وابستگي نحوي زبان فارسي)در طراحي يك سيستم، برچسبگذاري ميباشد. در اين تحقيق، مدلهاي تركيبي معرفي خواهند شد كه بتوانند دو مسئله ي برچسب زني اجزاي سخن و تجزيه ي وابستگي را به صورت همزمان انجام دهند و در بهبود دقت برچسب زني، تأثير مثبتي داشته باشند. در روش پيشنهادي تلاش بر اين است كه با استفاده از برچسبزن نحوي ومعنايي اجزاي كلام، بعد از تعيين نقش كلمات، در مدل يادگيري، براي عملكرد بهتر از چند الگوريتم يادگيري با بهترين دقت استفاده شود. الگوريتم-هايي بكار رفته شامل الگوريتم هايj48 ,oneR ,bysenet, navebyse مي باشند.