شماره ركورد كنفرانس :
4319
عنوان مقاله :
كاربست الگوريتم تخصيص ديريكله پنهان با تنظيم بهينه پارامترها در استخراج كلمات خبر محور از ميكروبلاگ ها
پديدآورندگان :
بهرامي محمدرضا mrbahrami62@yahoo.com كارشناس ارشد مهندسي عمران-سازه , حاتمي شهابالدين hatami@yu.ac.ir استاديار گروه مهندسي عمران , زارع عبدالرضا zare@mail.yu.ac.ir استاديار گروه مهندسي عمران
كليدواژه :
استخراج موضوع , تخصيص ديريكله پنهان , متن¬كاوي.
عنوان كنفرانس :
دومين همايش ملي مهندسي كامپيوتر و فناوري اطلاعات دانشگاه پيام نور
چكيده فارسي :
ميكروبلاگ در مقايسه با اسناد خوش ساختار مانند صفحات وب، مقالات خبري و بلاگ¬ها يك نوع كاملا متفاوت از متن است كه كوتاه و نويزي بوده و اين خصوصيات, جمع آوري اطلاعات زمينه¬اي و آماري را براي شناسايي موضوعات مورد نظر سخت¬تر ميكند. اين پژوهش جنبههاي زير را براي شناسايي اخبار از ميكروبلاگ¬ها پوشش ميدهد: ابتدا خصوصيات متفاوت مانند محتويات، زمينه و فعاليتهاي توييتر، از ميكروبلاگ بررسي شده و سپس يك مدل تشخيص موضوع با استفاده از تكنيكهاي كاوش داده و الگوريتم تخصيص دريكله پنهان ايجاد شده است. در اين پژوهش، مدل-سازي كاوش و استخراج متن هاي كوتاه و شناسايي موضوعات خبري در ميكروبلاگ ها بررسي و نحوه كاربست الگوريتم تخصيص ديريلكه پنهان و تنظيم پارامترهاي آن با پياده سازي مدل معرفي شد و در زبان R نشان داده شده است.