شماره ركورد كنفرانس :
4859
عنوان مقاله :
روشي به منظور احساس كاوي بر روي توئيتر در مقياس كلان داده
عنوان به زبان ديگر :
A Method for Sentiment Analysis on Twitter in Big Data Scale
پديدآورندگان :
شايگان فرد محمدجواد shayegan@usc.ac.ir دانشگاه علم و فرهنگ , ملانوروزي مهرداد m.molanorouzi@usc.ac.ir دانشگاه علم و فرهنگ
كليدواژه :
احساسكاوي , كلانداده , توئيتر , وبكاوي
عنوان كنفرانس :
پنجمين كنفرانس بين المللي وب پژوهي
چكيده فارسي :
توئيتر يكي از محبوبترين شبكههاي اجتماعي حال حاضر ميباشد. افراد نظرات و احساسات خود را دربارهي موضوعات مختلف كه در زندگي روزمره خود با آنها درگير هستند، در توئيتر بيان ميكنند. حجم انبوه نظرات در توئيتر اين شبكه اجتماعي را به عنوان يكي از پايگاههاي كلان داده تبديل كردهاست و پژوهشهاي زيادي بر روي توئيتر در مقياس كلان داده صورت گرفتهاست. از طرف ديگر موضوع احساسكاوي به خصوص در شبكههاي اجتماعي در چند سال اخير مورد توجه قرار گرفته و نتايج آن در بسياري از زمينههاي اقتصادي، اجتماعي و سياسي ديده شده است. در اين پژوهش روشي ارائه ميشود كه ابتدا دادهها از توئيتر جمعآوري شده و سپس با استفاده از چارچوب هدوپ و يك روش سعي و خطا و با استفاده از مدل تركيبي استفاده از تئوري بيز و ديكشنري لغات تحليل احساسات صورت مي گيرد. نتايج حاصل از آزمايش دقت روش پيشنهادي را در حدود 70% نشان ميدهد.
چكيده لاتين :
Twitter is one of the most popular social networks nowadays. People share their ideas, comments and feelings about different subjects of their daily life in twitter. Because of huge amount of tweet, twitter is a suitable database for big data and there are many research on it. On the other hand sentiment analysis in social media is very popular among researchers recently. Moreover it’s results use in economical, social and political subjects. In this research, we are going to represent an approach to collect data from twitter first, then store and analyze data using Hadoop framework and a hybrid model that use Bayes theorem and dictionary of words for sentiment analysis. According to the results of experiment on data, the accuracy of the proposed approach has reached to 70 percent.