شماره ركورد كنفرانس :
4870
عنوان مقاله :
طراحي و تحليل طبقهبند موضوعي خودكار براي محتواي شبكههاي اجتماعي با تمركز بر سيل ۹۸
پديدآورندگان :
رهبري محمد دانشگاه علامه طباطبايي -تهران , رضوي زهرا دانشگاه راچستر-آمريكا
كليدواژه :
دادهكاوي , تحليل دادههاي شبكههاي اجتماعي , طبقهبندي موضوعي متن , سيل ايران , تحليل تلگرام , تحليل توئيتر
عنوان كنفرانس :
اولين همايش ملي هوش مصنوعي و محاسبات نرم در علوم انساني
چكيده فارسي :
با گسترش اينترنت و پيامرسانهاي موبايلي در كشور، بسياري از مردم روزانه از اين پيامرسانها به منظور برقراري ارتباط با ديگران استفاده ميكنند. از اين طريق، روزانه حجم زيادي از دادههاي ارتباطي مختلف در اين شبكهها رد و بدل ميشود كه تحليل آنها ميتواند ابزاري براي نظركاوي عمومي شده و جايگزين نظرسنجيهاي سنتي گردد. در اين مقاله دادههاي شبكههاي اجتماعي تلگرام و توئيتر در بازهي بحران سيل ۹۸ مورد مطالعه قرار گرفته است. اين دادهها براساس محتوا برچسب زده شده و براي آموزش طبقهبند خودكار با استفاده از روشهاي روزآمد در يادگيري ماشين مورد استفاده قرار ميگيرد. همچنين نشان داده ميشود كه ابزار طبقهبندي متن fasttext در عين سادگي استفاده و عدم نياز به دانش پيشزمينه طبقهبندي موضوعي را با سرعت و دقت قابل مقايسه با بهترين نتايج روشهاي معرفي شده انجام ميدهد و علاوه بر آن موجب باياس معنيدار روي برچسبهاي پيشبيني شده نميگردد، لذا ميتواند توسط پژوهشگران علوم انساني مورد استفاده قرار گيرد. همچنين نتايج بدست آمده از دقت بالاتر طبقهبندي مطالب تلگرامي در مقايسه با توئيتر حكايت دارد. اين نتايج از دو منظر طول دادههاي اين دو شبكه هاي اجتماعي و نيز الگوهاي زباني مورد استفاده در هركدام مورد تحليل قرار گرفته است.