一种基于语料库的网络群体事件情感倾向分析模型

来源:期刊VIP网所属分类:计算机网络发布时间:2022-01-14浏览:

  摘要:介绍了一种基于语料库的群体情感倾向度分析模型,该模型基于倾向性语料库中的极性词汇对集合中每一份素材文本进行分词,统计并计算素材文本中出現的极性词汇的强度值,得到整篇素材文本的倾向度,对集合中所有素材文本的倾向度进行统计并归一化,带入分段条件函数中进行倾向度判断,得到网络群体对该事件的情感倾向。通过对巴以冲突和中国空间站2个近期热点事件的对照测试,验证了模型的正确性。

  关键词:极性词汇;语料库;情感倾向度;向量分析

  引言

  国家管理者在决策活动中必然会涉及关乎民众利益的社会客观情况,以及民众在认知、情感和意识的基础上对社会客观事件的态度(民意)[1]。随着互联网技术的发展,民众越来越多地通过微博、论坛、微信等手段对公共事件或热点事件发表意见、观点、言论和态度,如何及时识别网民这一群体对某一事件的情感倾向,成为网络舆情管理的重要研究课题[2-3],而不同群体情感倾向的偏差研究,是解决舆情群体情感倾向差异分析的重点[4]。本文提出了一种基于语料库的网络群体对事件的情感倾向分析模型,用于分析网络上的群体对某个事件的情感倾向。该模型以网络上某事件相关的微博、帖子等文本为素材集合,基于倾向性语料库中的极性词汇对集合中每一份素材文本进行分词,统计并计算素材文本中出现的极性词汇的强度值,得到整篇素材文本的倾向度,再对集合中所有素材文本的倾向度进行统计并归一化,带入分段条件函数中进行倾向度判断,得到当前网络群体对该事件的情感倾向是正面的、中立的还是负面的,从而及时采取相应的舆情管控手段加以引导。

  1定义

  1.1群体认知

  群体是指按某种特征结合在一起的多个个体,群体与个体相对,是个体的集合。群体对事件的认知是指某个特定群体对事件的看法或态度。对一个事件的群体认知数据主要来源于个人微博、Twitter、QQ空间、朋友圈、论坛和贴吧等个人社交软件产生的信息。

  1.2情感倾向度

  群体对事件的情感倾向即广大个体对于特定事件的公众认知。事件可以来自线上传播,也可以来自媒体报道,事件传播途径多是通过互联网上的各类社交媒体软件、论坛和贴吧等。互联网是一个任何人均可以发声的大平台,信息传播是一种松散的网状结构,存在于社会各个阶层的网民是构成这个网的节点,他们掌握的或多或少的碎片化信息在节点间流动,虽然虚拟环境中仍然存在意见领袖和沉默螺旋效应,但缺少了社会群体中的监督机制和自我约束,导致群体情感倾向带有更多的情绪和不理智因素。同时,群体对事件的情感倾向也不都以文字的形式体现,很多人并不直接发声,而是对赞同的观点点赞。同时,群体在使用社交媒体软件时,经常会使用表情符号表达自己的情感,而有时表情符号会传达出比文字更强烈的倾向性。

  2模型应用

  2.1模型原理

  群体对某个事件的情感倾向性可归类为正面、中立和负面。以一定平台上的素材为基础,事先构建倾向性语料库,采集目标群体对特定事件的相关文本,利用自然语言处理技术提取文本中的词汇和表情符号,基于语料库进行分析计算得到对事件的倾向度,从而判断目标群体对该事件的倾向性。群体倾向性分析流程如图1所示。

  (1)构建倾向性语料库

  使用网络爬虫从互联网上采集近期常见的倾向性词汇和表情符号,经过人工对词汇和表情进行分类并设置权重后,再为词汇和表情建立倒排索引,形成语料库。

  (2)提取事件相关文本的倾向性属性

  收集目标群体针对某事件的相关文本素材形成原始素材集合,为每一份文本素材构建情感倾向性属性向量。

  (3)计算事件的倾向度

  对于包含倾向性属性向量的文本素材,根据其倾向性属性向量,结合语料库中词汇和表情符号的权重值计算每篇文本素材的倾向度。

  (4)分析群体对事件的倾向性

  遍历原始素材集合中的所有素材,对集合内所有素材的倾向度进行带符号累加求和后做归一化处理,求出被分析群体对该事件的倾向度。

  2.2模型设计

  2.2.1构建倾向性语料库

  倾向性词汇即包含情感倾向的词汇,可以是形容词或者副词,比如幸福、漂亮、卑鄙、愚蠢等;也可以是动词,比如支持、点赞、反对、作弊等;也可以是介词短语,比如干的漂亮、有意境等。这些具有倾向性的词汇出现在语句中,通常会表达出个体对事件的情感倾向是正面积极的,还是负面消极的。向倾向性语料库中插入词汇时,除了要包含正统词汇外,还应尽可能多地包含网络流行用语。每一个进入语料库的词汇除了要进行正面、负面分类外,还要对其情感强度进行评估,并预置一个强度值。

  在社交媒体软件中,比如新浪微博、微信、QQ等,表情符号也被用户广泛使用。用户在表达具有情感倾向的观点时,经常会在文本中附加表情符号,它近似刻画了用户的表情,能够简单、直观地展现出用户的情感倾向。根据表情符号的不同可以归类到不同的倾向中,比如:笑脸符号可以归类到正面倾向中;愤怒或哭泣的符号可以归类到负面倾向中。而不同的符号传达的情感强度也不相同,应当为其预置不同的强度值,比如:大笑符号的情感强度应当大于微笑符号。

期刊VIP网,您身边的高端学术顾问

文章名称: 一种基于语料库的网络群体事件情感倾向分析模型

文章地址: http://www.qikanvip.com/jisuanjiwangluo/61263.html