舆情大数据研究的三个阶段

来源:人民网-舆情频道
2020-04-14 09:50 
分享
分享到
分享到微信

不久前,“人民一号”卫星在太原卫星发射中心搭载长征二号丁运载火箭成功发射,引发舆论广泛关注。“人民一号”卫星将丰富人民数据的数据来源、数据产品和数据应用,标志着人民网进军航天大数据领域。

互联网时代,一切信息皆可成为数据。当前,舆情分析进入舆情大数据阶段。很多党政部门、研究机构、媒体与商业平台积极引入舆情大数据技术进行舆情监测、分析与管理。人民网舆情数据中心从2007年7月推出国内第一份舆情分析报告《山西洪洞县黑砖窑事件舆情监测报告》,到目前运用多种技术采集、挖掘、分析数据,舆情分析正在向舆情大数据的新阶段迈进。本文尝试将舆情大数据的应用与发展划分为三个阶段,以期为相关工作的推进提供参考。

第一阶段:分析与预警

习近平总书记指出:“要运用大数据提升国家治理现代化水平。要建立健全大数据辅助科学决策和社会治理的机制,推进政府管理和社会治理模式创新,实现政府决策科学化、社会治理精准化、公共服务高效化。”这提示我们,在舆情大数据领域,掌握和运用大数据不仅可以为舆论引导与社会治理提供支撑,防范和化解各领域重大风险,而且可以提升社会服务水平与效率,促进国家治理体系和治理能力现代化。

中国互联网络信息中心(CNNIC)第44次《中国互联网络发展状况统计报告》显示,截至2019年6月,我国网民规模达8.54亿,普及率达61.2%。网络舆情成为最主要的社会舆情传播方式。因此,对于舆情数据的第一阶段而言,必须具有全面的数据收集能力、强大的分析能力以及实时的预警能力,即事件发生且在网络传播后,能全面抓取相关数据进行分析,实现风险预警,为相关部门舆论引导、舆情应对与决策提供数据支撑。

舆情大数据第一阶段主要包括以下几个功能:

一是基础呈现功能。利用舆情大数据实时了解网络舆情动向,精准把握网络舆情态势。包括一定时期内相关事件(话题)在各网络平台的媒体报道与网民讨论量、舆情传播走势与脉络、舆情传播溯源(舆情策源地)以及相关报道评论的排序(如在微博平台,以转发、评论、阅读量等数量指标对相关微博进行排序)等。

二是预警功能。若能在舆情事件潜伏期实现实时预警,并在舆情风波产生初期及时反应,无疑能以最小代价妥善处理。舆情大数据预警功能主要包括:1.数量预警。即对相关事件(话题)在各网络平台的媒体报道与网民讨论数量进行预警。如对舆情级别进行量化,分别对应相关网页新闻、微博文章、微信公众号文章、头条号文章、贴吧论坛帖文等的数量。2.重点媒体及人群预警。如舆情相关信息是否出现在主流媒体报道、新闻网站首页头条、网络活跃人士转发跟评、微信公众号“10万+”阅读量文章、不同网络平台热搜等,均可作为预警的指标。3.内容(关键词)预警。主要根据内容的敏感性对舆情进行预警。比如某食品企业将“劣质”“超标”等定为最高预警,要求公司主管予以关注。对于“服务差”“不可靠”等网络相关内容定位一般预警,要求保持关注,并留意相关动态。

三是群体画像功能。群体画像基于网民一系列历史或行为数据,有针对性地提取有效特征,总结出不同用户群体的信息面貌。在舆情大数据领域,主要包括相关发声网民群体的整体年龄、性别、教育水平等社会学画像,以及网民发声的倾向性分析,包括正面、中性、负面等。

第二阶段:预测与风险防范

如果舆情大数据第一阶段是针对已发生事情进行精准分析,那么第二阶段则是对未来事件进行研判与预测,从而防范与化解各领域重大舆情风险。

当前,舆论动向、群体行为、社会态度、公众情绪、社会认知等,都能一定程度借助互联网大数据得到准确、可视化的测量和呈现。如滴滴、美团、携程等电商平台的大数据,均可部分反映当下经济运行状况与国人活动轨迹、行为方式及消费能力等;微信、微博等网民互动、内容数据,可反映出社会对各领域、话题的价值判断与心态变化。通过这些互联网大数据的挖掘与整合,可为防范重大风险提供有力的数据支撑。

比如,人民网舆情数据中心基于网上大数据分析,为中央网信办、最高法、公安部、教育部等200余家党政机构及国企提供舆情监测预警与应急处置咨询。交通部门和各城市酝酿网约车管理规范时,邀请人民网利用移动出行平台数据,描绘专车司机、专车乘客画像,帮助准确把握网约车利益相关方的诉求,妥善决策,减少网约车改革的震荡。

当前,通过媒体、论坛、博客、微博、微信、短视频、音频等各个网络平台数据的全面抓取和挖掘,再通过语义分析、关联分析等进行预测,能够一定程度把握规律。比如,国外一些研究机构通过社交媒体数据成功预测流感暴发,以便政府部门及医疗机构能够拿出应对措施。早在2008年,Google公司开发了“谷歌流感趋势”(Google Flu Trends,GFT)软件,利用Google巨大的用户搜索数据,提前1—2周预测美国流感病例百分比的变化趋势。虽然结果存在误差遭到质疑,但开启了大数据预测的先河,为相关领域提供启示。2013年,美国一些研究员利用Twitter数据进行自动过滤,留取与流感相关的记录,再通过无监督算法结合流感的空间时间信息进行预测,发现预测结果与真实数据的相关系数达到0.97。

再如2016年美国大选期间,印度的Mog IA系统,通过搜集Facebook、Twitter、Google等互联网上千万个数据来源并进行分析,成功预测特朗普当选。而美国一些传统民调公司纷纷预测希拉里当选,这与大选最终结果大相径庭。

第三阶段:引导与干预

从舆情角度看,分析与预测最终是为了舆论引导与干预,这是舆情大数据的第三阶段。社交媒体中的大量用户数据为舆情引导提供了发展空间,可以利用社交网络用户的公开数据,分析用户的特征与偏好,进而有针对性地引导。

在2016年美国总统大选期间,就有媒体报道网络数据科学公司推出了一系列广泛的广告宣传活动,目标是基于个人心理来说服选民。这种高度精密的微目标操作通过大数据和机器学习来影响人们的情绪。根据对不同选民在不同论点上敏感性的预测,而发送不同信息。每个选民都可以收到一条定制的信息,强调某一特定论点的不同层面。

2018年3月,外媒报道Facebook公司5000万社交媒体用户信息被第三方公司“剑桥分析”用于大数据分析预测用户政治倾向,根据用户的兴趣特点、行为动态精准投放广告和资讯内容,成为间接影响总统大选的力量。更有英美媒体报道称,这家分析公司曾经受雇于推动英国“脱欧”的阵营。有评论认为,该公司的运营活动操纵选民情绪,对于政治选举的公正性造成不利影响。

西方利用大数据分析、研判影响政治活动,从一个侧面说明,借助大数据,舆情是可以评估的;有了大数据,人心是可以测量的;只要摸准情况,舆情也是可以引导与干预的,进而为主流媒体舆论引导以及政府科学决策、民主决策、精准进行社会治理提供数据支撑。

比如,主流媒体可通过媒体、论坛、博客、微博、微信、短视频、音频等各个网络平台数据的全面抓取和挖掘,再通过语义分析、关联分析等,为当前各社会阶层、群体进行大数据画像,从而精准把握他们的阅读兴趣爱好、意见诉求及心态变化等,提高新闻宣传与引导的精确度。例如,人民日报新媒体中心的“人民号”,不断优化算法推荐技术,推出用主流价值导向驾驭的“党媒算法”,打造良性传播生态。

再如,主流媒体通过与大数据深度融合,实时抓取网民在微博、微信等社交平台公开发布的信息,形成新闻素材与新闻线索,既增加新闻报道的丰富性,又把大众最感兴趣的东西报道出来,实现新闻报道有效传播。

从舆论引导角度看,舆情大数据第三个阶段主要是利用大数据,实现从“说什么”“跟谁说”到“怎么说”的跨越。“说什么”“跟谁说”均需要大数据抓取,进而分析事件(话题)基本状况、哪些网民可以引导,而“怎么说”,涉及舆论引导的“时度效”。

目前,国内舆情大数据研究多处于第一或第二阶段。但随着人工智能、云计算、大数据等互联网领域最前沿科技的进一步发展,舆情大数据研究将进一步发展,切实提高舆论引导与社会治理现代化水平。(作者:人民网舆情数据中心主任舆情分析师 廖灿亮)

【责任编辑:张瑨瑄】

为你推荐

换一批
中国日报网版权说明:凡注明来源为“中国日报网:XXX(署名)”,除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系;凡本网注明“来源:XXX(非中国日报网)”的作品,均转载自其它媒体,目的在于传播更多信息,其他媒体如需转载,请与稿件来源方联系,如产生任何问题与本网无关。
版权保护:本网登载的内容(包括文字、图片、多媒体资讯等)版权属中国日报网(中报国际文化传媒(北京)有限公司)独家所有使用。 未经中国日报网事先协议授权,禁止转载使用。给中国日报网提意见:rx@chinadaily.com.cn