快捷搜索:  MTU2MDk5NjQ2NQ`  as

基于大数据的产品安全相关的情感分析

大年夜数据技巧、机械进修算法等新的互联网对象的推广和利用,为我们打开了一扇懂得"民众,"对某些事物的见地、关注度等统计信息的大年夜门。

无论是一个产品、照样一个地区、照样一小我名、或者一个品牌,都可以经由过程媒体数据去抓取并阐发懂得"民众,"的反映,例如新闻网站、论坛、博客、微博、微信、贴吧、天际等。

当然也可以经由过程对京东、淘宝等电商网站上评论进行阐发和统计,从而获取某些产品、某些品牌、某些地区、某些光阴段的破费者反馈等根基数据,也可以继承经由过程数据筛选获取更细节的内容。

友情提醒:本文是本站截止今朝图片最多的一篇文章:

步骤:

本日早上7点钟,设定几组关键词,例如产品安然相关的有:空气污染、甲醛、空气净化器、产品召回等。

贸易壁垒相关的有:贸易壁垒、TBT、认证、自贸区等。

然后,不用管它,等到晚上,办事器后台已经将数据网络收拾成一系列可视化的输出。

热词云:根据关键词数量和频率的若干,改变词组字体大年夜小的散播,从而直不雅的看出哪些关键词更受"民众,"注重。例如下图中污染、空气质量等关键词的数量和频率要大年夜于食品、质量等关键词。

也可以经由过程关联词图找出相关的关键词,赞助进一步检索和阐发。

对付不合的关键词,或将一组关键词组合之后,再综同谋略,得出"民众,"对某些问题的感情反映统计数据。

感情阐发(SA)又称为倾向性阐发和意见掘客,它是对带有感情色彩的主不雅性文本进行阐发、处置惩罚、归纳和推理的历程,用户对某客体表达自身不雅点所持的立场是支持、否决、中立,即平日所指的正面感情、负面感情、中性感情。例如“讴歌”与“表扬”同为褒义词,表达正面感情,而“肮脏”与“丑陋”便是贬义词,表达负面感情。

例如对付“赝品”这个关键词,可以看出悲不雅立场48.30%,大年夜于中立立场24.03%和积极立场27.67%。还可以看出相对付昨天的变更趋势,积极、中立、悲不雅立场各自是增添照样削减。

然后,又好奇的看了下上外洋国语大年夜学的立场,可以看出积极立场73.08%,远弘远年夜于中立立场和悲不雅立场的比例。:)

再输入一位近来对照火的明星“周涛”,可以看出积极立场也是大年夜于中立和悲不雅立场,从另一个方面印证了广大年夜网夷易近对国夷易近媳妇的立场。

其次,除了立场部分,还可以从媒体滥觞,得出部分信息,例如比较家电品牌格力和海尔,我们发明本日关于格力部分,新闻报道多于微博信息。而海尔则相反, 微博信息多于新闻报道。

别的,格力和海尔的总数量上,可以看出海尔的相对格力更多一些。当然这些数据是当天的统计,假如光阴再进行延长或切割,结果会有所变更。

别的,对付一组关键词,也可以经由过程不合关键词的数量比较,发明"民众,"对哪些部分加倍关注,哪些部分相对冷门。例如对付贸易壁垒相关部分,认证和标准化远弘远年夜于贸易壁垒和TBT等术语。

而对付情况保护方面,污染关键词数量最多,达到11138个,甲醛次之,而pm2.5关键词只有87个。

更深入的,还可以经由过程舆情数量,进行排序,找到哪些事故或内容关注度最高,例如下面可以看出格力关键词部分,数量最多的是“你竟敢打我格力员工。。。”可以看出此类涉及到员工安然和庄严的光阴,更能引起网夷易近的关注。

当然,还可以从光阴这个维度进行察看,懂得到不合光阴段,"民众,"对付一个事故的感情趋势,是更悲不雅照样更积极的立场。

也可以从舆情数量上,看出网夷易近对一个事故或关键词的表达是变多照样变少。

小结:

在网址导航中汇集了部分关于人工智能的相关网站,如有兴趣可以进一步懂得。

您可能还会对下面的文章感兴趣: