NRC词语情绪词典和词语彩词典
Python&Stata数据采集与数据分析实证前沿寒假工作坊  现在开始招生了,有兴趣的同学和老师可以戳进来了解
情绪和情感词典 是由加拿大国家研究委员会(简称NRC)的专家创建。该词典·具有广泛的应用程序开发,可以在多种环境中使用,例如情绪分析,产品营销,消费者行为,甚至是政治活动分析。
该技术使用一系列单词来帮助识别情绪,情感,并分析标签,表情符号和单词颜的关联。这些词典包含英文单词的条目,可用于分析英文文本。
资源文件夹目录(文章末尾有完整的资源可供下载)
AutomaticallyGeneratedLexicons
NRC-Affect-Intensity-Lexicon
NRC-Colour-Lexicon-v0.92
NRC-Emotion-Lexicon-v0.92
NRC-VAD-Lexicon
但是我觉得目前对咱们经管专业最有用可能是
NRC-Colour-Lexicon-v0.92
NRC-Emotion-Lexicon-v0.92
我们可以使用上面两个词典度量文本的情绪信息,也可以分析文本的彩信息。
词语的彩
彩是成功传递信息的重要组成部分,无论是在销售商业产品(Sable和Akcay,2010),设计网页(Meier,1988;Pribadi等,1990)还是可视化信息(Christ,1975)中 ;Card等,1999)。由于实际概念与某些颜类别(例如,红危险和粉红柔和度)相关联,因此使用适当的颜来补充语言和非语言信息会带来很多好处,包括:
加强讯息(改善语义连贯性)
减轻接收者的认知负担
快速传达信息
唤起所需的情绪反应
例如考虑在停车标志中使用,驾驶员能够更快地识别该标志,并且会引起与危险有关的潜意识情绪,同样,使用红标注高犯罪率的区域是很好地使用颜的例子。另一方面,不恰当的使用颜可能更有害于理解(Marcus,1982;Meier,1988)。
大多数语言中许多表达情感的词语都有涉及彩的表达, 在英语中的例子包括:
嫉妒的绿
贵族的蓝血统
牧场的绿(更好的大道)
黄腹(怯co的)
红地毯(特殊处理)
透过玫瑰眼镜看(乐观)。
此外,不断出现新的表达方式,例如灰和比安卡·马斯登(Bianca Marsden)的诗《混乱》中的不确定性。因此,概念-颜关联的知识 对于自动自然语言系统(例如,文本含义,释义,机器翻译和情感分析)也可能有用。
当颜是单词所指概念的显着特征时,或者因为该单词与此类概念相关,则单词与颜具有很强的关联性。许多概念-颜关联,例如天鹅与白和蔬菜与绿,都涉及物理实体。但是,即使是抽象的概念和情感也可能具有与社会相关的彩(诚实–白,危险–红,喜悦–黄,愤怒–红)。此外,许多协会是特定于文化的(Gage,1969;Chen,2005)。例如,在亚洲大部分地区,繁荣与红有关。
不幸的是,没有一个词库能够捕获概念-颜的关联,并且仍然存在许多问题,例如人类对这些关联的共识程度以及物理概念是否更可能具有颜关联比抽象的我们期望单词-颜关联在文本和语音中表现为共现,但是还没有研究表明单词在多大程度上与关联的颜共存,而不是与其他颜共存。
研究发现:
超过30%的术语具有强烈的颜关联(第4节)
约33%的词库类别具有很强的颜关联(第5节)。
抽象术语几乎与物理实体一样具有颜关联(第6节)。
情绪和极性与颜有很强的联系(第7节)。
词关联在WordNet中表现为紧密(程度较小),在文本中表现为较高的同时出现率(程度较大)(第8节)。
彩词典截图
词语颜词典目前只有英文版,截图如下
情绪词典
情绪通常通过不同的面部表情来表达(亚里士多德,1913;拉塞尔,1994)。不同的情感也通过不同的语言表达。例如
愉悦和好吃表明喜悦的情绪
忧郁和哭泣表明悲伤
呼喊和沸腾表明愤怒
等等
本情绪词典支持包括英语、法语、阿拉伯语、中文和西班牙语等在内的105种语言。
情绪词典截图
情绪词典是基于英文数据,但扩展为105种语言。如下图,excel有105列+9列,其中前105列是同一个意思在105种语言但不同表达。
后9列是积极、消极及7种情绪(喜怒哀乐愁怨恨)
/lexicons-for-research/ [1]Saif, Mohammad. "Colourful Language: Measuring Word-Colour Associations, 2011a." In Proceedings of the ACL 2011 Workshop on Cognitive Modeling and Computational Linguistics (CMCL). 2011. [2]Mohammad, Saif M., and Peter D. Turney. "Crowdsourcing a word–emotion association lexicon." Computational Intelligence 29, no. 3 (2013): 436-465.
近期文章
精选课程 | Python文本数据分析实战(学术)
Python爬虫与Stata应用能力提升与实证前沿  寒假工作坊
使用Python读取图片中的文本数据
generatedLoughran&McDonald金融文本情感分析库
股评师分析报告文本情感分析预测股价
如何使用seaborn绘制组合图
代码不到40行的超燃动态排序图
使用Python自动生成事件分析图谱
使用分析师报告中含有的情感信息预测上市公司股价变动
日期数据操作第1期 datetime库
日期数据操作第2期 pandas库
史上最大规模1.4亿中文知识图谱开源下载
【公开视频课】Python语法快速入门
【公开视频课】Python爬虫快速入门
文本数据分析文章汇总(2016-至今)
当文本分析遇到乱码(ง'⌣')ง怎么办?
当pandas遇上数据类型问题

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。