跳转到主要内容

原始研究的文章

前面。Commun。,16December 2022
秒。广告和营销沟通
卷7 - 2022 | https://doi.org/10.3389/fcomm.2022.970749

在微博预测基金配套文本情感的趋势:一个时间序列的研究

沙罗 *
  • 师范学院,哥伦比亚大学,纽约,纽约,美国

作品简介:本文报道一种时间序列分析的日常情绪文本相关基金投资微博(新浪公司,北京)。

方法:本研究采用网络爬虫和文本挖掘技术通过Python获得数据从1月1日,2021年到2021年12月31日。

结果:使用集成的自回归移动平均模型和向量自回归模型,结果表明,基金表现的一个重要预测恐惧,愤怒,在微博和惊喜的表情。情绪之间的关系在某种单一基金不存在,但文本的情感可以通过ARIMA模型预测在情感。

讨论:媒体情感分析的发现提供了洞察力结合语言和时间维度的沟通和心理学学科。

1。介绍

看股指将绿色或红色可以伴随着重要的股东之间的心理变化。当卖空,买在底部,或为股东利用决策至关重要,必须明智地。在财政纪律行为,研究人员观察情绪及其生理表征以及财务决策。在先前的研究中,年交易经验之间的关系,心率变异,和交易性能报告(Kandasamy et al ., 2016)。在其他的研究也发现类似的结果投行业务和金融决策过程(石英,2009;2011年马丁和德尔珈朵;Fenton-O 'Creevy et al ., 2012)。此外,在社会心理学中,大量研究调查情感变化的过程与金融和媒体的互动活动。一些研究发现情绪是高度相关的投资和使用数字媒体(布拉德利et al ., 1996;Shiv et al ., 2005)。

社交网站(社交网络)平台公众可能使用交流情感的文本。语言特征对SNS发现相关模式随着时间的推移,在以前的媒体和语言研究,和时间方面可能是一个关键维度量化modelin (Koplenig 2017;泰2022)。扩展研究不同,本研究认为消息涉及的各项情感表达在微博(新浪公司,北京),这是一种最常用的中国SNS平台用户,调查情感预测模型。统计模型被用来研究语言特征对时态模式对SNS社交媒体平台(泰2018,2021年)。因为并不是许多研究都集中在社会媒体情感通过量化语言方法的统计计算,目前的研究建立了一个三步收集实时刮SNS数据过滤模型。情感信息被分为6种类型,包括恐惧、厌恶、惊讶、愤怒、快乐和悲伤,根据基本情感理论(埃克曼,1992)。然后我们用时间序列分析了解情感和基金业绩在过去可以用来预测未来基金配套情感表达在微博上。

1.1。情感作为一种社会文化实践的结果

最近实验室实验,情感被认为是一个被动的反应后的感知刺激(加里多和舒伯特,2011年;克雷默et al ., 2014;罗,2022)。本研究建构主义心理学的方法,考虑情感感觉情感经历,从事基金配套活动后发生。心理建构主义者相信,通过相关的操纵,appraisal-emotion协会可以通过统计归责(评估Zammuner 1998;柯克兰坎宁安,2012)。此外,不同家庭的情感研究的情感定义为自然类和共享通用属性(罗斯,2006;伊泽德,2007)。例如,著名的基本情绪理论提出了六种基本情绪,包括快乐、悲伤、愤怒、恐惧、厌恶、和意外(埃克曼,1992)。之后,学者们重新六个典型的情绪分成八类,添加信任和期待与积极的和消极的基地(Plutchik 1980),甚至跨文化层次结构(剃须刀et al ., 1992,2001年)。其他学者构建了自己的模型和22个不同的情感原型(丁香和Ortony, 2013)。情绪在本研究分为6种类型根据基本情绪理论。

自然类之间的历史争论和心理建构主义家庭一直以来研究人员第一次鸽子情感的研究从不同的学科。最近的一些理论研究认为,这两个家庭的情感可以共存(Panksepp 2007)。在本文中,情感是指社会文化实践的结果(耆那教的,1994;Boiger Mesquita, 2012;艾哈迈德,2013)。

1.2。情感词在中国的背景下

尽管不同家庭的情感研究互换领导这项研究的趋势,在人类中情绪是普遍的语言。普通话是官方语言上使用微博。因为情感表达在微博上被定义为一个社会文化经验,社会文化差异中国和西方文化中必不可少的地址在这个调查。早期的文学倾向于认为,情绪是普遍的表达(鲍彻,卡尔森,1980;Ekman和特纳,1997年),而最近的研究发现,他们之间的不同文化,特别是东部和西部之间的(杰克et al ., 2012)。大多数文献普遍认为基本情绪类别是普遍,但公共话语是中国政府主导的环境中。反动观点对政府当局不允许在任何平台,包括微博。此外,据报道,中国文化不同于西方的个人主义和集体主义等维度和男性与女性(霍夫斯泰德,2001,2003年)。高度相关的文化价值观、情感强度较低的文本消息在中国接受了更多的西方文化(林,2016),跨语言和情感表达模式也不同(Ng et al ., 2019)。因此,出现有问题需要解决在文本情感分析研究通过跨文化透镜由于缺乏情感词典建立在语言系统的一致性。到目前为止,研究人员已经开发出关于气味和食品的文化特性的情感词汇在语言,如法语,英语,中文,和葡萄牙(Chrea et al ., 2009;国王和Meiselman, 2010年;Ferdenzi et al ., 2013)。

本研究结合了两个在英语和普通话情感词典发达之后,情感分类成6种类型(恐惧、厌恶、惊奇、愤怒、快乐、和悲伤)根据基本情绪理论。首先,最新的通用量表(Ferdenzi et al ., 2013),有英文和中文版本,包含跨多个地理区域最常见的情感方面。第二,用普通话情感词汇本体已经在一段时间内最全面的词汇(徐et al ., 2008)。然而,情感词典出版大约十年前,在社交媒体平台在2021年成为一样广泛使用。全面的数据收集,另外网上情感表达词汇是包含在文本挖掘(TM),这是在这项研究中使用的数据收集方法。

1.3。时间序列分析和TM情感词

时间序列分析的情感表达在微博上不存在,虽然这个平台已经广泛应用于用户情感的文本和收集基金配套信息(陈et al ., 2012)。现有的时间序列分析的情感包括母亲的负面情绪(Lorber和史密斯Slep, 2005年),韩国游泳选手的推文(博伦et al ., 2011)、数字化旋律(沃恩,1990)和youtube频道语言特征(泰2021)。时间序列模型被广泛用于分析和预测在每日各国股市等金融相关领域(辛格和博拉,2014年;辛格2021年)。然而,我们没有找到一个时间序列的研究情感词相关的金融服务产品也在微博的背景下的文学。

传统上,社会心理研究的媒体沟通采用的研究方法,如调查、实验和观测(莳萝、2013)。随着社交网络的崛起,SNS平台立即成为病毒传播的方法取代传统的形式。网络环境被认为是新鲜的和必要的字段socio-emotional和developmental-emotional分析(斯坦et al ., 2008)。到2018年5月,微博报道超过4亿活跃用户每月(山et al ., 2021)。微博是一个主要的金融服务消费者SNS平台来表达情绪,除了GuBa (Eastmoney,深圳,中国,股票论坛类似于Reddit),和微信(深圳腾讯,中国),它正在等待调查。

社交网站二十年前发生的翻天覆地的变化吸引了研究人员为数字数据收集(开发新技术Sundar Limperos, 2013)。新的计算方法,如TM,引起了公众的关注和验证研究人员自信息数字化已成为新趋势唐郭,2015)。在TM的总称,有各种方法,包括自然语言处理、信息检索和词汇统计(查特和贝2011)。大量的语言情感的研究采用了TM方法调查顾客评论(李et al ., 2020),用户行为(滑铁卢et al ., 2018和流行后的心态Dubey 2020在社交网络)。

收集数据与fund-relevant情感词在微博上,本研究嵌入式semi-supervised和监督学习方法在Python编写程序来刮微博帖子。这两种方法都是有效的数据分类和回归(朱和戈德堡,2009年;Koshorek et al ., 2018)。

2。材料和方法

2021年,公共股票基金在中国的数量已达到9000,超过25万亿元的规模第四大国家基金市场。14125微博观察收集从1月1日,2021年,2021年12月31日在四个季度。样本容量确定的细节,所有数据除外,所有操作,所有措施的研究报告在以下部分文本。后的数据集可以联系作者。

2.1。样本

只基金推出之前,2018年10月被认为是在这项研究中,避免情感偏见由于试生产营销,促销,整个基金市场的惨淡表现在第一季度。降低行业和主题的偏见,本研究寻找资金和各种组合。三个基金与医学、蓝筹和消费(酒)主题,分别选择,Lombarda中国医疗混合基金,易方达蓝筹股选择混合基金,招商白酒指数基金。

2.2。数据收集

本研究采用半监督网络爬虫技术来获取数据,然后使用一个完全监督TM法提取数据好帮手。LocoySpider版本10.2 (Lewei,合肥,中国)与下面的步骤来获得数据,见图1:

1。网络搜索域。我们使用https://weibo.com/的种子集的url。

2。模拟账户登录。我们使用新创建的微博账户,输入其用户名和密码。

3所示。过滤逻辑。第一个过滤器是一个关键词列表,包括公司的组合,主题,在选择基金和基金类型。每个组合需要语义上有意义的短语;例如,关键词的招商白酒指数基金包括中国商人(招商)、酒(白酒),指数基金(指数基金),和基金(基金)。因为微博数量限制在每个数据挖掘工作由外部源LocoySpider一样,该项目被设置为每小时重复运行。

4所示。复制和上传数据。LocoySpider复制数据会议和上传数据过滤逻辑,内容,和url的数据集。

图1
www.雷竞技rebatfrontiersin.org

图1。这项研究的框架。

收集到的文章只是对数据分析的研究和在公共领域所有微博用户可用。个人身份信息都从数据集以及结果报告。研究人员没有任何与微博用户互动和联系,也没有披露个人信息用户之间。因此,没有伦理批准并不是必需的。

2.3。数据清理

接下来,应用TM法进行数据清洗。每小时新收集的数据在数据集被分配给一个过滤逻辑开发的Python程序反复因为同一篇文章可以发表在微博上由多个来源。删除冗余数据的目的,我们比较了新每小时的文本内容重复率数据在数据集和每个URL a经过2个月的测试后,过滤重复率确定为92%。这意味着,如果多个url≥92%的文本内容相同,只有最早的帖子会保持,后来帖子会过滤掉。新任命被排除在冗余观测,行动放大与原文相同的情感易et al ., 2022)。过滤后的数据然后进入清洗数据集本研究可视化的框架图1。Python脚本后可联系作者。

网络爬虫和TM方法测试从10月1日,2020年,2020年12月1日。明显,英语和汉语有不同的语法系统中否定单词单独或不是从情感词。例如,“许许多多”用英语将作为两个独立的词在中国(“不高兴”)。为了避免否定词语的歧义,研究助理经历链接包含在数据集的数据集b .后端接口提出了分配的每个链接标识号和出版日期和时间、链接和标题。研究助理可以执行一个错误的删除,暂时删除数据,包括附近的否定句情感词和改变了句子的语义。然后,研究者可能再次回顾的文章。2个月的培训后,两分的达到80%,可靠性和研究助理能够解释的内容通过研究者的镜头。

2.4。测量

我们使用两种类型的测量fund-relevant微博情感和基金业绩如下所示。

2.4.1。日常情感词频率

测试后,最常用的34个字中列出的微博情感词矩阵。因为情感词汇在汉语本体(徐et al ., 2008)没有更新14年出版以来,我们决定添加两个趋势情感词使用的大量的股东在微博上。36的话分为六种基本情绪(恐惧、惊讶、厌恶、愤怒、悲伤和快乐),每个基本情绪与六个字。清理数据在数据集B访问MySequel编程语言。我们注意到一些单词在关键字列表没有全年使用。因此,我们决定排除最常用的两个词的每一个数据分析的基本情感,留下四个字,每天为每个频率计数。例如,恐惧以下单词“怕(恐惧),”“吓人(可怕的)”和“恐(害怕),“那些在意外“讶(惊喜),”“惊(震惊)”和“奇(奇怪的)。“频率测量在情感和基金是独立的,也就是说一篇文章包含两个情绪或基金将被计算两次。

2.4.2。基金资产净值

每日单位净值等于基金的净负总责任,市场价值除以总数量的股票。每日累计净值是指每日单位净值加上一个累计奖金用于股东。两人都来自EastMoney.com,这是一个包含基金信息的网站中国证券监督管理委员会核准。因为股票市场只在工作日,单位累计净值数据没有在周末或法定节假日。确保完全随机缺失的数据模式,周末和法定假日的观察(n= 122)数据帧中遗漏了之前进一步分析。

2.5。数据分析

本文的分析重点关注微博的情感。我们检查了清洗数据从三个视角:inter-emotion inner-emotion,净worth-emotion关系。两种方法被采用,包括图形比较和统计模型计算。特别是inter-emotion分析旨在发现恐惧之间的潜在关系,惊讶、厌恶、愤怒、悲伤和快乐在微博上在一个基金,尽管inner-emotion分析看着每个基金内部和之间的情感在一个相同的时间框架。最后,净worth-emotion分析调查了基金业绩与基金微博情感。本文的假设如下:

- - - - - - H1:所有六个情感词频率是可预测本身在一个基金。

- - - - - - H2:所有六个情绪词频由彼此在一个可预测的基金。

- - - - - - H3:所有六个情感词频率是影响基金业绩在基金净值。

从一个图形比较,观察变量的趋势作了初步的分析在同一时间窗口。三个时间序列数据Lombarda中国医疗混合基金、易方达蓝筹股选择混合基金和中国商人白酒指数基金,分别绘制了视觉对比。然后,一个自回归综合移动平均(ARIMA)模型用于时间序列模型分析内在情感模式。满足假设ARIMA建模,我们测试了时间序列数据的平稳性和增强应用差分的方法来消除非平稳数据的季节性。与此同时,差分参数(的程度d)计算。接下来,自相关函数(ACF)和偏自相关函数(PACF)检查确定一个范围滞后订单(p)和移动平均线的顺序()参数ARIMA (p d q)模型。ACF的时间序列呈现逐渐减少或几何图案,与PACF呈现显著峰值后突然中断,测试可能自回归(p、d,0)模型。相反,时间序列的特征进行检测可能的移动平均线(0,d,问)模型,而在ACF和PACF呈现几何或逐渐减少模式进行测试的自回归移动平均(ARMA)模型。模型结果表解释如下:

ŷ t = μ + ϕ 1 y t - - - - - - 1 + + ϕ p y t - - - - - - p - - - - - - θ 1 e t - - - - - - 1 - - - - - - - - - - - - θ e t - - - - - -

在哪里 y ^ t 被解释变量在时间吗t,每个参数的系数φp,θ是每个参数的系数。因为本文集中在一个时间序列的趋势,而不是常数,μ为拦截并不是在结果部分。Akaike信息标准是用于检查模型最适合时间序列,和Ljung-Box测试报告统计检验残差自相关。统计学意义是一个级别的0.05作为纪律共同实践。ARIMA模型的阴谋也被叠加在原始时间序列图来说明预测精度通过比较预测和观察到的值。之后,六个情感变量的向量自回归(VAR)模型在每个基金在R编程计算软件(R统计计算的基础,维也纳,奥地利)。VAR模型也有助于结构分析中倍系列变量。检验残差的自相关,混合测试用于检查所有VAR模型。同样的步骤是重复的单一基金业绩变量VAR模型。

3所示。结果

3.1。每个情感关系之间的时间间隔

所有测量经历实现平稳性增强Dickey-Fuller测试中看到表1。虽然情感变量都是静止的,单位和累计净值non-stationarity,p> 0.05;因此,平稳性的假设的显著性水平是可以接受的。

表1
www.雷竞技rebatfrontiersin.org

表1。增强Dickey-Fuller测试的结果。

所有单元和累积净值时间序列的一阶差分和报道p< 0.01为静止的(d= 1)。没有进一步的差分计算,以避免不必要的由于over-differencing序列相关性和复杂性。的最大pARIMA模型决定的数量(0≤2p0≤≤2d0≤≤1≤2)由于峰值模式的三个基金在18套ACF和PACF图。的结合可能的ARIMA (p d q)模型基于行为和PACF图形测试所有情绪。三只基金的恐惧是检测ARIMA(0, 1, 2)和ARIMA(1 1 0),和惊喜与三个基金相关检测ARIMA(1,0,0)和ARIMA (2, 1, 0)。厌恶,愤怒,悲伤和幸福与三个基金相关检测ARIMA(1,0,0)和ARIMA(1 1 0),报道表2- - - - - -4。优先诊断的模型的残差拟合ARIMA模型没有自相关。模型残差自相关被认为缺乏总体随机性在一群落后。因此,ARIMA(1 1 0)被证明是最好的预测模型恐惧、厌恶、愤怒、悲伤和快乐的三个基金,而ARIMA(2 1 0)是最好的模型,令人惊讶的是,支持H1统计学意义。这些模型的预测值与观测值,以Lombarda中国医疗混合基金恐惧”和“惊讶”为例图2,3

表2
www.雷竞技rebatfrontiersin.org

表2。ARIMA建模Lombarda中国医疗基金组合的结果。

表3
www.雷竞技rebatfrontiersin.org

表3。ARIMA建模结果E基金蓝筹股选择混合基金。

表4
www.雷竞技rebatfrontiersin.org

表4。ARIMA建模结果招商白酒指数基金。

图2
www.雷竞技rebatfrontiersin.org

图2。观察与预测(Lombarda恐惧)。

图3
www.雷竞技rebatfrontiersin.org

图3。观察与预测(Lombarda惊喜)。

3.2。在资金六个情绪之间的关系

情感存在的一些模式在中国Lombarda医疗混合基金、易方达蓝筹股选择混合基金和中国商人白酒指数基金在今年被发现,见图4- - - - - -6

图4
www.雷竞技rebatfrontiersin.org

图4。Lombarda中国医疗混合基金。

图5
www.雷竞技rebatfrontiersin.org

图5。易方达蓝筹股选择混合基金。

图6
www.雷竞技rebatfrontiersin.org

图6。商人白酒指数基金。

Lombarda中国医疗混合基金,惊喜和悲伤同时有些3月9至10之间达到高峰,2021年,直到2021年3月26日,紧随其后的是持续的恐惧。飙升的悲伤显示6月6日,2021年。恐惧、惊讶、厌恶和愤怒高峰重叠于8月20日,2021年,在恐惧和愤怒重复重叠模式8月21日,2021年。视觉上明显飙升的幸福出现在9月5日,2021年。之后,从恐惧、惊讶和愤怒11月2日,2021年,厌恶加入情感集团11月3日,2021年,和恐惧一直持续到11月6日,2021年。第二个幸福高峰出现在2021年11月21日。最后,接近年底,有些人担心的那样,令人惊讶的是,和愤怒同时于2021年12月1日举行。

在易方达蓝筹股选择混合基金,情感趋势平稳直到6月6日,2021年,悲伤高峰出现。两个月后,恐惧,愤怒,和悲伤的峰值在2021年8月20日。强烈的幸福显示11月21日,2021年,峰值较低的恐惧,愤怒和悲伤出现在2021年12月1日。

招商白酒指数基金,一个小意外上升显示,1月4日,2021年,紧随其后的是第二天有些悲伤。同时惊喜和幸福峰值出现在2月22日,2021年。轻微的恐惧,愤怒,悲伤和快乐,于2021年3月8日波动。有些厌恶4月22日,2021年达到高峰,随后有些惊讶的是第二天达到高峰,然后在第二天轻微的恐惧。2021年6月22日,同样,一些意外重新浮出水面,而恐惧显示第二天。恐惧、厌恶和愤怒在8月20日,2021年,改变惊喜2天后,那么幸福。强烈的幸福是注意到11月4日和21日,2021年。2021年12月28日开始轻微的意外,强烈的恐惧和厌恶和愤怒加入了第二天。2021年12月30日,轻微的恐惧和惊讶和悲伤在场,冷却减少恐惧于12月31日,2021年。

几个情绪之间的相关性被发现通过VAR模型,见表5。删除序列相关,所有情感时间序列的一阶差分。差时间序列的混合测试结果证明接受没有时间序列相关性的假设一个统计上的显著水平。然而,估计系数小。具体地说,在中国Lombarda医疗混合基金,惊喜和悲伤显示一定程度的显著正相关在VAR(1)模型(B= 0.14),悲伤作为预测指标。此外,悲伤(B=−0.41),恐惧(B=−0.04)和意外(B= 0.17)呈现显著相关性与愤怒。其他方程在VAR(1)没有相关报告一个统计上的显著水平。幸福在招商白酒指数基金是恐惧的预测(B= 0.31)和惊喜B= 0.2)。此外,厌恶可能意外的预测(B= 0.53),愤怒和恐惧相互呈正相关。此外,一些情绪之间的相关性在易方达蓝筹股选择混合基金是统计学意义,虽然小系数。因为一个小系数表示的关系是微妙的,我们认为这些情绪相当疲弱之间的相关性。因此,结果未能验证H2本研究。

表5
www.雷竞技rebatfrontiersin.org

表5。向量自回归模型(p= 1)的情绪。

3.3。情感与基金业绩之间的关系

尽可能少的相关性被发现,六种基本的情绪不能被视为一个控制变量VAR模型的基金单位,累计净值。每个情感时间序列在VAR(1)分别计算基金的净值时间序列。见表6,恐惧和单位净值之间的显著关系(B=−0.39)被发现在中国Lombarda医疗混合基金,而恐惧和累计净值呈现一个更强的相关性(B=−5.23)。单位净值(B=−3.21)和累计净值(B=−3.25)显著相关,表现出惊讶,虽然愤怒最强的相关关系单位净值(B=−5.58)。Lombarda的VAR(1)模型考察了中国医疗混合基金合并测试并接受测试假设没有残差序列相关性,以及E基金蓝筹股选择混合基金,见表7。然而,没有一个系数E基金VAR模型具有统计学意义。在表8,招商白酒指数基金建模结果揭示恐惧和单位净值之间的显著相关,但是这个模型没有通过混合测试。厌恶被发现与这两个单位和累计净值(B=−3.45),满足白噪声要求。一般来说,H3本研究的被接受。

表6
www.雷竞技rebatfrontiersin.org

表6。向量自回归模型(p= 1)的情感与基金业绩之间Lombarda中国医疗混合基金。

表7
www.雷竞技rebatfrontiersin.org

表7。向量自回归模型(p= 1)之间的情感和E基金的基金业绩蓝筹股选择混合基金。

表8
www.雷竞技rebatfrontiersin.org

表8。向量自回归模型(p= 1)之间的情感和招商白酒指数基金的基金业绩。

4所示。讨论

ARIMA模型的结果的恐惧、惊讶、厌恶、愤怒、悲伤和快乐表示Lombarda中国医疗保健的最佳预报模型混合基金、易方达蓝筹股选择混合基金和中国商人白酒指数基金。模型共性被发现在三只基金,ARIMA(1 1 0)可以作为一个参考预测恐惧、厌恶、愤怒、悲伤和快乐文本表达式在微博上,ARIMA(2 1 0)可以用来预测惊讶的微博用户,分别。通过实验结果,我们发现,微博情绪可以预测的情绪在前面的时间点。因为模型的常数没有报道在结果部分,我们推荐引用ARIMA参数系数对单变量时间序列趋势的情感。inter-emotion每个基金的分析的结果显示相对较弱的非标准或恐惧之间的关系,惊讶、厌恶、愤怒、悲伤和快乐。虽然视觉趋势提供了一个同现的多重情感在同一时间间隔,本文未能支持一种观点,即某一文本情感相关的特定基金在微博上可以预测另一个。然而,预测的关系被发现在情感的结构分析和基金业绩时间序列。通过VAR模型、恐惧、惊讶和愤怒在微博上可以解释基金业绩和报道负相关性。

一个情感模式可以从我们的研究结果生成;具体来说,随着基金净值低,可能有一个可预测的激增的文本表达恐惧、惊讶的是,在微博和愤怒。这个结果也支持了对情感和行为的研究表明行为反应可以通过情感预测(Weisbuch、小亚当斯,2012年)。因为拼写错误的文本情感分析中未包含的情感频率计数,这样可以忽视潜在的微博帖子的限制,本研究的样本容量下降。图像挖掘,包括照片和emojis,是本研究的另一个挑战;例如,一个讽刺的形象有时可以否定的一种形式,并没有包含在数据收集中。我们鼓励未来的研究从数字的否定社交网站来提高这一研究。

5。结论

我们相信,这项研究有助于语言研究的新视角考虑时态方面重点是文本情感的社交网站和创新统计模型。这项研究的结果给出了一个实际的预测趋势方程的情感需要的组织微博情感监控相关基金在中国,媒体等风险管理团队。此外,本研究提出了见解计算语言学方法在数字情感研究。作为未来的研究,我们将考虑进一步验证建模的其他基金在同一个时间段我们收集和应用现有的语言编码模型的数据集。最后,我们期待着情感的研究在其他领域和语言。

数据可用性声明

原始数据支持了本文的结论将由作者提供,没有过度的预订。

作者的贡献

SL参与设计和分析的算法逻辑算法编码、清洗和分析数据,起草手稿。

的利益冲突

作者说,这项研究是在没有进行任何商业或金融关系可能被视为一个潜在的利益冲突。

出版商的注意

本文表达的所有索赔仅代表作者,不一定代表的附属组织,或出版商、编辑和审稿人。任何产品,可以评估在这篇文章中,或声称,可能是由其制造商,不保证或认可的出版商。

引用

艾哈迈德,美国(2013年)。情感的文化政治。伦敦:劳特利奇。doi: 10.4324 / 9780203700372

CrossRef全文|谷歌学术搜索

Boiger, M。,和Mesquita, B. (2012). The construction of emotion in interactions, relationships, and cultures.条件。牧师。4,221 - 229。

谷歌学术搜索

博伦,J。、毛泽东、H。,和Pepe, A. (2011). “Modeling public mood and emotion: twitter sentiment and socio-economic phenomena,” in学报》国际AAAI网络和社会化媒体会议上(Menlo Park, CA: AAAI出版社),450 - 453。doi: 10.1609 / icwsm.v5i1.14171

CrossRef全文|谷歌学术搜索

鲍彻,j . D。,和Carlson, G. E. (1980). Recognition of facial expression in three cultures.j .交叉崇拜。Psychol。11日,263 - 280。doi: 10.1177 / 0022022180113003

CrossRef全文|谷歌学术搜索

布拉德利,M . M。,Cuthbert, B. N., and Lang, P. J. (1996). Picture media and emotion: effects of a sustained affective context.心理生理学33岁,662 - 670。doi: 10.1111 / j.1469-8986.1996.tb02362.x

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Chan M。,吴X。,Hao, Y., Xi, R., and Jin, T. (2012). Microblogging, online expression, and political efficacy among young Chinese citizens: the moderating role of information and entertainment needs in the use of Weibo.Cyberpsychol。Behav。Soc。Netw。15日,345 - 349。doi: 10.1089 / cyber.2012.0109

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

查特,j·F。,和Meunier, J. G. (2011). Text mining methods for social representation analysis in large corpora.人民行动党。Soc。代表。20日,37.1−37.47。网上:https://psr.iscte-iul.pt/index.php/PSR/article/view/452

谷歌学术搜索

Chrea C。,Grandjean, D., Delplanque, S., Cayeux, I., Le Calvé, B., Aymard, L., et al. (2009). Mapping the semantic space for the subjective experience of emotional responses to odors.化学。感官。34岁,49 - 62。doi: 10.1093 / chemse / bjn052

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

丁香,g . L。,和Ortony, A. (2013). Psychological construction in the OCC model of emotion.条件。牧师。5,335 - 343。doi: 10.1177 / 1754073913489751

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

莳萝、k . e . (2013)。媒体的牛津手册心理学。牛津:牛津大学出版社。doi: 10.1093 / oxfordhb / 9780195398809.001.0001

CrossRef全文|谷歌学术搜索

Dubey,公元(2020)。Twitter COVID-19暴发期间情绪分析。SSRN电子。J。1 - 9。doi: 10.2139 / ssrn.3572023

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

埃克曼,p (1992)。论证的基本情感。Cogn。条件。6,169 - 200。doi: 10.1080 / 02699939208411068

CrossRef全文|谷歌学术搜索

埃克曼,P。,和Keltner, D. (1997). “Universal facial expressions of emotion,” in非语言沟通:自然与文化、eds, p . Segerstrale和p . Molnar(牛津:牛津大学出版社),27岁,46岁。

《公共医学图书馆摘要》|谷歌学术搜索

Fenton-O 'Creevy, M。林家,j . T。、Vohra年代。,Richards, D. W., Davies, G., and Schaaff, K. (2012). Emotion regulation and trader expertise: heart rate variability on the trading floor.j . >。Psychol。经济学。5,227。doi: 10.1037 / a0030364

CrossRef全文|谷歌学术搜索

Ferdenzi C。,Delplanque, S., Barbosa, P., Court, K., Guinard, J. X., Guo, T., et al. (2013). Affective semantic space of scents. towards a universal scale to measure self-reported odor-related feelings.食品质量。喜欢。128 - 138年。doi: 10.1016 / j.foodqual.2013.04.010

CrossRef全文|谷歌学术搜索

加里多,S。,和Schubert, E. (2011). Individual differences in the enjoyment of negative emotion in music: a literature review and experiment.音乐认知。28日,279 - 296。doi: 10.1525 / mp.2011.28.3.279

CrossRef全文|谷歌学术搜索

霍夫斯泰德,g (2001)。文化的后果:比较值,行为,在国家机构和组织。CA:千橡市圣人出版物。

《公共医学图书馆摘要》|谷歌学术搜索

霍夫斯泰德,g (2003)。文化维度。网上:https://www.geert-hofstede.com(2022年7月25日,访问)。

谷歌学术搜索

伊泽德,c, e (2007)。基本情绪,自然种类、情感模式,和一个新的范式。教谕。Psychol。Sci。2,260 - 280。doi: 10.1111 / j.1745-6916.2007.00044.x

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

杰克,r E。,Garrod, O. G., Yu, H., Caldara, R., and Schyns, P. G. (2012). Facial expressions of emotion are not culturally universal.Proc, Nat。学会科学。109年,7241 - 7244。doi: 10.1073 / pnas.1200155109

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

耆那教徒,美国(1994年)。社会文化建设的情绪。Psychol。Dev, Soc。J。6,151 - 168。doi: 10.1177 / 097133369400600205

CrossRef全文|谷歌学术搜索

Kandasamy, N。,Garfinkel, S. N., Page, L., Hardy, B., Critchley, H. D., Gurnell, M., et al. (2016). Interoceptive ability predicts survival on a London trading floor. Sci.代表。6、697。doi: 10.1038 / srep32986

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

国王,s . C。,和Meiselman, H. L. (2010). Development of a method to measure consumer emotions associated with foods.食品质量。喜欢。21日,168 - 177。doi: 10.1016 / j.foodqual.2009.02.005

CrossRef全文|谷歌学术搜索

柯克兰,T。,和Cunningham, W. A. (2012). Mapping emotions through time: how affective trajectories inform the language of emotion.情感12日,268 - 282。doi: 10.1037 / a0024218

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Koplenig, a (2017)。为什么历时语料库的定量分析,不考虑时间序列的时间方面可能会导致错误的结论。数字。Scholarsh。Humanit。32岁,159 - 168。doi: 10.1093 /公司/ fqv030

CrossRef全文|谷歌学术搜索

Koshorek, O。,科恩。,铁道部,N。,Rotman, M., and Berant, J. (2018). Text segmentation as a supervised learning task.arXiv。(预印本)。doi: 10.18653 / v1 / n18 - 2075

CrossRef全文|谷歌学术搜索

克莱默,我公元。,Guillory, J. E., and Hancock, J. T. (2014). Experimental evidence of massive-scale emotional contagion through social networks.Proc, Nat。学会科学。111年,8788 - 8790。doi: 10.1073 / pnas.1320040111

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

李,H。,Liu, H., and Zhang, Z. (2020). Online persuasion of review emotional intensity: a text mining analysis of restaurant reviews.Int。j . Hosp.等内容。89年,102558年。doi: 10.1016 / j.ijhm.2020.102558

CrossRef全文|谷歌学术搜索

Lim: (2016)。文化差异在情绪:情绪唤醒水平的差异在东方和西方之间。中国。地中海Res。。5,105 - 109。doi: 10.1016 / j.imr.2016.03.004

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Lorber, m F。,和Smith Slep, A. M. (2005). Mothers' emotion dynamics and their relations with harsh and lax discipline: microsocial time series analyses.j .临床。孩子Adolesc。Psychol。34岁,559 - 568。doi: 10.1207 / s15374424jccp3403_11

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

罗,美国(2022年)。“研究颜色和情绪之间的关系人文社会科学的进步,教育和研究(巴黎:亚特兰提斯出版社SARL), 253 - 259。doi: 10.2991 / assehr.k.220131.046

CrossRef全文|谷歌学术搜索

马丁,l . N。,和Delgado, M. R. (2011). The influence of emotion regulation on decision-making under risk.j . Cogn。>。23日,2569 - 2581。doi: 10.1162 / jocn.2011.21618

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Ng, b . C。崔,C。,和Cavallaro, F. (2019). The annotated lexicon of Chinese emotion words.65年,73 - 92。doi: 10.1080 / 00437956.2019.1599543

CrossRef全文|谷歌学术搜索

Panksepp, j . (2007)。Neurologizing心理学的影响:appraisal-based如何建构主义和基本情绪理论能够共存。教谕。Psychol。Sci。2,281 - 296。doi: 10.1111 / j.1745-6916.2007.00045.x

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Plutchik, r (1980)。“一般psychoevolutionary理论的情感”理论的情感埃德·h·凯勒曼(Cambridge, MA:学术出版社),3-33。doi: 10.1016 / b978 - 0 - 12 - 558701 - 3.50007 - 7

CrossRef全文|谷歌学术搜索

石英、s r (2009)。原因,情绪和决策:风险和回报计算与感觉。Cogn趋势。Sci。13日,209 - 215。doi: 10.1016 / j.tics.2009.02.003

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

罗斯,a . a g (2006)。来自寒冷的:建构主义和情感。欧元。j . Int遗传代数。。12日,197 - 222。doi: 10.1177 / 1354066106064507

CrossRef全文|谷歌学术搜索

山,S。居,X。,Wei, Y., and Wang, Z. (2021). Effects of PM2, 5. on people's emotion: a case study of Weibo (Chinese Twitter) in Beijing.Int。j .包围。公共卫生》。18日,5422年。doi: 10.3390 / ijerph18105422

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

剃须刀,p R。Murdaya U。,和Fraley, R. C. (2001). Structure of the Indonesian emotion lexicon.亚洲j . Soc。Psychol。4,201 - 224。1467 - 839 - x.00086 doi: 10.1111 /

CrossRef全文|谷歌学术搜索

剃须刀,p R。吴,S。,和Schwartz, J. C. (1992). “Cross-cultural similarities and differences in emotion and its representation,” in情感埃德•m . s .克拉克(CA:千橡市圣人出版物,Inc .), 175 - 212。

《公共医学图书馆摘要》|谷歌学术搜索

刀,B。,Loewenstein, G., Bechara, A., Damasio, H., and Damasio, A. R. (2005). Investment behavior and the negative side of emotion.Psychol。Sci。16,435 - 439。doi: 10.1111 / j.0956-7976.2005.01553.x

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

辛格,p (2021)。FQTSFM: fuzzy-quantum时间序列预测模型。正,科学。566年,57 - 79。doi: 10.1016 / j.ins.2021.02.024

CrossRef全文|谷歌学术搜索

辛格,P。,和Borah, B. (2014). Forecasting stock index price based on M-factors fuzzy time series and particle swarm optimization.Int。j .约。的原因。55岁,812 - 833。doi: 10.1016 / j.ijar.2013.09.014

CrossRef全文|谷歌学术搜索

斯坦:L。,Hernandez, M. W., and Trabasso, T. (2008). “Advances in modeling emotion and thought: The importance of developmental online, and multilevel analyses,” in手册的情绪,eds m·刘易斯、j . m . Haviland-Jones和l . f . Barett(吉尔福德出版社),574 - 586。

谷歌学术搜索

Sundar, S。,和Limperos, A. M. (2013). Uses and grats 2.0: new gratifications for new media.j .广播。电子。媒体。57岁,504 - 525。doi: 10.1080 / 08838151.2013.845827

CrossRef全文|谷歌学术搜索

唐,C。,和Guo, L. (2015). Digging for gold with a simple tool: validating text mining in studying electronic word-of-mouth (eWOM) communication.马克。列托语。26日,67 - 80。doi: 10.1007 / s11002 - 013 - 9268 - 8

CrossRef全文|谷歌学术搜索

茶,d . (2018)。时间序列分析的话语:方法和案例研究。伦敦:劳特利奇。doi: 10.4324 / 9780429505881

CrossRef全文|谷歌学术搜索

茶,d . (2021)。Modelability跨越时间的签名身份建筑在YouTube上。j . Pragmat。182年,1 - 15。doi: 10.1016 / j.pragma.2021.06.004

CrossRef全文|谷歌学术搜索

茶,d . (2022)。“Covid-19新闻发布会时间:世界卫生组织与中国外交部”大流行和危机话语:COVID-19交流和公共卫生战略eds a Musolff, r .微风,k .近藤和美国Vilar-Lluch(伦敦:布卢姆茨伯里派学术),13-30。doi: 10.5040/9781350232730. ch - 001

CrossRef全文|谷歌学术搜索

沃恩,k (1990)。探索情感的sub-structural方面卡累利阿哀叹:时间序列分析应用到数字化的旋律。Yearb。Tradit。音乐。22日,106 - 122。doi: 10.2307/767934

CrossRef全文|谷歌学术搜索

滑铁卢,s F。,Baumgartner, S. E., Peter, J., and Valkenburg, P. M. (2018). Norms of online expressions of emotion: Comparing Facebook, Twitter, Instagram, and WhatsApp.新媒体Soc。20岁,1813 - 1831。

《公共医学图书馆摘要》|谷歌学术搜索

Weisbuch, M。,和Adams, R. B. Jr (2012). The functional forecast model of emotion expression processing.Soc。个人的。Psychol。指南针。6,499 - 514。doi: 10.1111 / j.1751-9004.2012.00443.x

CrossRef全文|谷歌学术搜索

徐,L。,Lin, H., Pan, Y., Ren, H., and Chen, J. (2008). Constructing the affective lexicon ontology.j .中国Soc。科学。科技正无穷。。27日,180 - 185。网上:https://www.researchgate.net/publication/285878236_Constructing_the_affective_lexicon_ontology

谷歌学术搜索

咦,J。,Gina Qu, J., and Zhang, W. J. (2022). Depicting the emotion flow: super-spreaders of emotional messages on Weibo during the COVID-19 pandemic.Soc。媒体Soc。22日。doi: 10.1177 / 20563051221084950

CrossRef全文|谷歌学术搜索

Zammuner, v . l . (1998)。情感的概念:“emotionness”,维评级的意大利情感词。Cogn。条件。12日,243 - 272。doi: 10.1080 / 026999398379745

CrossRef全文|谷歌学术搜索

朱,X。,和Goldberg, A. B. (2009). Introduction to semi-supervised learning.Synth。收。Artif。智能。马赫。学习。3、1 - 130。doi: 10.1007 / 978-3-031-01548-9

CrossRef全文|谷歌学术搜索

关键词:情感分析、预测模型、时间序列、网络爬虫,文本挖掘

引用:罗年代(2022)预测基金配套文本情感趋势在微博上:一个时间序列的研究。前面。Commun。7:970749。doi: 10.3389 / fcomm.2022.970749

收到:6月16日2022;接受:2022年12月02;
发表:2022年12月16日。

编辑:

黛博拉Bettiga意大利米兰理工大学,

审核:

Pritpal辛格、大学、波兰
丹尼斯·泰、香港理工大学、香港特别行政区、中国

版权©2022罗。这是一个开放分布式根据文章知识共享归属许可(CC)。使用、分发或复制在其他论坛是允许的,提供了原始作者(年代)和著作权人(s)认为,最初发表在这个期刊引用,按照公认的学术实践。没有使用、分发或复制是不符合这些条件的允许。

*通信:沙罗,是的sl4396@tc.columbia.edu

下载