Zero-shot姿态检测:范例和挑战
- 计算机科学系,哥伦比亚大学,纽约,纽约,美国
姿态检测的主要挑战是大(可能无限)和各种立场的话题。收集数据等一系列由于注释的费用是不现实的和不断创造新的真实的主题(例如,一个新的政客竞选办公室)。此外,stancetaking发生在各种各样的语言和类型(例如,Twitter,新闻文章)。英文虽然zero-shot姿态检测,评估主题培训期间未见,已经受到了越来越多的关注,我们认为这种关注应该扩展到多语言和multi-genre设置。我们讨论两个范例英语zero-shot姿态检测评估,以及最近在这个领域工作。然后我们讨论最近的工作在多语种和multi-genre姿态检测,主要集中在non-zero-shot设置。我们认为这项工作应该扩展到多语言和multi-genre zero-shot姿态检测并提出最佳实践系统化和刺激未来的工作方向。而域适应技术非常适合在这些设置工作,我们认为增加护理应采取提高模型explainability并进行可靠的评估,考虑不仅经验泛化能力也理解复杂的语言和推论。
1。介绍
姿态检测的一个主要挑战是大(可能无限)和多样化的主题在现实世界的立场。此外,随着越来越多的世界各地的人们转向在线平台新闻或分享意见(如微博、评论新闻文章),姿态模型必须能够概括新话题无论语言或流派。然而,由于费用的注释和连续创造新的主题(例如,一个新的政客竞选办公室),收集所有可能是不现实的话题,语言,和流派。因此,zero-shot姿态检测(ZSSD)(即。,stance detection requiring zero-shot learning) is crucial for developing widely applicable stance models.
研究ZSSD(即通常做zero-shot学习主题。主题没有看到在训练、评估;ZSSD主题)。虽然这是类似的跨主题姿态检测1,跨主题立场要求人类知识评价的话题,因为它们认为是语义相关的培训主题,使跨主题的立场不太可行的广泛推广。刺激我们的发展的巨大的数据集(Allaway部,2020年)和适应现有的跨主题ZSSD姿态数据主题(Allaway et al ., 2021),英语ZSSD主题已经收到了越来越多的关注(即刘et al ., 2021;朱et al ., 2022),两个评价范式,即(我)MANY-TOPIC(即。,many unseen topics but very few examples per topic), and (ii)几个课目(即。,only a few topics but many examples per topic). We survey existing work on these two datasets and argue that incorporating external knowledge (e.g., from Wikipedia) and training topic-invariant features are the most promising directions for further exploration.
尽管最近的进步英语ZSSD主题检测是单极,大多数现有的工作立场。也就是说,模型训练和评估文本上分享一些属性(板,2016),比如语言、风格和主题。此外,姿态检测数据集包括各种各样的标签集(例如,赞成/反对/中性和同意/不同意/讨论/无关)。我们认为为了立场系统成为广泛适用,ZSSD应该扩展到包括zero-shot学习跨语言(ZSSD语言)、类型(ZSSD类型),标签集(ZSSDLabelSet)。
尽管最近的工作多域的立场(例如,席勒et al ., 2021;Hardalov et al ., 2022),探索转移学习,它不评估在特定ZSSD*设置,*∈{主题、语言风格,LabelSet}。因此,为了支持和规范ZSSD进一步努力,我们提出一套最佳实践。此外,我们讨论ZSSD的必要性评估模型的鲁棒性(例如,性能等具有挑战性的现象讽刺,韧性敌对攻击)改善explainability。
2。为ZSSD范例
我们提供ZSSD的概述主题用英语描述最常见的数据集(2.1节),以及现有的工作在这些数据集(2.2节)和其优势和弱点(2.3节)。
2.1。数据
我们描述ZSSD的两个数据集主题:巨大(2.1.1节)——数据集MANY-TOPIC覆盖范围广泛的主题的立场(Allaway部,2020年),Sem16(2.1.2节)——Twitter数据集覆盖六个主题(穆罕默德et al ., 2016),一直在适应几个课目的立场。所示的两个数据集的例子表1。尽管其他数据集用于跨主题的立场(例如,Conforti et al ., 2020;Zhang et al ., 2020),我们将讨论用于Sem16因为它是主要的数据集几个课目的立场。在这两个数据集,任务是预测一个立场标签ŷ∈{赞成、反对、中性}为每个输入。
2.1.1。巨大的
巨大的数据集包含的评论《纽约时报》与5634年主题覆盖广泛的主题,如政治(如“一个巴勒斯坦国”),教育(例如,“特许学校”),和公共卫生(如“儿童期疫苗接种”)(Allaway部,2020年)。主题还包括范围广泛的类似的表达式(例如,“校园枪支”和“校园枪支”),捕获变异在人类如何实际地描述相同的话题。注意,大量既有zero-shot和few-shot评价集。
2.1.2。Sem16
Sem16数据集创建SemEval2016任务6,由英语微博六个主题(例如,“唐纳德·特朗普”)(见表1)。虽然数据集ZSSD并不发达,我们适应它几个课目把每一个主题t反过来作为zero-shot测试主题(Allaway et al ., 2021)。具体来说,对于每一个t所有来自其他五个主题的例子用于训练和验证所有的例子t用于测试。这个设置不同于跨主题的立场,只有两个相关的主题使用,一个用于培训和一个用于评估(例如,徐et al ., 2018;魏和毛泽东,2019;Zhang et al ., 2020)。zero-shot设置允许评价一个主题,即使在一个相关的人没有提供,使一个更大的数据集用于培训每个模型。
2.2。方法
现有工作ZSSD主题使用的技术:(1)学习潜在主题为了推广(2.2.1节),(2)利用实用信息(2.2.2节),(3)学习topic-invariant特性(2.2.3节),和(4)将外部知识(2.2.4节)。我们依次讨论这些。
2.2.1。潜在的主题
对于ZSSD主题,特别是MANY-TOPIC,大型和多样化的主题可以挑战模式。为了利用这种差异,在我们之前的工作(Allaway部,2020年我们假设一组K潜在主题构成更大的集合。例如,“为儿童接种疫苗”和“流感疫苗”将潜在的主题的一部分”接种疫苗。”潜在的主题提供implicitly-learned信息看不见的主题在评估。当我们提出固定latent-topic表征得到了集群输入表示,研究更新latent-topic表示在培训后,通过重新集群(梁et al ., 2022 b)或从嵌入的随机初始化(刘r . et al ., 2022)。尽管很少用于潜在的主题几个课目立场,因为主题的数量已经很小,他们已经使用了跨主题立场模型训练和测试之间的相似主题(例如,魏和毛泽东,2019)。
2.2.2。实用的信息
学习识别文档的哪些部分(例如,单词和短语)是最重要的表达立场的一个主题可以帮助识别通用模型姿态模式和推广新课题。模型的关注,是否不能控制的(徐et al ., 2018)或直接训练模拟人类相关性分数(Jayaram Allaway, 2021),鼓励学习的模型信息。此外,用词的明确的措施,包括相对频率在一个主题(梁et al ., 2021)和特定主题关键字(梁et al ., 2022 a)来自LDA (Blei et al ., 2003),可以帮助模型自动识别重要的单词表达立场。
2.2.3。Topic-Invariant特性
ZSSD主题(即可以被陷害为domain-adaptation问题。,the topic is the domain) and domain-invariant features are a common component of many domain adaptation techniques (e.g.,Ben-David et al ., 2006;Glorot et al ., 2011;Ganin et al ., 2016;Zhang et al ., 2017)。这些特性的目的是学习跨域信息推广。在姿态检测,topic-invariant特性(即。,the topic as the domain) are obtained primarily through two techniques: contrastive learning (英航et al ., 2020;梁et al ., 2022 b;刘r . et al ., 2022;刘y . et al ., 2022)和对抗性的学习(魏和毛泽东,2019;英航et al ., 2020;Allaway et al ., 2021;Hardalov et al ., 2021)。
的目的对比学习(例如,哈德et al ., 2006)是一个输入的表示(锚)类似于正面例子和不同的负面的例子。在姿态检测,对比与不同话题的学习应用于输入,鼓励topic-invariant特性表征。通常,立场标签(例如,pro, con)用于选择正面例子(刘r . et al ., 2022),但是其他属性也被使用,包括例子是否topic-agnostic(即。预测,他们的立场并不依赖于相关话题的单词)(梁et al ., 2022 a)和两个例子是否共享一个潜在的主题(梁et al ., 2022 b)。负面的例子往往锚mini-batch的其余部分,但他们也可以选择有一个特定的关系锚(例如,不同媒体来源)(英航et al ., 2020;刘y . et al ., 2022)。在这两个MANY-TOPIC或几个课目立场,对比学习鼓励模型专注于特定的属性,在主题来概括。
同样的,敌对的学习(Ganin et al ., 2016)直接部队学习域不变特性的模型通过要求相同的一组功能,既有利于预测和立场不用于预测一个输入的域。为了学习topic-invariant特性,主题通常视为域(魏和毛泽东,2019;Allaway et al ., 2021),尽管其他领域也被使用,如媒体(英航et al ., 2020)。尽管敌对的学习与主题领域非常适合几个课目立场(例如,Allaway et al ., 2021),它没有广泛推广MANY-TOPICdomain-classifier的立场,因为标签的数量大幅增长,使培训困难。
2.2.4。外部知识
外部知识通常是显式地从外部源(例如,维基百科相关主题的文章他et al ., 2022年;朱et al ., 2022,常识知识库刘et al ., 2021,情绪和情感lexicaZhang et al ., 2020),然后使用图表(Zhang et al ., 2020;刘et al ., 2021)或原始文本传递一个语言模型编码器的输入(他et al ., 2022年;朱et al ., 2022)。另外,知识可以合并间接通过训练的任务(例如,在意识形态的预测英航et al ., 2020;刘y . et al ., 2022)。无论如何,这种技术可以推广到(即一套不断扩大的主题。,real-world settings), as long as relevant external knowledge is available, and can be applied to both几个课目和MANY-TOPIC设置。
2.3。讨论
我们现在讨论的结果ZSSD上面的方法主题(表2),在MANY-TOPIC(巨大的)几个课目Sem16设置()。我们注意到我们在结果包括跨主题姿态模型为了呈现一个进步的全貌。然而,在我们之前的工作(Allaway et al ., 2021)我们认为,标准的跨主题的相似性假设训练和测试的主题可能会影响模型的泛化能力。因此,我们重点分析具体zero-shot模型。
对于zero-shotMANY-TOPIC在巨大的立场,包括外部知识是最成功的技术(表2)。有趣的是,将知识从维基百科(他et al ., 2022年;朱et al ., 2022)是大大优于合并常识性的知识(Zhang et al ., 2020;刘et al ., 2021)。通过任务训练的模型添加外部知识(英航et al ., 2020;刘y . et al ., 2022)也表现良好,实现了最佳的性能在所有话题,包括non-zero-shot的(例如,所有F1)。因为zero-shot主题测试主题(79%表1),zero-shotF1可能类似的报道所有F1。虽然早期的模型使用潜在的主题(Allaway部,2020年)和语用学(徐et al ., 2018;Jayaram Allaway, 2021),添加topic-invariant特性进一步提高性能(梁et al ., 2022 a,b;刘r . et al ., 2022)。事实上,topic-invariant特性与其他技术相结合(例如,在最好的模型英航et al ., 2020;刘y . et al ., 2022)优于只使用topic-invariant特性技术(Allaway et al ., 2021)。
方法使用外部知识(朱et al ., 2022)和对比学习(梁et al ., 2022 b)也成功几个课目立场Sem16 (表2)。有趣的是,朱镕基et al。(2022)只执行最好的主题”希拉里•克林顿(Hillary Clinton)”和“唐纳德·特朗普。”虽然contrastive-learning-based方法(梁et al ., 2022 a,b)上执行最好的另一主题。自朱镕基et al。(2022)使用外部知识从维基百科,这可能的好处具体主题(如人)比抽象的主题(例如,“女权主义”),因为文章抽象主题通常更重视历史和学术背景。我们注意到,尽管跨主题模型梁et al。(2021)最好包含语用信息,执行“堕胎合法化。”它由zero-shot表现模型在剩下的话题。此外,敌对的学习(Allaway et al ., 2021)执行的更好几个课目设置,而MANY-TOPIC。
整体而言,这些结果表明,zero-shot立场,更有益的一般知识和特性建模主题或将语用学的潜在空间。这与直觉关于真实世界的场景主题的数量不断增长。一组固定的潜在主题和training-set-derived语用信息不适合模型发展的话语空间。相反,模型,结合同样发展的外部知识或认识的一般模式stancetaking(即。通过一般特征)具有更好的适应性和更适合这样的场景。
3所示。延长zero-shot姿态检测
我们下一个调查现有工作多域姿态检测(3.1节),然后讨论重要的考虑未来研究zero-shot多域姿态检测(3.2节)。
3.1。现有的工作
3.1.1。数据
在多域姿态检测,大部分工作集中在语言域(即。,它是多语言)(Taule et al ., 2017,2018年;赖et al ., 2020;Vamvas Sennrich, 2020;Zotova et al ., 2020;哈姆迪et al ., 2021)。这些数据主要是不用于zero-shot场景,因为相同的语言和主题出现在训练集和评价集。例如,创建了多个数据集的姿态检测与西班牙加泰罗尼亚独立的主题和加泰罗尼亚语言训练和评估(Taule et al ., 2017,2018年;Zotova et al ., 2020)。同样的,赖et al。(2020)为法国和意大利创建一个数据集的主题和语言之间共享培训和评估。
此外,还有少量的数据集对ZSSD子集主题或ZSSD语言。具体来说,NewsEye数据集(哈姆迪et al ., 2021)由历史新闻文章四种语言(德国、法国、芬兰和瑞典),尽管所有的语言出现在测试集,主题可以zero-shot和不是2。更进一步,xstance数据集(Vamvas Sennrich, 2020同时zero-shot主题)和zero-shot语言(即。,examples in Italian occur only in the test set). However, the zero-shot subsets of these datasets are still quite small. TheNewsEye每个语言测试子集从~ 250 ~ 1k实例。同样,在xstance只有1456年zero-shot语言(也就是实例。,Italian), of which only 283 also have zero-shot topics, compared to ~11k测试实例zero-shot看到语言的主题(德国和法国)。
3.1.2。方法
多语言设置的少量的可用数据有限的工作之前。特别是,许多作品(例如,Vamvas Sennrich, 2020;哈姆迪et al ., 2021)关注创建数据集和只提供基线结果(例如,从伯特Devlin et al ., 2019)。然而,最近的多域结合的研究multi-dataset学习(Hardalov et al ., 2021,2022年;席勒et al ., 2021)增加了多域姿态检测的可能性。特别是multi-dataset学习使得用于训练和评估大量的姿态数据集包括多种语言、流派和标签集。
类似于技术用于ZSSD主题,从事多语种和multi-genre立场也包含外部知识,通过任务训练的“胶(席勒et al ., 2021)或情绪分类(Hardalov et al ., 2022),以及域不变特性。这些域不变特性可以通过对抗性的学习(Hardalov et al ., 2021),以及从label-embeddings,允许multi-dataset学习与多个标签集(Hardalov et al ., 2021;席勒et al ., 2021)。与单极立场,外部知识是特别有效的多域的立场多语种和multi-genre设置。
3.1.3。评估和困难
尽管这些技术,但仍大之间的性能差距全程指导和zero-shot模型。例如,尽管Hardalov et al。(2021)英语16日评估数据集(从多个流派),只对ZSSD巨大主题,Hardalov et al。(2021)最好的模型是SOTA低49.3%(即,刘y . et al ., 2022)。同样,在多语言的环境中,平均zero-shot评估的性能下降39.4%(15个数据集对面12种语言),低于1/3的数据集随机猜测(Hardalov et al ., 2022)。此外,60%的数据集,立场上最好的模型训练数据集只有在英语。注意,在Hardalov et al。(2022),zero-shot指是否一个特定的数据集是在训练,这是有问题的。
事实上,含糊不清周围ZSSD使之前的工作成果的概念显然难以评估。特别是,多语种zero-shot实验Hardalov et al。(2022)不能被视为ZSSD语言因为语言出现在多个数据集(例如,意大利和法国都发生在两个)。实验也同样不是ZSSD类型因为使用多个数据集从一个类型(例如,七个使用Twitter的数据集)。最后,这些实验不是ZSSD主题因为,尽管如此,许多数据集包含一个独特的单一主题(例如,“阿长音符号”)主题确实存在(例如,在重叠xstance),可能会加剧了训练的英语姿态数据集(即。在许多数据集)的最佳模型。
工作在英语multi-genre立场Hardalov et al。(2021)表现出类似问题。具体来说,不能认为ZSSD范围之外的实验类型因为多个其它同类型的数据集作为测试数据集用于培训(如Twitter)此外,这些实验也不是ZSSD主题因为多个数据集共享主题(例如,“唐纳德·特朗普”穆罕默德et al ., 2016;Sobhani et al ., 2017)。
因此,尽管最近有前途的多域姿态检测,有重大改进的余地zero-shot设置,在实证结果和评价控制设置。
3.2。提出了最佳实践
为了支持未来ZSSD和地址之前工作的评价问题,我们建议的最佳实践ZSSD培训和评估。首先,为了进行这样的实验是很重要的指定zero-shot发展集(即。,for hyperparameter tuning). For example, in ZSSD语言那是,至少一种语言不同的应该指定的训练集和测试集的发展。这样可以确保测试集仍然zero-shot zero-shot的同时提供一个近似的性能调优。
其次,用于zero-shot域方面的评估显式指定和重叠控制了(即在这些方面。,between training and evaluation). This is especially important in multi-dataset learning, since multiple datasets may share the value of a domain aspect (e.g., have the same language). Controlling for overlap ensures that experiments accurately measure ZSSD.
最后,设置一个zero-shot领域方面的研究(例如,zero-shot语言和主题)应该评估方面的所有组合。也就是说,应该ZSSD进行实验α对于每个非空α⊆一个特别是,为了明确区分改进zero-shot转移的类型。例如,如果一个= {话题,语言},那么我们应该评估不仅ZSSD话题,语言,而且ZSSD主题和ZSSD语言。
我们希望这些命题将支持在ZSSD和系统化的研究。
4所示。讨论
无论设置,ZSSD提出了一个持续的挑战:评估鲁棒性和explainability。虽然这些不是ZSSD所特有的,它们是重要的考虑ZSSD由于许多立场的敏感性的话题(如政治或意识形态上的信仰)。
鲁棒性是很重要的,因为整体经验改进可能会误导人。考虑庞大的数据集,它是由一个指定的挑战组件调查复杂的语言(例如,讽刺)和潜在的杂散信号的数据(例如,共享文档的例子,但有不同的主题)。这组只有两个系统报告结果(例如,刘et al ., 2021;刘r . et al ., 2022)和性能下降的现象范围从0.1到21.5%。尽管如此,刘et al。(2021)具有较高的zero-shotF1(见表2),它有较大的性能下降4/5类型的具有挑战性的现象。因此,只考虑整体F1是有问题的评估模型。
对手的攻击也可以用来探测的鲁棒性。例如,我们(Allaway部,2020年)找到性能差异从1.3到9.5%由于情绪变化的输入。另外,席勒et al。(2021)进行对抗攻击介绍套用,拼写错误,和不必要的否定。他们发现尽管multi-dataset学习优于single-dataset学习整个数据集,multi-dataset模型的两倍(即容易受到对手的攻击。multi-dataset学习平均下降10.3%,而5.7% single-dataset学习)。这进一步说明了模型综合评价的必要性。
在ZSSD Explainability尤为重要,预测zero-shot实例应该建立在人类推理有效。尽管如此,我们Jayaram Allaway, 2021)研究培训的注意模型来模拟人类的基本原理,有有限的工作对explainability姿态检测。自模型将外部知识展览ZSSD尤其强劲性能主题(见2.3节),explainability有助于验证模型预测是基于合理的和真正的事实或推论。这反过来会增加人体模型和实际可行性的信心。
在这项工作中,我们提出了两种范式ZSSD主题(即。,zero-shot topics) and review existing methods and data for each. We argue that incorporating external knowledge and domain-invariant features are the most promising techniques. Additionally, we argue that ZSSD should be expanded beyond English and we analyze work in multi-lingual and multi-genre stance (including non-ZSSD). Although multi-dataset learning is promising, there is still significant room for improvement, particularly in zero-shot settings. To stimulate further work and systematize evaluation, we propose a set of best practices for ZSSD. Finally, we argue that robustness and explainability should be considered both in the construction and evaluation of ZSSD models.
数据可用性声明
公开的数据集进行分析。这些数据可以发现:https://github.com/emilyallaway/zero-shot-stance/tree/master/data/VAST;https://github.com/MalavikaSrikanth16/adversarial-learning-for-stance/blob/main/src/data/twitter_data_naacl.zip。
作者的贡献
EA:写作、分析数据集的方法,并讨论。公里:建议和编辑。所有作者的文章和批准提交的版本。
资金
这种材料是基于工作由美国国家科学基金会支持下研究生研究奖学金资助。dge - 1644869。
的利益冲突
作者声明,这项研究是在没有进行任何商业或财务关系可能被视为一个潜在的利益冲突。
出版商的注意
本文表达的所有索赔仅代表作者,不一定代表的附属组织,或出版商、编辑和审稿人。任何产品,可以评估在这篇文章中,或声称,可能是由其制造商,不保证或认可的出版商。
作者免责声明
任何意见、发现和结论或建议用这种材料的作者(年代),不一定反映美国国家科学基金会的观点。
脚注
1。^也称为“cross-target”(例如,在穆罕默德et al ., 2016;徐et al ., 2018)。
2。^实例没有被清晰的标记为zero-shot主题。
引用
Allaway E。,McKeown, K. (2020). “Zero-shot stance detection: a dataset and model using generalized topic representations,” in学报2020年会议上实证方法在自然语言处理(EMNLP)(计算语言学协会)。
Allaway E。,Srikanth, M., and McKeown, K. (2021). “Adversarial learning for zero-shot stance detection on social media,” in学报2021年大会北美的计算语言学协会章:人类语言技术。
英航,R。,Martino, G. D. S., Glass, J. R., and Nakov, P. (2020). “We can detect your bias: predicting the political ideology of news articles,” in学报2020年会议上实证方法在自然语言处理(EMNLP)。
Ben-David, S。,Blitzer J。谎言,K。,Pereira, F. C. (2006). “Analysis of representations for domain adaptation,” in少量的酒(温哥华BC)。
Conforti C。Berndt, J。,Pilehvar, M. T., Giannitsarou, C., Toxvaerd, F., and Collier, N. (2020). “Will-they-won't-they: A very large dataset for stance detection on Twitter,” in学报》第五十八届计算语言学协会的年度会议。
Devlin, J。,Chang, M.-W., Lee, K., and Toutanova, K. (2019). “Bert: Pre-training of deep bidirectional transformers for language understanding,” inNAACL(明尼阿波利斯、锰)。
Ganin Y。,Ustinova, E., Ajakan, H., Germain, P., Larochelle, H., Laviolette, F., et al. (2016). Domain-adversarial training of neural networks.j·马赫。学习。Res。17日,1-35。
Glorot X。,Bordes, A., and Bengio, Y. (2011). “Domain adaptation for large-scale sentiment classification: a deep learning approach,” inICML(贝尔维尤,佤邦)。
哈德。R。,Chopra, S., and LeCun, Y. (2006). “Dimensionality reduction by learning an invariant mapping,” in2006年IEEE计算机学会计算机视觉与模式识别会议(CVPR ' 06),卷。2(纽约:IEEE), 1735 - 1742。
哈姆迪,一个。,Pontes, E. L., Boros, E., Nguyen, T.-T.-H., Hackl, G., Moreno, J. G., et al. (2021). “A multilingual dataset for named entity recognition, entity linking and stance detection in historical newspapers,” in学报》第44届国际市立图书馆会议在信息检索的研究与开发。
Hardalov, M。Arora,。Nakov, P。,一个ugenstein, I. (2021). “Cross-domain label-adaptive stance detection,” inEMNLP(蓬迦南)。
Hardalov, M。Arora,。Nakov, P。,一个ugenstein, I. (2022). “Few-shot cross-lingual stance detection with sentiment-based pre-training,” inAAAI。
他,Z。,Mokhberian, N., and Lerman, K. (2022). “Infusing knowledge from wikipedia to enhance stance detection,” inWASSA。
,年代。,Allaway E。(2021). “Human rationales as attribution priors for explainable stance detection,” inEMNLP(蓬迦南)。
赖,M。,Cignarella, A. T., Farías, D. I. H., Bosco, C., Patti, V., and Rosso, P. (2020). Multilingual stance detection in social media political debates.第一版。演讲朗。63年,101075年。doi: 10.1016 / j.csl.2020.101075
梁,B。,Chen, Z., Gui, L., He, Y., Yang, M., and Xu, R. (2022a). “Zero-shot stance detection via contrastive learning,” in学报2022年ACM Web会议(里昂)。
梁,B。傅,Y。,Gui, L., Yang, M., Du, J., He, Y., et al. (2021). “Target-adaptive graph for cross-target stance detection,” in学报2021年Web会议(卢布尔雅那)。
梁,B。、朱、Q。李,X。,Yang, M., Gui, L., He, Y., et al. (2022b). “Jointcl: a joint contrastive learning framework for zero-shot stance detection,” in诉讼60的计算语言学协会年度会议上,卷1(都柏林)。
刘,R。,Lin, Z., Fu, P., Liu, Y., and Wang, W. (2022). “Connecting targets via latent topics and contrastive learning: a unified framework for robust zero-shot and few-shot stance detection,” inICASSP 2022 - 2022年IEEE国际会议音响、演讲和信号处理(ICASSP)(新加坡:IEEE), 7812 - 7816。
刘,R。,Lin, Z., Tan, Y., and Wang, W. (2021). “Enhancing zero-shot and few-shot stance detection with commonsense knowledge graph,” in发现。
刘,Y。,Zhang, X. F., Wegsman, D., Beauchamp, N., and Wang, L. (2022). “Politics: pretraining with same-story article comparison for ideology prediction and stance detection,” inNAACL-HLT(西雅图,华盛顿州)。
穆罕默德,s M。,Kiritchenko, S., Sobhani, P., Zhu, X.-D., and Cherry, C. (2016). “Semeval-2016 task 6: detecting stance in tweets,” inSemEval@NAACL-HLT(圣地亚哥,CA)。
席勒,B。,Daxenberger, J., and Gurevych, I. (2021). Stance detection benchmark: how robust is your stance detection?ArXiv、abs / 2001.01565。doi: 10.48550 / arXiv.2001.01565
Sobhani, P。,Inkpen, D., and Zhu, X. (2017). “A dataset for multi-target stance detection,” inEACL(瓦伦西亚)。
Taule, M。,Martí, M. A., Pardo, F. M. R., Rosso, P., Bosco, C., and Patti, V. (2017). “Overview of the task on stance and gender detection in tweets on catalan independence,” inIberEval@SEPLN(穆尔西亚)。
Taule, M。,Pardo, F. M. R., Martí, M. A., and Rosso, P. (2018). “Overview of the task on multimodal stance detection in tweets on catalan #1oct referendum,” inIberEval@SEPLN(塞维利亚)。
Vamvas, J。,Sennrich, R. (2020). X -stance: a multilingual multi-target dataset for stance detection.ArXiv、abs / 2003.08385。doi: 10.48550 / arXiv.2003.08385
魏,P。,Mao, W. (2019). “Modeling transferable topics for cross-target stance detection,” in《第42国际市立图书馆会议在信息检索的研究与开发(巴黎)。
徐,C。,Paris, C., Nepal, S., and Sparks, R. (2018). “Cross-target stance classification with self-attention networks,” in美国第56计算语言学协会年会(卷2:短论文)(墨尔本,维克:计算语言学协会)。
张,B。,Yang, M., Li, X., Ye, Y., Xu, X., and Dai, K. (2020). “Enhancing cross-target stance detection with transferable semantic-emotion knowledge,” in学报》第五十八届计算语言学协会的年度会议。
张,Y。,Barzilay, R., and Jaakkola, T. (2017). Aspect-augmented adversarial networks for domain adaptation.反式。Assoc。第一版。语言学家。5,515 - 528。doi: 10.1162 / tacl_a_00077
朱,Q。,梁,B。,太阳,J。杜,J。,Zhou, L., and Xu, R. (2022). “Enhancing zero-shot stance detection via targeted background knowledge,” in《45国际市立图书馆会议在信息检索的研究与开发(马德里)。
关键词:zero-shot姿态检测,多语种,转移学习领域适应
引用:Allaway E和部K (2023) Zero-shot姿态检测:范例和挑战。前面。Artif。智能。5:1070429。doi: 10.3389 / frai.2022.1070429
收到:2022年10月14日;接受:2022年12月26日;
发表:2023年1月13日。
编辑:
Florentina Hristea大学布加勒斯特,罗马尼亚版权©2023 Allaway和部。这是一个开放分布式根据文章知识共享归属许可(CC)。使用、分发或复制在其他论坛是允许的,提供了原始作者(年代)和著作权人(s)认为,最初发表在这个期刊引用,按照公认的学术实践。没有使用、分发或复制是不符合这些条件的允许。
*通信:艾米丽Allaway,eallaway@cs.columbia.edu