跳转到主要内容

原始研究的文章

前面。Psychol。,06 February 2023
秒。心理学的语言
卷14 - 2023 | https://doi.org/10.3389/fpsyg.2023.980523

阅读机器人:深度学习指导阅读的含义

Baorong黄 1,几斗 2、3海赵 4 *
  • 1研究所的语料库研究和应用中,上海外国语大学,上海,中国
  • 2国际合作学院,广东理工科技,广州,中国
  • 3Unikl商学院大学吉隆坡,吉隆坡,马来西亚
  • 4计算机科学与工程系、电子信息与电气工程学院,上海交通大学,上海,中国

本研究介绍了深度学习的应用程序自动生成技术指导独立阅读。研究探索和演示了如何整合deep-learning-based自然语言处理技术的新进展的三个阅读阶段,即课前阅读阶段,在阅读阶段,校服的阶段。因此,新颖的设计和实现一个原型系统提出了基于深度学习技术。这个系统包括连接先验知识与知识生成图表和总结问题,复杂的句子的分解与文本简化和自动评分的读者的写作对阅读材料的理解。词义消歧实验,命名实体识别与实际材料和问题生成原型系统显示选定的深度学习模型在这些任务获得有利的结果,但仍有错误克服在他们在现实应用程序中直接使用。基于实验结果和报道深度学习的性能模型在阅读有关任务,这项研究揭示了深层学习技术的挑战和局限性,如性能不足,域转移问题,和较低的解释能力,为未来的改进。

1。介绍

阅读理解是人类获取知识的主要途径,而阅读能力的培养在学生教师促进知识的蒸馏仍是文学教育的中心任务之一。最大化阅读理解的影响,教师已经开发出很多策略和工具,包括计算机技术。计算机技术是一种广泛使用的工具,促进学生阅读素养,通过大量的研究集中在智能辅导系统(ITS)的影响在孩子的年龄组(1 - 3年级豪普特曼et al ., 1994)、幼儿园(Voogt麦肯尼,2007),k - 12(从幼儿园到12年级)的学生(Proudfoot 2016;徐et al ., 2019;Pahamzah et al ., 2022),和成人(拉马钱德兰Stottler, 2000)。这些系统辅助读者作为教练(豪普特曼et al ., 1994),读的同伴(Madnani et al ., 2019),或者使用增强现实(Voogt麦肯尼,2007)构建交互式数字环境。人工智能,包括贝叶斯网络和模糊逻辑,用于自适应支持学生学习环境,表现出积极的结果(Eryilmaz Adabashi, 2020)。

个性化辅导的需求不断增长,传统的计算机技术或其系统严重依赖手工编制的阅读材料,支持测试,图片不够灵活和可扩展的应对大规模的在线资料。在“数字双”的时代metaverse逐渐浮出水面的替代现实世界人类和人工智能技术的进步,数字文本正在以前所未有的速度发展,为教师带来了巨大的挑战。解决问题提高客户交互,使用深度学习技术,越来越多的聊天机器人被部署到模仿人类沟通和服务行业的服务客户。然而,尽管在自然语言处理的进展和激烈的电波在聊天机器人的商业化进展,商品推荐,和其他领域,应用这一进步的阅读理解辅导仍处于起步阶段。

在这项研究中,我们建议阅读机器人的概念,先锋的应用最新进展在深度上优于自然语言处理阅读理解的指令。读者的阅读机器人可以作为一个老师在阅读困难或帮助他们准备语言考试。它引导读者通过阅读在阅读理解活动,包括指导问题,词汇,分析复杂的长句子,选择题测验,和写作任务。此外,它还可以协助教师准备阅读课程材料自动生成问题,从知识获取图形图像和音频资源,和自动评分提交的文章的读者。

本研究的结构如下:介绍之后,我们的一些研究阅读模式,阅读阶段,阅读目标,和计算机技术用于帮助阅读,然后,我们短暂的自然语言处理的最新进展。我们地面的应用阅读绳子理论的最新发展,强调所有必要的技能组合的深刻理解。“阅读有关技术时代的深刻学习”部分解释了混凝土技术可应用于指导阅读,包括词义消歧、命名实体识别、知识图,问题一代,文字简化,自动答案评分,和自动作文评分。在“阅读机器人模型映射和实现”部分中,我们描述了设计和实现的阅读应用上述技术的机器人。“案例研究”一节中,我们评估建议的10篇文章阅读机器人从英国文化协会的网站1(一个公众公司,帮助英语学习者)和现在的深度学习技术的性能,详细说明他们的优点和缺点。最后,我们指出了当前设计的挑战和局限性,考虑未来研究的可能性。

在这项研究中,我们的目标是在回答以下问题:

1)具体技术受到深度学习可以用于指导阅读?

2)我们如何设计一个阅读机器人融合了深度学习的进步吗?

3)什么是当前深入学习模型的性能在处理阅读材料外的预定义的数据集?

2。文献综述:阅读模型和计算机技术在阅读

2.1。阅读模式重新审视

阅读理解是一个过程,涉及的方面包括周围的世界我们读知识,意图,和期望我们头脑里已经连续预测基于先验知识(史密斯,2004)。有不同的模型来描述阅读过程,比如阅读的简单视图(高夫Tunmer, 1986),construction-integration模型(Kintsch 1988),阅读绳(斯卡伯勒,2001)和赛登伯格的三角形模式(赛登伯格,2017)。阅读的简单视图状态这两个单词解码和语言理解阅读理解是至关重要的。根据construction-integration模型,理解是两个核心过程的结果,即建设和集成。前处理激活信息从文本和先验知识驻留在内存的读者,而后者过程扩散激活整个网络激活落定之前(Butterfuss et al ., 2020)。阅读绳模型指出,熟练阅读单词识别技能和语言理解能力的结合,包括背景知识、词汇、语言结构、语言推理,知识素养。赛登伯格的三角模型指出,人们必须创建链接阅读从打印到现有的语言知识和从语音、语义(意义)。

Connectivism是一种新的理论,强调通过团体活动获得的知识。Connectivism所定义的西门子(西门子2005),标志着“构造转变学习不再是一个内部的社会里,个人主义的活动”,和它的三个核心原则如下:

1。学习是一个过程连接专业节点或信息来源。

2。培育和维护连接需要促进持续学习。

3所示。看到字段之间的联系的能力,想法,概念是一个核心技能。

此外,个人知识是由网络和与组织或机构的知识互补的圈子里,学习者可以保持当前的领域通过连接形成。

2.2。阅读阶段和目标

三级阅读过程,即。,pre-reading (into), while-reading (through), and post-reading (beyond), in consideration of three types of cultural and content schemata, text-processing schemata, and linguistic and grammatical schemata (Diaz-Rico 2013,p . 172 - 179),广泛应用于阅读教学组织活动(读写)。在课前阅读阶段,读者准备与关键术语表、图片、背景知识、特定领域的知识,或引起的文本的摘要先验知识和准备让连接的同化新知识中包含的文本。在阅读时阶段,加强语言的策略和语法知识可以用来将文本中的知识合并到现有的读者的图式。在校服阶段,可以组织各种活动帮助读者理解评估,如后续难题,总结、反思,互惠教学。

三个阅读阶段的活动都应该做出贡献,并共同努力准备更高层次的读者共同的教育目标。根据布鲁姆的教育目标,,可分为六大类:知识、理解、应用、分析、综合和评价(布鲁姆1956)。2000年,研究人员(安德森et al ., 2001,21 - 22页)修订分类法和连接六个新类别与动词的认知过程:记住,理解,应用,分析,评估,并创建,如所示图1。具体来说,读者应该well-guided记住和理解词汇和概念相关材料在课前阅读阶段,然后被引导来解析和分析思想和它们的连接。最后,它预计,读者可能达到的上部“分析”区,甚至碰“评估”的目的。

图1
www.雷竞技rebatfrontiersin.org

图1。布鲁姆的分类认知过程。

2.3。计算机技术在阅读

智能辅导系统(ITS)被越来越多地用于文学教育在过去的二十年。传统上,阅读过程包括课前阅读,在阅读、和校服活动,阅读和智能辅导系统建立在这一原则通常是组织阅读单位,包含预评估,为理解热身活动指南,post-assessment理解练习,多项选择题(琼斯等人。,2004年)或与合作加强阅读时的交互对话框在自然语言(施et al ., 2018;阿夫扎尔et al ., 2019 a,b)。然而,在这些阅读课是固定的,这限制了他们的应用程序在阅读理解课程必须满足读者的不同需求在不同的能力水平。

词汇是卓有成效的阅读理解的先决条件,开发各种计算机工具来帮助读者记忆新单词。短消息服务(Alemi拉里,2012)和移动应用程序(Klimova Zamborova, 2020)被用来构建词汇。实证研究表明,阅读导师改善儿童的阅读理解(莫斯托再度出马执导et al ., 2003)和他们的词汇知识的单词(贝克et al ., 2021)。此外,概念,类似于词汇,是阅读理解的重要因素影响的结果,他们可以学到或保留连接的新概念学习概念形成概念图。汤姆,一个聪明的老师,是我开发的概念从文本和构建自动或半自动地参考概念图(Boguski et al ., 2019)。

基于connectivism,学习理论,强调知识通过网络和连接,同侪教学提出了作为一个有效的方法来提高阅读理解能力(范·科尔,2004;漂白et al ., 2012)。依赖同侪教学的提出有效性,其基于Web 2.0的系统集成的交互的读者也开发培养识字阅读(林业局和约翰逊,2010年)。

在大数据时代,人工智能,新的挑战出现。2019 (COVID-19)冠状病毒疾病大流行期间,许多在线课程开了,但教师和学生之间的直接通信在某种程度上被远处,作为教师不能查看学生的面部表情。是更加困难的教师指导学生进行阅读旅程。此外,教科书和课程材料提前准备统一,这是不适合阅读素养的个性化发展。因此,阅读一个智能机器人,减轻教师的负担,并自动生成指导读者尤其有价值。

3所示。阅读有关技术在深度学习的时代

3.1。Pre-trained语言模型和表现增进技术

大型pre-trained语言模型(LPLMs)目前自然语言处理的应用中的基本元素。LPLMs训练与无监督或semi-supervised方法大规模语言数据,也就是说,通过替换随机选择的单词在句子(面具)令牌和请求模型来预测蒙面的话(蒙面预测工作)或请求模型来预测下一个句子(下一个句子预测)。模型训练的迭代,直到预设训练时期或培训目标达成。这训练导致LPLMs发现和代表人类语言的结构,组装一个广义的语言和世界的一般知识(曼宁,2022)。例如,广泛使用双向编码器从变形金刚(BERT)表示,在2019年发行,被训练在BooksCorpus(800字)和英文维基百科(2500字)(Devlin et al ., 2019);GPT-3(生成训练前)是常见的爬行训练,WebText2, Books1, Book2,维基百科共有4990亿令牌(布朗et al ., 2020)。

然而,LPLMs不适合执行特定的自然语言处理任务。他们通常调整通过提供一组示例标记以期望的方式来获得更好的性能(曼宁,2022),如few-shot或zero-shot学习,包括下面列出的技术指导阅读。例如,斯坦福的问答数据集(队)是一个阅读理解数据集组成的100000 + crowdworkers带来的问题的维基百科文章,每个问题的答案在哪里一段文本从相应的阅读文章(Rajpurkar et al ., 2016)。微调这个数据集后,深度学习的性能模型精确匹配这个数据集是89.6%(衡量预测的答案是相同的是否正确答案),比人类高出2.8%性能(Zhang et al ., 2021)。在few-shot学习,研究人员只准备几个例子LPLMs然后给的提示模型进行预测。例如,使用提示的形式“可怜的英语输入:<句子> / n良好的英语输出:<句子>”,研究人员给GPT-3一个人为的修正,然后让它正确的五(布朗et al ., 2020)。

3.2。词义消歧(WSD),命名实体识别(尼珥)和知识图(公斤)

词汇是阅读理解的先决条件,理解的单词构成句子理解的基础。准确地确定一个词的特定的“感觉”在一个特定的背景下,词义消歧(WSD)。WSD本质上是确定这个词意义的任务对一组有限的和离散的感官从词典,词汇知识库或本体。广泛应用于机器翻译、信息检索、词典编纂(Agirre和埃德蒙兹,2007年,1 - 2页)。研究表明,词义消歧都可以促进词汇学习(Kulkarni et al ., 2008)。WSD还用于电子学习来提高信息检索在自动问答系统(挂et al ., 2005)或聪明的阅读语境词查找(Govindu et al ., 2021)。

专有名词是一种特殊类别的单词在计算语言学称为命名实体。命名实体识别的任务(尼珥)分配的词或短语等标签的人,位置,或组织。他们对机器翻译尤其重要,信息检索,信息提取和自动问答系统(Indurkhya Damerau, 2010)。然而,很少有研究在学习概念命名实体识别的有效性。

在阅读理解中,我们拥有的知识被组织成一个错综复杂的世界和内在一致的工作模型基于类别系统,我们对世界的理解是至关重要的(史密斯,2004,p . 112)。这种类型的知识组织是知识建模为一个图,概念是节点和概念之间的关系的边缘图。例如,巨石阵的关系,一个独特的史前纪念碑,和相关的概念,比如德鲁伊,英格兰,新石器时代,建模在知识图,如图所示图2提供一个很好的方式好奇的探索众多相关的概念。在知识图,我们表达我们的知识的巨石阵代表实体图中的节点和表示实体之间的关系通过边缘连接这些节点。

图2
www.雷竞技rebatfrontiersin.org

图2。知识图片段。

作为知识图构成一个理想的平台,组织知识,巨大的知识图是由众包的工人。Wikidata同伴维基百科,维基百科提供关联数据文件、知识图的是一个著名的例子,将维基百科的非结构化文本转化为结构化的知识,如所示图3。在Wikidata,图片和视频有关地球都是连接到这个核心概念,以及其与其他概念的关系,如与月系统“部分”的关系。

图3
www.雷竞技rebatfrontiersin.org

图3。地球在Wikidata (https://www.wikidata.org/wiki/Q2)。

知识图是重要的教育者和学习者理解知识存储库的概念和它们之间的关系。研究表明,概念及其关系的演讲帮助学习者词汇大楼(太阳et al ., 2020)或计算机科学专业制定学习计划(李et al ., 2019)。

3.3。文字简化

长和复杂的句子经常阅读理解带来困难,尤其是对读者阅读流畅性较低。文字的简化,在自然语言处理,旨在产生一个简化版的原句,以方便阅读和理解。研究表明,简化文本可以有利于外语学习者(矢野et al ., 1994),导致更好的理解文本,尤其是英语能力水平较低的人(ret Rogaten, 2021)和较低的儿童阅读流畅性和弱认知技能(Javourey-Drevet et al ., 2022)。

简化文本是由自动调整文本到短的内容简单的语言结构简化规则(渡边et al ., 2009)。与最近深度学习的进步,更好的文字简化模型发展到复杂源句子分解成一组最少的命题有明确的标示话语树保持连贯性结构基于修辞结构理论(RST) (Niklaus et al ., 2019)。另一个策略是基于可控文本生成简化句子,考虑到输出句子的属性,如它的长度,套用,词汇复杂性和句法复杂性(马丁et al ., 2020)。例如,这个句子“他居住在伦敦,投入自己主要实践教学。“应简化为一个短句子”他在伦敦教”(马丁et al ., 2020)。文字简化可以用来帮助读者在阅读困难,证明了一个句子简化工具对儿童阅读能力较低(Barlacchi Tonelli, 2013)。

3.4。问题一代(路上)

问题是标准的成分在测试阅读理解,问题一代变成了不可或缺的一部分引导阅读。问题一代(路上)自动生成问题用于给定的句子,段落,或文档,评估和self-assisted学习广泛应用(Kurdi et al ., 2020),避免了教师的手工工作的必要性。随着阅读的巨大潜力,问题一代在自然语言处理一个活跃的研究领域。2010年,第一个挑战问题代举行评估模型的性能从句子或段落生成问题。基于词法,句法,语义信息,和/或Aldabe et al。(2006),Das et al。(2016),黄,他(2016),吉尔伯特和珍珠鸡(2018)提出了一种基于规则和基于模板的问题生成系统生成的问题。

深度学习技术的出现了一代的性能问题。更大的精力是放在生成多样化的和困难的问题。高质量的问题是基于pre-trained语言生成模型(王et al ., 2018;Kumar et al ., 2019;潘et al ., 2020;程et al ., 2021教育目的(),特别是,Stasaski et al ., 2021;Rathod et al ., 2022;邹et al ., 2022)。此外,对于多项选择问题,错误选择代也得到了应有的重视刘et al ., 2005;王莲香et al ., 2018;高et al ., 2019;邱et al ., 2021;任和朱,2021;张和VanLehn, 2021年)。尽管这些问题的有前景的结果生成模型,基于这些模型的应用程序并没有充分解决因为大多数模型的性能测量在指定的数据集,并计算他们的实现需要相当大的努力和知识。

3.5。自动简短回答分级和自动作文评分

自动简短的回答简短分级(ASAG)或自动回答评估任务的自动评分一个特定的回答一个简短的问题。随着人类分级开放式的问题是在浪费他们的时间和劳动密集型、自动简短回答/论文研究评估自1966年以来一直活跃1966页,)。C-rater是由ETS技术得分短答案,测量内容的理解材料,与正确答案由内容专家(里柯克Chodorow, 2003)。同样,还开发了一个E-rater分数的文章,这是评估测试英语作为外语的考试(托福)和推荐操作使用(Ramineni et al ., 2012)。

大型pre-trained语言模型的出现后,伯特,GPT,及其变体进行评估来提高性能的自动答案评分(Gaddipati et al ., 2020;秃鹫et al ., 2021;Chang et al ., 2022)。此外,与人类的参与,研究显示,自动简短回答评估可以达到精度相当于助教(施耐德et al ., 2022)。自动作文评分(AES)也得到了密集的研究与性能受到句子伯特(Chang et al ., 2021)和多尺度的共同学习文章表示(王et al ., 2022 b)。

4所示。阅读和实现机器人模型映射

4.1。一个理论模型适用于阅读辅助与深度学习技术

阅读模型从不同学者从截然不同的角度揭示了科学的阅读,强调各种技能的集成。例如,斯卡伯勒的阅读绳明确阅读理解运用技能的组合,包括文字识别和语言理解,涉及的背景知识、词汇、语言结构、语言推理,知识素养。随着各种阅读活动,这些技能训练和抛光在阅读过程中,可以改善与深度学习技术。

阅读理解活动分为以下三个阶段:课前阅读,在阅读和校服。我们创建了一个共同的活动之间的映射在阅读过程及相关深度学习技术使用布鲁姆的分类学习目标,如所示图4

图4
www.雷竞技rebatfrontiersin.org

图4。阅读阶段之间的映射和深度学习技术。

深度学习技术和概念知识图表揭露隐藏的结构的非结构化文本和背景图式从pre -校服。最后,计算机论文评分评估文本摘要的读者。

课前阅读活动的目的是为读者的阅读材料,和他们经常叫热身活动。热身活动包括词汇学习的图片或概念图是用来帮助读者和引导他们建立一个模式。对于词汇的学习,教师经常准备新单词列表和相关背景知识,学习第一的读者读课文材料之前。阅读机器人,自动词汇过滤基于单词难度水平可用于获得新词汇。此外,频繁的多字表达式,特别是,位置等命名实体或公司名称,与命名实体识别中提取。这些提取单词或多字表达式连接与外部知识的预构建知识图表。从知识图,读者可以获得相关图片和音频文件,形成一个扩大的情况下,从而引发图式对即将到来的文本材料。另一个热身活动在课前阅读指导的问题。指导生成问题是使用一个两步过程。在第一步中,自动摘要的阅读材料是缩短文本进行一个合理的大小。 Then, question generation is performed on that summary to obtain questions.

在阅读是阅读理解的关键阶段,读者从阅读材料吸收知识,整合现有的知识在他们脑海中。如上所述在布鲁姆的分类,是初级阶段,提升了读者理解阅读材料的记忆。重大挑战在这个阶段包括困难分析长和复杂的句子的结构。应对这一挑战,我们建议使用文本简化协助读者解开复杂的句子。

校服是读者的阶段评审阅读材料和检查他们的理解,以提高学习更高层次的布鲁姆的分类,如应用、分析和评估。与多项选择题测验自动生成安排协助读者检查他们的理解。读者可能会被要求写一篇短文的阅读材料。自动管理这些任务,我们建议(1)安排填空题检查内存的读者的阅读材料;(2)提示读者选择题来验证他们的理解;和(3)使用自动作文评分引擎来帮助读者独立评估他们的写作。

4.2。阅读机器人的设计和实现

我们创建了一个阅读机器人系统来验证当前深度学习的适用性技术指导阅读。阅读机器人系统使用现有的开源深度学习词义消歧模型,生成问题,文本简化和自动化论文得分。对于知识图,系统使用BabelNet提供的外部服务(Navigli Ponzetto, 2012)。BabelNet 5.1是一个创新的多语言百科词典连接概念和命名实体在一个非常大的语义关系的网络,是由~ 2200万条目从WordNet的自动集成(米勒,1995),维基百科,ImageNet (菲菲et al ., 2010),VerbAtlas (迪法比奥et al ., 2019),和其他现有知识图表和词汇(Babelscape 2022)。整体阅读的读者和机器人之间的交互所示图5

图5
www.雷竞技rebatfrontiersin.org

图5。读者和阅读机器人之间的相互作用。

读者提供web页面从课前阅读阶段引导他们到校服阶段。读者与阅读机器人的交互学习记录和保存在数据库的分析。

系统包括四个层次,即前端网页,在读者访问系统的功能;应用程序逻辑层,它将来自读者的请求重定向到适当的资源和保存到数据库的交互;restful资源层,它暴露了深度学习的函数模型是基于rest的服务;和外部资源,其他网站提供的知识库通过应用程序编程接口(API)。

阅读机器人系统是一个web应用程序设计基于关注点分离的原则,将功能划分为独立的部分。前端web页面开发基于反应,一个开源JavaScript库来构建用户界面由Facebook。后端是基于Django,2一个Python web框架,提供了大量的即用功能,包括数据库访问,用户身份验证,和组管理,与读者的互动都存储在一个SQLite3数据库。提供的高级功能深度学习模型作为RESTful服务公开(菲尔丁,2000),FastAPI的支持。4这些模型提供独立作为单独的服务和功能可以很容易地增强与最近的模型。除了java text-simplification服务,其他服务是纯Python。外部资源,包括BabelNet和ConceptNet纳入该系统应用程序编程接口(API)。整个系统由microservices支持而不是铁板一块,如图所示图6

图6
www.雷竞技rebatfrontiersin.org

图6。阅读机器人的体系结构。

当使用阅读机器人系统,阅读材料中的词是第一次过滤通过一个单词列表根据读者的语言能力水平,如B1, B2,或C1欧洲共同的参考框架语言(以上)(欧洲委员会,2001年)。目前,单词列表是基于牛津3000单词列表(牛津大学出版社,2019年)。然后,促使读者与指导问题生成问题一代(路上)模型在球队训练数据集,与答案提取pke的机器学习算法,一个开源面向关键词提取工具包(等石香肠,2016)。此外,上下文中的新单词的具体含义后确定词义消歧的BERT-based WSD词义消歧模型(Yap et al ., 2020)和WordNet (米勒,1995)。命名实体识别与宽大的(Honnibal Montani, 2017),命名实体链接器是用来查找这些实体Wikidata数据库。提取后的新单词和实体,系统检索相关的统一资源定位器(URL)图像和音频新单词和实体通过BabelNet的API。在阅读时阶段,读者可以简化复杂的句子和视图与DISSIM简化的结果,一个Discourse-Aware句法文本为英语和德语简化框架(Niklaus et al ., 2019),它把复杂的句子分为简单和明确的标签话语的关系。最后,读者挑战有填空题,选择题和写作任务在校服阶段。干扰选项的选择题生成基于语义关系的WordNet或ConceptNet诉诸Sense2Vec模型(查斯克et al ., 2015),在向量空间相似的单词如果没有候选人干扰可以发现来自两个;作文写的读者将auto-graded BERT-based自动评分引擎,在自动作文评分(AES)训练数据集(王et al ., 2022 b)。AES是一组高中学生的论文以及成绩由人类专家年级(休利特基金会,2016年)。

图7,在课前阅读阶段,指导问题总结的基础上生成的阅读材料。单词和专有名词的词汇过滤后3000年牛津大学的阅读材料和识别实体列表。从BabelNet图像检索,读者可以点击“更多”访问BabelNet的入口网站上。在阅读时阶段,可以简化复杂的句子简化模型的文本。例如,“当她宣布决定这个项目,他们将继续给他们的意见好像仍在讨论”。被分解为核心的句子(“她宣布她的决定”、“他们将继续给他们的意见(“”)和条款这是这个项目”、“它仍然是讨论”,用话语标记(子/背景的关系子/条件好像)。在校服阶段,填空题和选择题问题是自动生成的。此外,读者会看到一个文本输入写摘要的阅读材料,自动作文评分的引擎将率。

图7
www.雷竞技rebatfrontiersin.org

图7。样本结果在课前阅读,阅读时,校服阶段。

5。案例研究

深度学习模型,尽管他们的报告表现所选择的数据集,还没有被广泛测试。了解他们的表现在真实的场景中,我们进行了实验与公开访问的文章学习英语在英国文化协会的网站。5我们选择8从A2阅读文章,10 12的文章B1阅读、12和10个文章B2在网站上阅读,不包括不完整的文章,文章表或文章口语化的语言。文章的完整列表中给出的评价表1

表1
www.雷竞技rebatfrontiersin.org

表1。文章的案例研究。

28日文章选择,我们评估该系统的三个特点:词义消歧、命名实体识别、和问题的一代。词汇学习是一个重要的先决条件阅读和词汇教学提高阅读理解(城堡et al ., 2018),词义消歧和命名实体识别评估探索他们的优点和缺点和检查他们的适用性在实际应用中,考虑到报告的词义消歧模型的性能在F1近80%分数(衡量一个模型的准确性的数据集)。问题一代是一个比较热的话题自然语言处理由于其价值在教育、聊天机器人和其他领域。考虑到良好的人际评价结果报告在特定的数据集和其潜在引导阅读,我们评估了系统中的性能问题的生成模型,探索模型的实用性在实际应用和详细说明其局限性。

评价,新单词从文本中提取了一个基于规则的算法对单词的熟练水平立即阅读水平以下。例如,文章从B2阅读部分提取的英国文化协会,要求熟练掌握B1是用于过滤的新单词。

阅读材料的总结,这项研究的结果发表在表2。问题生成模型在系统中生成三个或三个以上每篇文章主要问题。然而,主要的问题的数量和多项选择题的数量(MCQ)不匹配,说明系统中干扰物的生成需要改进,因为系统滴一个问题如果没有足够的干扰问题。

表2
www.雷竞技rebatfrontiersin.org

表2。阅读材料和模型结果的摘要。

我们手动检查的正确性的确认新单词和实体。所示表2正确的比率与感官在A2, B1和B2是高于80%,80.95%,86.83%,和93.27%,分别。实体的比率与正确的感官A2, B1, B2,然而,低于70%,63.46%,62.26%,和66.67%,分别。表3提出了好的和坏的情况下的样本。很明显,“崩溃”和“Airbnb”被正确识别和相应的含义。然而,“任务”一词,与意义相关联的错误相关传教士。同样,“很多”,“很多爱”错误地追踪到人很多在创世纪中由于大写“l”

表3
www.雷竞技rebatfrontiersin.org

表3。好的和坏的情况下新单词和实体识别。

我们也评估质量生成的主要问题和多项选择题的分等级(坏的,公平的,好的)流利的指标,描述的语义,相关性,与可回答性表4。根据评价结果图8得分,流畅、语义相关性,并与可回答性高于2.60,表明大部分问题生成语法正确,语义清晰,相关的通道。然而,分数与可回答性为A2为2.45,表明在这方面更应该努力在未来。

表4
www.雷竞技rebatfrontiersin.org

表4。人类与描述评价指标(邹et al ., 2022)。

图8
www.雷竞技rebatfrontiersin.org

图8。问题生成评价结果。

表5展示了一个示例的好的和坏的问题。在这篇文章中《星球大战》和英雄神话领先的问题”电影的结构是什么?“听起来像一个普通的问题,其答案是包含在文本”这两部电影问世以前所有的好莱坞电影,遵循结构的“英雄传说””在文章中。”专家预测机器人将会是什么?”听起来有点尴尬,“什么使一个好的什么?“可能混淆读者。此外,对于“奇怪的是关于伦敦吗?”和“基于约翰萨特在哪里?”,伦敦和约翰萨特人失踪在相同的文章标题从一个朋友的电子邮件。性能差异背后的原因可能是,模型训练的问题从维基百科的文章,所以他们在类似的文章往往表现得更好。

表5
www.雷竞技rebatfrontiersin.org

表5。好的和坏的样本问题。

6。挑战和局限性

一个突出的问题关于我们的建议的性能模型。据报道,使用的词义消歧模型的性能在我们的研究中取得了79.5%的F1分数条意义上的消歧数据集(Yap et al ., 2020)。其性能在open-domain材料,作为我们的评估表明,低于90%的准确。命名实体识别的性能甚至更糟的是,< 70%准确的评价。DISSIM,文本使用简化模型在我们的研究中,声称有一个精密的70% ~ 90%,达到平均精度~它们之间的修辞关系的分类(Niklaus et al ., 2019),这为实际部署不够好。自动作文评分引擎的性能也在二次加权kappa低于90% (QWK)指标(王et al ., 2022 b)。二次加权卡帕(科恩,1968)是一种常见的测量来评估一个自动作文评分引擎措施两个评分者的得分结果之间的协议。这种情况就像早期的机器翻译中的应用。它可以帮助教育工作者和读者,但需要人工干预的情况下更好的结果。

此外,生成模型的问题是训练有素的队伍,一群构成的数据集组成的100000 +的问题工人一组维基百科文章(Rajpurkar et al ., 2016)。因此,模型生成的问题可以回答最简单的问题通过查找相关部分的文本没有深入思考,这限制了读者的理解的测试低水平的布鲁姆的分类。此外,我们的评估显示,仍有一些错误的问题生成的流畅性,语义,流利,与可回答性,应妥善处理之前部署在真实的场景中。

的性能模型的第二个问题是他们的领域转移的能力。作为传统的机器学习模型是基于假设训练训练和测试数据同分布,当训练数据和测试数据的概率分布是不同的,模型的性能通常恶化(Quinonero-Candela et al ., 2009)。然而,它是昂贵的,甚至非常不可能从所有可能的领域收集数据来训练毫升模型(王et al ., 2022 a)。目前,问题一代模型和自动作文评分模型对特定数据集训练。他们的表现可能会显著恶化如果他们是用于处理材料,从数据集的训练有很大的不同。为了减轻这些问题,有必要调整模型。例如,考虑自动评分模型。文件中的每一行的训练是一个作文的格式及其得分。教育工作者可能在相同的格式准备数据与自己的作品和成绩评价得分评估准则,调整模型,并获得更好的性能。同样,问题生成模型和其他模型可以与特定领域的数据调整。此外,由于当前系统依赖于现有知识图,特定领域的知识图可以建造或用于提供读者洞察专有名词之间的关系在一个特定的领域。例如,在生物学、基因本体论(去)知识库(ashburn et al ., 2000;碳et al ., 2021),最大的信息来源在世界上基因的功能,可用于阅读材料在生物学领域。

深度学习的另一个具有挑战性的方面是它的explainability,这是一个至关重要的功能的实际部署人工智能模型(Barredo实习et al ., 2020)。深度学习模型包括数以百计的层和数以百万计的参数,这使得深层神经网络(款)被认为是复杂的黑盒模型(Castelvecchi 2016)。自然语言处理的研究人员已经注意到这个问题。他们设计了探测任务捕捉句子的语言特征和生成的嵌入深度学习模型(Conneau et al ., 2018)或理解的词汇信息从上下文被深度学习模型(Vulićet al ., 2020)。此外,一个统一的框架来解释预测称为夏普利添加剂解释(世鹏科技电子)是可视化开发的每个特性的重要性为特定的预测(她和李,2017年)。然而,explainability研究是在初始阶段,推理过程的深度学习模型仍然在一个黑盒,不能满足实际应用的要求。例如,对于自动作文评分引擎,一个简单的分数是不够的,读者。他们想知道他们的缺点在一个详细的报告。问题一代,教育工作者可能想知道为什么以及如何产生的问题是,什么知识测试。

7所示。结论

这项研究调查了深度学习技术的进步,尤其是自然语言处理技术,这主要是与人类的阅读。进一步探讨了他们的应用程序的指导下著名的阅读模式。研究使用公开访问模型和平台演示深度学习的潜在技术引导阅读,包括词义消歧、命名实体识别、知识图表、文字简化问题的一代,和自动作文评分。阅读机器人系统的设计和实现基于三个阅读阶段之间的映射和相应的深度学习技术,这项研究不仅突出了这些技术的有效性,同时指出其局限性的基础上,实践实现相关的深度学习模型和评估这些模型有28个文章。性能和explainability重要局限性阻碍深度学习的实际部署模型。在未来,更多的深度学习的进步,text-to-image或text-to-video代可用于创建一个生活场景为读者更好地理解阅读材料。此外,可辩解的人工智能还可以确定特定缺陷的改进的读者。通过这种方式,我们不仅会减少所需的巨大的劳动力准备一个成功的阅读旅程还提高人类阅读的有效性和提高知识转移。

数据可用性声明

最初的贡献提出了研究中都包含在这篇文章/补充材料,进一步的调查可以针对相应的作者。

作者的贡献

赫兹导致怀孕。BH起草了手稿。JD批判性修订后的手稿。所有作者的文章和批准提交的版本。

资金

这项研究受到了中国国家自然科学基金重点项目(U1836222和61733011)。

确认

我们想表达我们的感谢审稿人的宝贵意见和建议。

的利益冲突

作者声明,这项研究是在没有进行任何商业或财务关系可能被视为一个潜在的利益冲突。

出版商的注意

本文表达的所有索赔仅代表作者,不一定代表的附属组织,或出版商、编辑和审稿人。任何产品,可以评估在这篇文章中,或声称,可能是由其制造商,不保证或认可的出版商。

补充材料

本文的补充材料在网上可以找到:https://www.雷竞技rebatfrontiersin.org/articles/10.3389/fpsyg.2023.980523/full补充材料

脚注

引用

阿夫扎尔,S。,Dempsey, B., D'Helon, C., Mukhi, N., Pribic, M., Sickler, A., et al. (2019a). The personality of ai systems in education: Experiences with the Watson tutor, a one-on-one virtual tutoring system.的孩子。建造。95年,44-52。doi: 10.1080 / 00094056.2019.1565809

CrossRef全文|谷歌学术搜索

阿夫扎尔,S。,Dhamecha, T., Mukhi, N., Sindhgatta, R., Marvaniya, S., Ventura, M., et al. (2019b). “Development and deployment of a large-scale dialog-based intelligent tutoring system,” in学报2019年大会北美的计算语言学协会章:人类语言技术,卷2(行业论文),114 - 121。doi: 10.18653 / v1 / n19 - 2015

CrossRef全文|谷歌学术搜索

Agirre E。,Edmonds, P, . (eds.) (2007).词义消歧:算法和应用程序。柏林:施普林格。

Aldabe,我。,de Lacalle, M. L., Maritxalar, M., Martinez, E., and Uria, L. (2006). “ArikIturri: an automatic question generator based on corpora and NLP techniques,” in课堂讲稿在计算机科学(包括子系列讲义在人工智能和课堂讲稿在生物信息学),584 - 594。doi: 10.1007 / 11774303 _58

CrossRef全文|谷歌学术搜索

Alemi, M。,Lari, Z. (2012). SMS vocabulary learning: a tool to promote reading comprehension in L2.Int。j .语言学家。4,275 - 287。doi: 10.5296 / ijl.v4i4.2318

CrossRef全文|谷歌学术搜索

安德森,L。,Krathwohl, D., Airasian, P., Cruikshank, K., Mayer, R., Pintrich, P., et al. (2001).分类学习、教学和评估:修订布鲁姆的教育目标分类学。纽约:朗文。

ashburn, M。球,c。,Blake, J. A., Botstein, D., Butler, H., Cherry, J. M., et al. (2000). Gene ontology: tool for the unification of biology.Nat,麝猫。25日,25 - 29。doi: 10.1038/75556

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Babelscape (2022)。关于BabelNet。Babelscape。网上:https://babelnet.org/about(2022年10月30日,访问)。

贝克,d . L。,妈,H。,Polanco, P., Conry, J. M., Kamata, A., Al Otaiba, S., et al. (2021). Development and promise of a vocabulary intelligent tutoring system for Second-Grade Latinx English learners.j . >抛光工艺。建造。53岁,223 - 247。doi: 10.1080 / 15391523.2020.1762519

CrossRef全文|谷歌学术搜索

Barlacchi G。,Tonelli, S. (2013). “ERNESTA: A sentence simplification tool for children's stories in Italian,” in课堂讲稿在计算机科学(包括子系列讲义在人工智能和课堂讲稿在生物信息学),476 - 487。doi: 10.1007 / 978 - 3 - 642 - 37256 - 8 - _39

CrossRef全文|谷歌学术搜索

Barredo实习,。,Díaz-Rodríguez, N., Del Ser, J., Bennetot, A., Tabik, S., Barbado, A., et al. (2020). Explainable Artificial Intelligence (XAI): concepts, taxonomies, opportunities and challenges toward responsible AI.正融合。今年58岁,82 - 115。doi: 10.1016 / j.inffus.2019.12.012

CrossRef全文|谷歌学术搜索

漂白,S。,Duran, D., Flores, M., and Valdebenito, V. (2012). The effects of a peer tutoring programme to improve the reading comprehension competence involving primary students at school and their families at home.Proc, Soc。Behav。科学。46岁,1684 - 1688。doi: 10.1016 / j.sbspro.2012.05.361

CrossRef全文|谷歌学术搜索

布鲁姆,b (1956)。分类的教育目标。教育目标的分类。手册我:认知领域。费城:大卫·麦凯有限公司。

Boguski, R R。卷曲,D。,Gava, T. (2019). “TOM: an intelligent tutor for the construction of knowledge represented in concept maps,” inProceedings-雷竞技rebatFrontiers教育会议,呸。

谷歌学术搜索

石香肠,f (2016)。“Pke:一个开源面向关键词提取等工具包,”科尔学报》2016年,第26届国际会议在计算语言学:系统演示,69 - 73。

布朗,t . B。曼,B。,Ryder, N., Subbiah, M., Kaplan, J., Dhariwal, P., et al. (2020). “Language models are few-shot learners,” in先进的神经信息处理系统,eds h . Larochelle m . Ranzato r·哈德·m·f·Balcan林和h(红钩,纽约州:Curran Associates Inc)。

Butterfuss, R。金,J。,Kendeou, P. (2020). Overview of models and theories of reading.牛津Encycl》。建造。2020年,24。doi: 10.1093 / acrefore / 9780190264093.013.865

CrossRef全文|谷歌学术搜索

碳,年代。,Douglass, E., Good, B. M., Unni, D. R., Harris, N. L., Mungall, C. J., et al. (2021). The gene ontology resource: enriching a gold mine.核酸Res。49岁的D325-D334。doi: 10.1093 / nar / gkaa1113

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Castelvecchi, d . (2016)。我们可以打开AI的黑盒吗?自然538年,20。doi: 10.1038 / 538020 a

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

城堡,A。,Rastle, K., and Nation, K. (2018). Ending the reading wars: reading acquisition from novice to expert.Psychol。科学。公共利益。19日,5-51。doi: 10.1177 / 1529100618772271

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Chang L.-H。塔法里教我。,Pyysalo, S., and Ginter, F. (2021). Deep learning for sentence clustering in essay grading support.(预印本)arXiv arXiv: 2104。11556年

谷歌学术搜索

常,l . H。,Kanerva, J., and Ginter, F. (2022). “Towards automatic short answer assessment for finnish as a paraphrase retrieval task,” in17学报》研讨会上创新构建教育应用程序使用NLP (BEA 2022),262 - 271。doi: 10.18653 / v1/2022.bea - 1.30

CrossRef全文|谷歌学术搜索

程,Y。李,S。,Liu, B., Zhao, R., Li, S., Lin, C., et al. (2021). “Guiding the growth: Difficulty-controllable question generation through step-by-step rewriting,” in学报》第59届年会计算语言学和第11届国际协会的联合会议上自然语言处理(卷1:长论文),5968 - 5978。doi: 10.18653 / v1/2021.acl-long.465

CrossRef全文|谷歌学术搜索

科恩,j . (1968)。加权kappa:定类尺度缩放分歧或部分信贷协议规定。Psychol。公牛。70年,213 - 220。doi: 10.1037 / h0026256

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

秃鹫,。,Litster, M., and Pardos, Z. (2021). “Automatic short answer grading with SBERT on out-of-sample questions,” in学报》第14届国际会议上教育数据挖掘,345 - 352。

谷歌学术搜索

Conneau,。,Kruszewski, G., Lample, G., Barrault, L., and Baroni, M. (2018). “What you can cram into a single vector: probing sentence embeddings for linguistic properties,” in《第56计算语言学协会年会(卷1:长论文),2126 - 2136。doi: 10.18653 / v1 / p18 - 1198

CrossRef全文|谷歌学术搜索

欧洲委员会(2001)。欧洲共同的参考框架语言:学习、教学、评估。剑桥:剑桥大学出版社。

谷歌学术搜索

Das, R。,Ray, A., Mondal, S., and Das, D. (2016). “A rule based question generation framework to deal with simple and complex sentences,” in2016年国际会议上的进步计算、通信和信息(ICACCI),542 - 548。doi: 10.1109 / ICACCI.2016.7732102

CrossRef全文|谷歌学术搜索

Devlin, J。,Chang, M.-W., Lee, K., and Toutanova, K. (2019). “BERT: pre-training of deep bidirectional transformers for language understanding,” in学报2019年大会北美的计算语言学协会章:人类语言技术,第一卷(长时间运行和短论文),4171 - 4186。doi: 10.18653 / v1 / n19 - 1423

CrossRef全文|谷歌学术搜索

迪法比奥。、Conia年代。,Navigli, R。(2019)。“VerbAtlas:小说大规模语言语义资源及其应用语义角色标注,”学报2019年会议上实证方法在自然语言处理和第九届国际联合会议上自然语言处理(EMNLP-IJCNLP),627 - 637。doi: 10.18653 / v1 / d19 - 1058

CrossRef全文|谷歌学术搜索

Diaz-Rico, l . t . (2013)。策略教学英语学习者(第三版。)。伦敦:皮尔森。

谷歌学术搜索

Eryilmaz, M。,Adabashi, A. (2020). Development of an intelligent tutoring system using bayesian networks and fuzzy logic for a higher student academic performance.达成。科学。10日,6638年。doi: 10.3390 / APP10196638

CrossRef全文|谷歌学术搜索

菲菲,L。邓,J。,Li, K. (2010). ImageNet: constructing a large-scale image database.j .粘度9日,1037 - 1037。doi: 10.1167 / 9.8.1037

CrossRef全文|谷歌学术搜索

菲尔丁,r . t . (2000)。架构风格与基于网络的软件架构设计。欧文:加州大学。

谷歌学术搜索

Gaddipati美国K。Nair, D。,Plöger, P. G. (2020). Comparative evaluation of pretrained transfer learning models on automatic short answer grading.arXiv(预印本)arXiv: 2009.01303

谷歌学术搜索

高,Y。,Bing, L., Li, P., King, I., and Lyu, M. R. (2019). “Generating distractors for reading comprehension questions from real examinations,” in人工智能学报33th AAAI会议,6423 - 6430。doi: 10.1609 / aaai.v33i01.33016423

CrossRef全文|谷歌学术搜索

吉尔伯特,N。,Keet, C. M. (2018). Automating question generation and marking of language learning exercises for isiZulu.前面。Artif。智能。达成。304年,31-40。doi: 10.3233 / 978-1-61499-904-1-31

CrossRef全文|谷歌学术搜索

高夫,p . B。,Tunmer, W. E. (1986). Decoding, reading, and reading disability.补救规范。建造。7,6 - 10。doi: 10.1177 / 074193258600700104

CrossRef全文|谷歌学术搜索

Govindu, S。,Guttula, R. V., Kohli, S., Patil, P., Kulkarni, A., and Yoon, I. (2021). “Towards intelligent reading through multimodal and contextualized word lookup,” in20 IEEE国际会议2021年机器学习和应用程序(ICMLA),1249 - 1252。doi: 10.1109 / ICMLA52953.2021.00203

CrossRef全文|谷歌学术搜索

豪普特曼,。莫斯托再度出马执导,J。,Roth, S. F., Kane, M., and Swift, A. (1994). “A prototype reading coach that listens: summary of project LISTEN,” in《人类语言技术研讨会,237年。

谷歌学术搜索

休利特基金会(2016)。休利特基金会赞助奖提高学生作文自动评分的。休利特发现。网上:https://hewlett.org/newsroom/hewlett-foundation-sponsors-prize-to-improve-automated-scoring-of-student-essays/(2022年11月26日,访问)。

谷歌学术搜索

Honnibal, M。,Montani, I. (2017).宽大的2:自然语言理解与布鲁姆嵌入,卷积神经网络和增量解析。网上:https://github.com/explosion/spaCy/issues/5863

谷歌学术搜索

黄,Y。,He, L. (2016). Automatic generation of short answer questions for reading comprehension assessment.Nat。英格朗。22日,457 - 489。doi: 10.1017 / S1351324915000455

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

挂,j . C。,Ching-Sheng, W., Che-Yu, Y., Mao-Shuen, C., and Yee, G. (2005). “Applying word sense disambiguation to question answering system for e-learning,” in19国际会议上先进信息网络和应用程序(AINA 05)体积1 (AINA论文),157 - 162。doi: 10.1109 / AINA.2005.121

CrossRef全文|谷歌学术搜索

Indurkhya, N。,Damerau, F. J. (2010).自然语言处理手册(第二版)。。波卡拉顿:查普曼和大厅/ CRC。

谷歌学术搜索

Javourey-Drevet, L。、Dufau年代。,François, T., Gala, N., Ginestié, J., and Ziegler, J. C. (2022). Simplification of literary and scientific texts to improve reading fluency and comprehension in beginning readers of French.达成。所用的。43岁,485 - 512。doi: 10.1017 / S014271642100062X

CrossRef全文|谷歌学术搜索

琼斯,j . D。,Staats, W. D., Bowling, N., Bickel, R. D., Cunningham, M. L., and Cadle, C. (2004). An evaluation of the merit reading software program in the Calhoun county (WV) middle/high school.j . >抛光工艺。建造。37岁,177 - 195。doi: 10.1080 / 15391523.2004.10782432

CrossRef全文|谷歌学术搜索

Kintsch, w (1988)。知识在话语理解中的作用:construction-integration模型。Psychol。牧师。95年,163 - 182。doi: 10.1037 / / 0033 - 295 x.95.2.163

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Klimova B。,Zamborova, K. (2020). Use of mobile applications in developing reading comprehension in second language acquisition—a review study.建造。科学。1 - 11。doi: 10.3390 / educsci10120391

CrossRef全文|谷歌学术搜索

Kulkarni。,Heilman, M., Eskenazi, M., and Callan, J. (2008). “Word sense disambiguation for vocabulary learning,” in课堂讲稿在计算机科学(包括子系列讲义在人工智能和课堂讲稿在生物信息学),500 - 509。doi: 10.1007 / 978 - 3 - 540 - 69132 - 7 - _53

CrossRef全文|谷歌学术搜索

Kumar V。,Muneeswaran, S., Ramakrishnan, G., and Li, Y.-F. (2019). “ParaQG: a system for generating questions and answers from paragraphs,” in学报2019年会议上实证方法在自然语言处理和第九届国际联合会议上自然语言处理(EMNLP-IJCNLP):系统演示,175 - 180。doi: 10.18653 / v1 / d19 - 3030

CrossRef全文|谷歌学术搜索

Kurdi G。狮子座,J。,Parsia, B., Sattler, U., and Al-Emari, S. (2020). A systematic review of automatic question generation for educational purposes.Int。j . Artif。智能。建造。121 - 204年。doi: 10.1007 / s40593 - 019 - 00186 - y

CrossRef全文|谷歌学术搜索

里柯克,C。,Chodorow, M. (2003). C-rater: automated scoring of short-answer questions.第一版。嗡嗡声。37岁,389 - 405。doi: 10.1023 /: 1025779619903

CrossRef全文|谷歌学术搜索

李,Y。,Zhao, J., Yang, L., and Zhang, Y. (2019). “Construction, visualization and application of knowledge graph of computer science major,” in学报2019年国际会议上大数据和Education-ICBDE 19,43-47。doi: 10.1145/3322134.3322153

CrossRef全文|谷歌学术搜索

刘,C.-L。,Wang, C.-H., Gao, Z.-M., and Huang, S.-M. (2005). “Applications of lexical information for algorithmically composing multiple-choice cloze items,” in学报第二车间使用NLP建筑教育应用程序,1 - 8。doi: 10.3115/1609829.1609830

CrossRef全文|谷歌学术搜索

Lundberg, s M。,Lee, S. I. (2017). “A unified approach to interpreting model predictions,” in先进的神经信息处理系统,4766 - 4775。

谷歌学术搜索

Madnani, N。,Klebanov, B. B., Loukina, A., Gyawali, B., Sabatini, J., Lange, P., et al. (2019). “My turn to read: An interleaved e-book reading tool for developing and struggling readers,” in学报》第57届计算语言学协会的年会:系统演示,141 - 146。doi: 10.18653 / v1 / p19 - 3024

CrossRef全文|谷歌学术搜索

曼宁,c, d . (2022)。人类语言理解和推理。代达罗斯151年,127 - 138。doi: 10.1162 / daed_a_01905

CrossRef全文|谷歌学术搜索

马丁,L。,de la Clergerie, É. V., Sagot, B., and Bordes, A. (2020). “Controllable sentence simplification,” in学报》第十二语言资源和评估会议,4689 - 4698。

谷歌学术搜索

林业局,。,Johnson, T. E. (2010). Fostering the development of critical thinking skills, and reading comprehension of undergraduates using a Web 2.0 tool coupled with a learning system.交互。学习。环绕。18日,263 - 276。doi: 10.1080 / 10494820.2010.500537

CrossRef全文|谷歌学术搜索

米勒,g . a (1995)。WordNet:英语词汇数据库。Commun。ACM38岁的39-41。doi: 10.1145/219717.219748

CrossRef全文|谷歌学术搜索

莫斯托再度出马执导,J。Aist, G。,Burkhead, P., Corbett, A., Cuneo, A., Eitelman, S., et al. (2003). Evaluation of an automated reading tutor that listens: comparison to human tutoring and classroom instruction.j .建造。第一版。Res。29日,61 - 117。ax-qw99-eq5g-rdcf doi: 10.2190/06

CrossRef全文|谷歌学术搜索

Navigli, R。,Ponzetto, S. P. (2012). BabelNet: the automatic construction, evaluation and application of a wide-coverage multilingual semantic network.Artif。智能。193年,217 - 250。doi: 10.1016 / j.artint.2012.07.001

CrossRef全文|谷歌学术搜索

Niklaus C。Cetto, M。,Freitas, A., and Handschuh, S. (2019). “DISSIM: a discourse-aware syntactic text simplification framework for English and German,” in学报》第12届国际会议上自然语言生成,504 - 507。doi: 10.18653 / v1 / w19 - 8662

CrossRef全文|谷歌学术搜索

牛津大学出版社(2019)。3000年牛津。牛津:牛津大学出版社。网上:https://www.oxfordlearnersdictionaries.com/external/pdf/wordlists/oxford - 3000 5000/the_oxford_3000.pdf(2022年11月22日通过)。

谷歌学术搜索

页面,e . b . (1966)。分级由计算机论文:进度报告。Invit。相依之测试。Probl。47岁,87 - 100。

谷歌学术搜索

Pahamzah, J。,Syafrizal, S., and Nurbaeti, N. (2022). The effects of EFL course enriched with Kahoot on students' vocabulary mastery and reading comprehension skills.j·朗,语言学家。钉。18日,643 - 652。doi: 10.52462 / jlls.209

CrossRef全文|谷歌学术搜索

锅,L。,Xie, Y., Feng, Y., Chua, T.-S., and Kan, M.-Y. (2020). “Semantic graphs for generating deep questions,” in学报》第五十八届计算语言学协会的年度会议,1463 - 1475。doi: 10.18653 / v1/2020.acl-main.135

CrossRef全文|谷歌学术搜索

Proudfoot, d . e . (2016)。阅读理解的影响学生成绩在数学软件程序。Int。j . Cogn。研究科学。Eng。建造。4,39-48。doi: 10.5937 / IJCRSEE1601039P

CrossRef全文|谷歌学术搜索

秋,X。,Xue, H., Liang, L., Xie, Z., Liao, S., and Shi, G. (2021). “Automatic generation of multiple-choice cloze-test questions for lao language learning,” in2021年国际会议上亚洲语言处理IALP 2021年,125 - 130。doi: 10.1109 / IALP54817.2021.9675153

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Quinonero-Candela, J。Sugiyama, M。,Schwaighofer, A., and Lawrence, N. D, . (eds). (2009).数据集机器学习的转变。剑桥:麻省理工学院出版社。

谷歌学术搜索

Rajpurkar, P。张,J。,Lopyrev, K., and Liang, P. (2016). “SQuAD: 100,000+ questions for machine comprehension of text,” in学报2016年大会在自然语言处理的经验方法。p . 2383 - 2392。doi: 10.18653 / v1 / d16 - 1264

CrossRef全文|谷歌学术搜索

拉玛钱德朗年代。,Stottler, R. (2000). “An intelligent tutoring system for adult literacy enhancement,” in第五届国际会议上智能辅导系统学报》上,461 - 477。

谷歌学术搜索

Ramineni C。,Trapani, C. S., Williamson, D. M., Davey, T., and Bridgeman, B. (2012). Evaluation of the E-Rater®托福考试得分引擎®独立和集成的提示。ETS众议员Ser》。2012年,我−51。doi: 10.1002 / j.2333-8504.2012.tb02288.x

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Rathod, M。你,T。,Stasaski, K。(2022). “Educational multi-question generation for reading comprehension,” in学报17创新研讨会上使用NLP构建教育应用程序(BEA2022),216 - 223。doi: 10.18653 / v1/2022.bea - 1.26

CrossRef全文|谷歌学术搜索

任,S。,Zhu, K. Q. (2021). “Knowledge-driven distractor generation for cloze-style multiple choice questions,” in学报35 AAAI会议上人工智能,AAAI2021年,4339 - 4347。doi: 10.1609 / aaai.v35i5.16559

CrossRef全文|谷歌学术搜索

遗憾,我。,Rogaten, J. (2021). To simplify or not? Facilitating English L2 users' comprehension and processing of open educational resources in English using text simplification.j .第一版。协助。学习。37岁,705 - 717。doi: 10.1111 / jcal.12517

CrossRef全文|谷歌学术搜索

斯卡伯勒,h (2001)。“连接早期语言和识字以后阅读(dis)能力:证据,理论和实践,”为研究在早期识字手册,eds。b·纽曼和d·k·迪金森(纽约:吉尔福德出版社)。

谷歌学术搜索

施耐德,J。Richner, R。,Riser, M. (2022).对值得信赖的各年级短,多语种,多类型的答案。纽约:施普林格。doi: 10.1007 / s40593 - 022 - 00289 - z

CrossRef全文|谷歌学术搜索

赛登伯格,m (2017)。语言的速度一眼:我们如何阅读,为什么那么多不能,能做些什么。纽约:基本书。

谷歌学术搜索

施,G。,Lippert, A. M., Shubeck, K., Fang, Y., Chen, S., Pavlik, P., et al. (2018). Exploring an intelligent tutoring system as a conversation-based assessment tool for reading comprehension.Behaviormetrika45岁,615 - 633。doi: 10.1007 / s41237 - 018 - 0065 - 9

CrossRef全文|谷歌学术搜索

西门子(Siemens)、g (2005)。Connectivism:数字时代的学习理论。Int。j . Instr。抛光工艺。距离学习。2。网上:http://www.itdl.org/Journal/Jan_05/index.htm

谷歌学术搜索

f·史密斯(2004)。理解阅读:阅读和学习阅读的心理语言学分析(第六版)。新泽西:劳伦斯Erlbaum Associates Inc .)

谷歌学术搜索

Stasaski, K。Rathod, M。你,T。,Xiao, Y., and Hearst, M. A. (2021). “Automatically generating cause-and-effect questions from passages,” in学报》第16届研讨会NLP为构建教育应用的创新使用,158 - 170。

谷歌学术搜索

太阳,F。,Yu, M., Zhang, X., and Chang, T. W. (2020). “A vocabulary recommendation system based on knowledge graph for chinese language learning,” inProceedings-IEEE 20国际会议上学习先进的技术,ICALT2020年,210 - 212。

谷歌学术搜索

王莲香,Y。,Tokunaga, T., Nishikawa, H., and Obari, H. (2018). Automatic distractor generation for multiple-choice English vocabulary questions.Pract >,抛光工艺。Enhanc。学习。13日,论文。doi: 10.1186 / s41039 - 018 - 0082 - z

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

查斯克,一个。,Michalak, P., and Liu, J. (2015). sense2vec—a fast and accurate method for word sense disambiguation in neural word embeddings.arXiv(预印本)arXiv: 1511.06388

谷歌学术搜索

范·科尔(2004)。培养在五年级阅读理解显式教学在阅读策略和同侪教导。Br。j .建造。Psychol。74年,37 - 70。doi: 10.1348 / 000709904322848815

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Voogt, J。,McKenney, S. (2007). Using ICT to foster (pre) reading and writing skills in young children.第一版。原理图。24岁,83 - 94。doi: 10.1300 / J025v24n03_06

CrossRef全文|谷歌学术搜索

Vulić,我。,Ponti, E. M., Litschko, R., Glavaš, G., and Korhonen, A. (2020). “Probing pretrained language models for lexical semantics,” in学报2020年会议上实证方法在自然语言处理(EMNLP),7222 - 7240。doi: 10.18653 / v1/2020.emnlp-main.586

CrossRef全文|谷歌学术搜索

王,J。,Lan, C., Liu, C., Ouyang, Y., Qin, T., Lu, W., et al. (2022a). Generalizing to unseen domains: a survey on domain generalization.IEEE反式。"。数据中。14日,1 - 1。doi: 10.1109 / TKDE.2022.3178128

CrossRef全文|谷歌学术搜索

王,Y。,Wang, C., Li, R., and Lin, H. (2022b). “On the use of bert for automated essay scoring: joint learning of multi-scale essay representation,” in学报2022年大会北美的计算语言学协会章:人类语言技术,3416 - 3425。doi: 10.18653 / v1/2022.naacl-main.249

CrossRef全文|谷歌学术搜索

王,Z。,Lan, A. S., Nie, W., Waters, A. E., Grimaldi, P. J., and Baraniuk, R. G. (2018). “QG-net,” in《第五届ACM大规模学习会议,1 - 10。doi: 10.1145/3231644.3231654

CrossRef全文|谷歌学术搜索

渡边,w . M。,小a . C。,De Uzêda, V. R., De Mattos Fortes, R. P., Pardo, T. A. S., and Aluísio, S. M. (2009). “Facilita: reading assistance for low-literacy readers,” in美国27日ACM国际会议交流的设计,29-36。doi: 10.1145/1621995.1622002

CrossRef全文|谷歌学术搜索

徐,Z。,Wijekumar, K., Ramirez, G., Hu, X., and Irey, R. (2019). The effectiveness of intelligent tutoring systems on K-12 students' reading comprehension: a meta-analysis.Br。j .建造。抛光工艺。50岁,3119 - 3137。doi: 10.1111 / bjet.12758

CrossRef全文|谷歌学术搜索

矢野,Y。,Long, M. H., and Ross, S. (1994). The effects of simplified and elaborated texts on foreign language reading comprehension.朗。学习。44岁,189 - 219。doi: 10.1111 / j.1467-1770.1994.tb01100.x

CrossRef全文|谷歌学术搜索

笨蛋,b P。Koh,。,Chng, E. S. (2020). “Adapting BERT for word sense disambiguation with gloss selection objective and example sentences,” in计算语言学协会的调查结果发现ACL: EMNLP2020年,41-46。doi: 10.18653 / v1/2020.findings-emnlp.4

CrossRef全文|谷歌学术搜索

张,L。,VanLehn, K. (2021). Evaluation of auto-generated distractors in multiple choice questions from a semantic network.交互。学习。环绕。29日,1019 - 1036。doi: 10.1080 / 10494820.2019.1619586

CrossRef全文|谷歌学术搜索

张,Z。,Yang, J., and Zhao, H. (2021). “Retrospective reader for machine reading comprehension,” in学报35 AAAI会议上人工智能,AAAI 2021,14506 - 14514。doi: 10.1609 / aaai.v35i16.17705

CrossRef全文|谷歌学术搜索

邹,B。,Li, P., Pan, L., and Aw, A. T. (2022). “Automatic true/false question generation for educational purpose,” in17学报》研讨会上创新构建教育应用程序使用NLP (BEA 2022),61 - 70。doi: 10.18653 / v1/2022.bea - 1.10

CrossRef全文|谷歌学术搜索

关键词:深入学习、阅读理解、技术、自然语言处理、阅读阶段

引用:黄B,窦J和赵H(2023)阅读机器人:深度学习指导阅读的含义。前面。Psychol。14:980523。doi: 10.3389 / fpsyg.2023.980523

收到:2022年6月28日;接受:09年1月2023;
发表:2023年2月06。

编辑:

本邹西安Jiaotong-Liverpool大学,中国

审核:

迈克尔•福罗美国教育考试服务中心
应秦北京外国语大学,中国

版权©2023黄,窦和赵。这是一个开放分布式根据文章知识共享归属许可(CC)。使用、分发或复制在其他论坛是允许的,提供了原始作者(年代)和著作权人(s)认为,最初发表在这个期刊引用,按照公认的学术实践。没有使用、分发或复制是不符合这些条件的允许。

*通信:海赵,是的zhaohai@cs.sjtu.edu.cn

下载