关于这个研究课题
化学和生化研究发表在科学出版物和专利正在迅速增加。这种爆炸性增长使得科学家很难跟上所有的新发现和进步,即使在相对集中的学科领域。因此,为了应对这种快速增长的研究文本,开发了自动文本挖掘工具有效地帮助科学家们从这些数据中提取知识。在化学和生物化学、关键信息合成、属性和作用方式的化学制药和生命科学应用的关键,但往往只在自然语言文本描述。
生化文本包含丰富信息。在本研究课题中,我们希望探索文本挖掘方法分析,将非结构化的自然语言描述化学物质及其相互关系转变为可操作的结构知识。生化文本的复杂性对实现这些目标提出了一些挑战。首先,生化文本通常包含许多特定于域的术语,使模型为通用开发语言处理效果低。第二,科学文献往往包含复杂的句子结构。最后,生化文本通常几个化学结构信息和语言描述,导致文本包含图片,图表,表格传达关键信息。为此,本文收集呼吁新方法来应对这些挑战,旨在提高生化数据的文本挖掘的有效性。
这个研究课题需要研究论文解决自然语言处理、文本挖掘的化学或生化文本,包括科学文献或专利,以及从自然文本信息检索、半结构化文本(例如表),或程序/教学文本,可以适应生化文本(例如,食谱)。探索性研究尚未执行的也欢迎。
提名的研究主题包括但不限于:
•信息提取任务,如化学或药物命名实体识别和鉴定的化学实体之间的关系
•(生物)化学文档摘要或分类,和
•知识库建设或知识图从化学(生物)文本。
目标识别方法,关键信息的相关文献,如化学感兴趣的实体及其属性(如化学、聚合物、药物名称、分子),化学反应或合成的细节,或化学物质之间的相互作用,生物分子或基因变异是受欢迎的。我们也欢迎化工算法、工具和方法针对药物之间的相互作用或药物再利用证据的识别在生物医学文本。
研究地址生化文本的语言特征,包括资源开发,如标注语料或特定领域的术语,或方法化学组成组件的文本挖掘系统,包括专业领域特定的标记或化学结构分析,也在范围内。
生化文本包含丰富信息。在本研究课题中,我们希望探索文本挖掘方法分析,将非结构化的自然语言描述化学物质及其相互关系转变为可操作的结构知识。生化文本的复杂性对实现这些目标提出了一些挑战。首先,生化文本通常包含许多特定于域的术语,使模型为通用开发语言处理效果低。第二,科学文献往往包含复杂的句子结构。最后,生化文本通常几个化学结构信息和语言描述,导致文本包含图片,图表,表格传达关键信息。为此,本文收集呼吁新方法来应对这些挑战,旨在提高生化数据的文本挖掘的有效性。
这个研究课题需要研究论文解决自然语言处理、文本挖掘的化学或生化文本,包括科学文献或专利,以及从自然文本信息检索、半结构化文本(例如表),或程序/教学文本,可以适应生化文本(例如,食谱)。探索性研究尚未执行的也欢迎。
提名的研究主题包括但不限于:
•信息提取任务,如化学或药物命名实体识别和鉴定的化学实体之间的关系
•(生物)化学文档摘要或分类,和
•知识库建设或知识图从化学(生物)文本。
目标识别方法,关键信息的相关文献,如化学感兴趣的实体及其属性(如化学、聚合物、药物名称、分子),化学反应或合成的细节,或化学物质之间的相互作用,生物分子或基因变异是受欢迎的。我们也欢迎化工算法、工具和方法针对药物之间的相互作用或药物再利用证据的识别在生物医学文本。
研究地址生化文本的语言特征,包括资源开发,如标注语料或特定领域的术语,或方法化学组成组件的文本挖掘系统,包括专业领域特定的标记或化学结构分析,也在范围内。
关键字:化学文本,生化文本、文本挖掘、非结构化的自然语言描述,信息提取
重要提示:所有贡献这个研究课题必须的范围内的部分和期刊提交,作为其使命声明中定义。雷竞技rebat前沿有权指导检查手稿更适合部分或同行评审的期刊在任何阶段。