关于这个研究课题
化学和生物化学研究的体积,可以通过科学出版物和专利,正在迅速增加。与这样的爆炸性增长,是极具挑战性的科学家保持更新所有的新发现和进步即使在相对集中的学科领域。因此,有兴趣的自动文本挖掘工具帮助科学家在应对研究文本的爆炸性增长,允许高效和有效的从这些数据中提取知识。在化学和生物化学、关键信息合成、相关属性和作用方式的化学物质对于制药和生命科学应用来说是非常重要的,但通常只在自然语言文本描述。
生化文本包含丰富的信息,在这个研究课题,我们的目标是探索的应用文本挖掘方法,便于分析和转换非结构化的自然语言描述化学物质及其相互关系到可操作的,结构化的知识。复杂的生化文本创建几个挑战来实现这些目标。首先,生化文本的词汇通常由广泛的领域特定的术语、渲染一般使用资源开发语言处理无效的。第二,科学文献通常是写在一个正式的方式导致复杂的句子结构。最后,生化文本通常几个化学结构信息与语言描述,导致文本包含图片,数据,表格传达重要的信息。为此,本文收集呼吁新方法来应对这些挑战,旨在改善文本挖掘在生化数据的有效性。
这个研究课题需要研究论文解决自然语言处理、文本挖掘的化学或生化文本,包括科学文献或专利。提名的研究主题包括但不限于信息提取任务,如化学或药物命名实体识别和鉴定的化学实体之间的关系,文档摘要或分类,建设知识基地或知识图的文本。
目标识别方法,关键信息的相关文献,如化学实体及其属性,化学反应或合成的细节,或化学物质之间的相互作用,生物分子或基因变异是受欢迎的。我们也欢迎化工算法、工具和方法针对药物之间的相互作用或药物再利用证据的识别在生物医学文本。
研究解决了特定的生化文本的语言特征,包括资源开发,如标注语料或特定领域的术语,或方法化学组成组件的文本挖掘系统,包括专业领域特定的标记或化学结构分析,也在范围内。
生化文本包含丰富的信息,在这个研究课题,我们的目标是探索的应用文本挖掘方法,便于分析和转换非结构化的自然语言描述化学物质及其相互关系到可操作的,结构化的知识。复杂的生化文本创建几个挑战来实现这些目标。首先,生化文本的词汇通常由广泛的领域特定的术语、渲染一般使用资源开发语言处理无效的。第二,科学文献通常是写在一个正式的方式导致复杂的句子结构。最后,生化文本通常几个化学结构信息与语言描述,导致文本包含图片,数据,表格传达重要的信息。为此,本文收集呼吁新方法来应对这些挑战,旨在改善文本挖掘在生化数据的有效性。
这个研究课题需要研究论文解决自然语言处理、文本挖掘的化学或生化文本,包括科学文献或专利。提名的研究主题包括但不限于信息提取任务,如化学或药物命名实体识别和鉴定的化学实体之间的关系,文档摘要或分类,建设知识基地或知识图的文本。
目标识别方法,关键信息的相关文献,如化学实体及其属性,化学反应或合成的细节,或化学物质之间的相互作用,生物分子或基因变异是受欢迎的。我们也欢迎化工算法、工具和方法针对药物之间的相互作用或药物再利用证据的识别在生物医学文本。
研究解决了特定的生化文本的语言特征,包括资源开发,如标注语料或特定领域的术语,或方法化学组成组件的文本挖掘系统,包括专业领域特定的标记或化学结构分析,也在范围内。
关键字:信息提取、文本挖掘、化工、生化、生化、专利
重要提示:所有贡献这个研究课题必须的范围内的部分和期刊提交,作为其使命声明中定义。雷竞技rebat前沿有权指导检查手稿更适合部分或同行评审的期刊在任何阶段。