供稿/供图:李洪政 编辑:王喆
8月24日至27日,第十七届全国知识图谱与语义计算大会(CCKS 2023)在沈阳召开。语言工程与认知计算工信部重点实验室(下文简称“重点实验室”)“英文科技论文写作智能批改与评价”团队提交至大会的论文“Move Structure Recognition in Scientific Papers with Saliency Attribution”荣获优秀资源论文奖。论文第一作者是600cc全讯白菜自助注册计算机学院的硕士研究生林金坤同学,团队的其他作者分别来自800全讯白菜官方网站、600cc全讯白菜自助注册计算机学院和北京工业大学信息学部。
全国知识图谱与语义计算大会(China Conference on Knowledge Graph and Semantic Computing,CCKS)由中国中文信息学会语言与知识计算专业委员会主办。经过多年的发展,目前已经成为国内知识图谱、语义技术等领域的核心学术会议,聚集了知识表示与推理、自然语言理解与知识获取、图数据管理与图计算、智能问答等相关技术领域的学者和研发人员。
语步(move)是学术论文文本内容的重要结构和单元,语步分析是计算语言学中与语用学相关的一个研究话题,对于分析文本的意图和连贯性等都具有关键作用。论文团队面向科技论文设计了科技论文语步结构识别的创新任务,同时人工标注了较大规模的高质量数据集Scientific Abstract Moves Dataset (SAMD)。为了解决语步结构内容中的隐性混合和反事实推断导致语步识别性能不佳等问题,团队提出了语步显著性归因的新概念,它可以阐明单词对特定语步结构的贡献。在此基础上,设计了一种新的语步识别训练机制,该机制充分考虑了上下文信息,并促使模型专注于与标签相关的最重要文本。所提方法在SAMD和NLP Contribution Graph共享任务数据集(NCG)上进行实验,均取得了突出表现。这是团队在语步识别可解释性上的首次尝试,为我们了解模型如何做出决策并识别模型中的潜在偏差或错误提供了可能。
此次荣获大会优秀资源论文奖表明团队的研究获得了学术同行的认可,这也是重点实验室成立以来,积极推动并开展文理交叉、文工交叉以及多学科创新合作的重要阶段成果之一,充分体现了“语言智能+外语教育”协同创新发展的可能性。未来,重点实验室将继续依托学院平台和学校特色,与校内优势学科专业和学院积极开展更加广泛的交流与合作,实现更高质量和多样化的成果产出。
(审核:杨晖)