点击上方,选择星标,每天给你送干货!
来自:中国中文信息学会
“第二十届中国计算语言学大会”(CCL)技术评测拉开帷幕。本次技术评测公布了5项任务,包括“跨领域句法分析”、“中文空间语义理解”、“智能医疗对话诊疗”、“图文多模态幽默识别”和“中译语通-Nihao无监督中文分词”,涵盖了词法、句法、语义、语用多层次的自然语言处理基础和应用任务。对自然语言处理模型的领域移植和语义推理能力的考察成为本次技术评测的焦点。中国计算语言学大会自年以来每年都组织技术评测。CCL将于年8月13-15日在呼和浩特市举行,会议组织单位为中国中文信息学会计算语言学专业委员会,承办单位为内蒙古大学。届时,在技术评测中取得优异成绩的队伍将被邀请在技术评测研讨会进行报告并颁奖。中国中文信息学会将提供官方获奖证书,各个任务提供一定额度的奖金奖励。欢迎广大中文自然语言处理研究者参与评测竞赛与技术探讨。具体评测任务介绍如下。任务1:跨领域句法分析评测
任务简介:近年来,随着深度学习技术的发展,尤其是预训练语言模型ELMo/BERT的提出,封闭领域规范文本上的句法分析性能已经达到了比较高的水平。但是,在跨领域文本,尤其是不规范的网络文本上,句法分析的性能会急剧下降。同时,如何在深度学习模型中利用结构化的句法信息也是NLP领域的重要研究问题之一,但是受到真实文本上句法性能的限制。因此,领域移植问题已经成为句法分析研究的重要挑战。
为了更充分地支持句法分析领域移植研究,苏州大学自然语言处理组自年起标注了多领域句法数据集,并命名为汉语开放依存树库(CODT),目前包含16万句,涵盖10多个领域或来源的文本。本次跨领域句法分析评测,公开发布CODT2.0数据集,包含7万句,对应6个领域。具体而言,评测任务针对“多源零样本”领域移植场景,分为封闭和开放两个赛道。评测任务负责人
负责人:李正华(苏州大学)
联系人:周明月(z
.