【项目动态】“三冠一亚”成最大赢家!深兰首次参加CCKS 2020彰显技术硬实力

2020-12-01 阅读

捷报频传,三冠一亚!11月12-15日,CCKS 2020(国内知识图谱和语义计算等领域的核心学术会议)在江西南昌成功举行,深兰科技DeepBlueAI团队首次参加即斩获“三冠一亚”的佳绩,并是唯一获得多个冠军的队伍,成为与会嘉宾和媒体关注焦点。

此次大会由中国中文信息学会语言与知识计算专业委员会主办,主题为“知识图谱与认知智能”,共设立8个相关主题的技术评测任务,旨在为研究人员提供测试知识图谱与语义计算技术、算法及系统的平台和资源,促进国内知识图谱领域的技术发展。

随着互联网科技飞速发展,人们逐渐从信息时代进入智能时代。知识图谱作为承载底层海量知识并支持上层智能应用的重要载体,在智能时代中扮演了极其重要的角色。其中,多模态知识图谱的构建,能够让基于知识图谱的智能服务更好地理解真实世界的数据场景,进而更好地支撑各项上游任务和行业应用,如推荐系统、语义搜索、智能问答等。

1.jpg

大会现场吸引众多行业资深专家莅临现场

2.jpg

深兰科技获奖信息(点击可看清晰奖状)

3.jpg

新冠百科知识图谱类型推断

4.jpg

面向金融领域:事件主体抽取

5.jpg

基于标题大规模商品实体检索

6.jpg

面向中文短文本的实体链指

7.jpg

基于标题大规模商品实体检索(创)

面对社会各行各业不断涌现的科技需求,深兰科技研发人员正在加速开展各项技术的突破研发。据了解,深兰科技DeepBlueAI团队此次夺冠的三个任务方案,分别可在电商、金融、舆情监控等领域的应用上发挥重要作用。

具体来说,深兰科技DeepBlueAI团队分别在 “新冠百科知识图谱类型推断”、 “面向金融领域的篇章级事件主体抽取”、“基于标题的大规模商品实体检索”这三个(子)任务中夺得冠军;在“面向中文短文本的实体链指”任务中仅以0.00002分之差屈居亚军;此外,本届组委会还特别评选出每一任务至多一项的“创新技术奖”,专门用于鼓励创新性技术的使用,深兰团队在“基于标题的大规模商品实体检索”的任务中再次脱颖而出。

综上所述,从包括CCKS2020在内的国内外“顶会”赛题任务设置中不难发现,共同要点更注重于落地应用性。如今人工智能已逐渐渗透到各个行业并转化为实际应用,深兰早在成立之初就提出了“基础研究与落地应用”齐头并进的理念,并取得有目共睹的成效。会议竞赛的成绩正是对现在及过往的检验,更是对今后不断进取的鞭策,“人工智能 服务民生”将是深兰矢志不渝的奋斗目标。

“三冠”详细解读:

一, “新冠百科知识图谱类型推断” 任务,要求从实体百科(包括百度百科、互动百科、维基百科、医学百科)页面出发,从给定的数据中推断相关实体的类型。然而,大量类型信息以非结构化文本形式呈现于网络页面中,文本处理难度大,抽取结果同时保证高准确度和覆盖率仍然是个极大的挑战。

应对:针对数据集的特点,DeepBlueAI团队构建了数个基于BERT模型的文本分类器,并引入了多个外部数据集,最后将这些分类器进行融合得到最终判断结果。实体类型是知识图谱的重要组成,正确的实体类型是构建一个高质量知识图谱的前提。

二,“事件”在金融领域是投资分析、资产管理的重要决策参考,也是知识图谱的重要组成部分,而“事件抽取”是进行图谱推理、事件分析的必要过程。在金融领域,“事件抽取”是一项十分重要的任务,也是自然语言处理领域一项比较复杂的任务,它的挑战相当部分体现在文本复杂上:输入的文本可能是句子、段落或者篇章,不定长度的文本使得限制文本长度的模型无法使用。

应对:“面向金融领域的篇章级事件主体抽取”任务中,DeepBlueAI团队使用了多标签事件分类加实体识别pipeline模型,在标准的多标签分类模型中加入了特征提取模块,实体识别模型采用BERT-LSTM-CRF与阅读理解投票融合的方式,最终以较大优势获得第一。

三,“基于标题的大规模商品实体检索”是典型的语义识别类任务,在网购已成为一种生活方式的前提下,该技术发展具有非常实用的价值。商品标题一般较短,上下文语境不丰富;用户搜索时,文本口语化严重;商品标题中存在很多变异指代,没有给定的指代映射表,这些方面都需要对上下文语境进行精准理解,具有很大的挑战。

应对:DeepBlueAI团队针对商品检索任务采用召回-粗排-精排的总体方案,在召回阶段放弃了bm25、dssm等主流召回技术,创新性地使用Triplet BERT模型进行召回,在排序阶段采用基于BERT的二分类排序方式,检索准确率达到0.88489。最终不但排名第一,还收获了创新技术奖。

关于 CCKS

第十四届全国知识图谱与语义计算大会(CCKS: China Conference on Knowledge Graph and Semantic Computing)由中国中文信息学会语言与知识计算专业委员会主办,主题是“知识图谱与认知智能”,共设立8个相关主题的技术评测任务,旨在为研究人员提供测试知识图谱与语义计算技术、算法及系统的平台和资源,促进国内知识图谱领域的技术发展,此次大会吸引了包括华为、百度、腾讯、小米、北京大学、上海交通大学和浙江大学等知名企业和学府的团队同台竞技。

个人用户登录 机构用户登录
账号:
密码:
忘记密码
新用户注册
会员注册
注册类型: 个人 机构








发送验证码

找回密码

发送验证码


修改密码


邮箱绑定
更换手机


委托人权限登录

由于个人隐私既客户权限问题请点击输入身份证号码进行查看您的资料