全球权威声纹识别竞赛斩获双料冠军 网易AI Lab智能技术领先国际

来源:消费日报网    2020-07-24 16:09
来源: 消费日报网
2020-07-24 16:09 
分享
分享到
分享到微信

消费日报网讯在“新基建”勾勒的未来蓝图中,人工智能技术无疑将发挥举足轻重的作用。而令国人振奋的是,在人工智能技术的某些细分赛道上,中国的自研技术已经走到了世界前列。

比如,全球最大的语音会议INTERSPEECH 2020,就在最近公布了SdSV声纹识别比赛成绩,网易AI Lab 从众多国际顶级队伍中脱颖而出,获文本相关声纹识别赛道综合排名第一、单模型第一的双料冠军。

本次国际声纹识别比赛是业界非常具备权威性的赛事,参赛队伍来自国际多家知名高校与企业,包括近两年全球各项声纹识别比赛中的“常胜将军”:布尔诺工业大学、新加坡通信研究院、约翰霍普金斯大学等。

能在与众多好手的较量中脱颖而出,彰显了网易AI Lab在语音声纹识别技术领域的国际领先地位。

比赛中,网易 AI Lab 基于常见的X-Vector和PLDA算法,创新地提出了一种ASR-free的文本相关声纹识别算法。相比传统的Deep Speaker Embedding方法,该算法不需要依赖语音识别,就能够在多语言环境下,同时完成说话人和文本内容的验证。

比赛采用MinDCF(最小检测代价)和EER(等错误率)作为评测指标。网易AI Lab的单模型在两个指标均为最佳,其中EER达到了1.67%,相比第二名降低了11.6%,并远低于比赛 X-Vector基线系统(EER=9.05%)。

声纹识别是生物识别技术的一种,也称为说话人识别,是一种通过声音判别说话人身份的技术。

目前,人工智能主要有三个研究方向:视觉识别、智能语音、NLP自然语言处理。其中,在语音识别领域,声纹识别属于相对蓝海市场,解决的主要是“我是我”的身份认证问题,多应用在安全验证场景。

从近几年的市场趋势来看,银行,金融服务,保险已成为声纹识别应用的领导领域。

随着技术的不断成熟和融合,声纹识别技术将逐渐融入日常生活,根据不同应用场景的特点进行针对性开发,将产生巨大的应用价值。

而网易 AI Lab 声纹识别技术其实早已被运用于游戏场景中。除了进行游戏身份验证,还能够针对音色对用户进行分类、丰富玩家画像,从而更加精准地为玩家推荐志趣相投的好友、匹配实力相当的对手,为玩家带来更好的游戏体验。

网易AI Lab成立于2017年,在杭州、广州、上海均设有分部,主要运用AI黑科技为旗下各大游戏工作室助力,并赋能给更多网易内部产品。总的来说,网易AI Lab的研究方向包括三大方面——计算机视觉和3D视觉研究、语音语言处理研究和游戏AI研究,当前,已有不少研发技术处于行业领先地位,并接入了多款游戏。

比如在语音语言处理研究方面,AI Lab开发了聊天内容监控平台,可实现对特殊类别关键词的识别,在人工智能保驾护航下,产出更多低风险优质UGC内容。目前该功能已陆续在猎魂觉醒、非人学园、第五人格等游戏中接入,每日平均监测文本信息超过1500万条,处理准确率均达到95%以上。

在前不久刚刚落幕的2020世界人工智能大会上,网易CEO丁磊曾表示,人工智能选对了应用场景,发挥的效率就会非常高。相信随着网易AI Lab在技术领域的不断创新,这种高效将不仅仅落脚在游戏体验,也将为人们的日常生活提供巨大的便捷。

【责任编辑:钟经文】
中国日报网版权说明:凡注明来源为“中国日报网:XXX(署名)”,除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系;凡本网注明“来源:XXX(非中国日报网)”的作品,均转载自其它媒体,目的在于传播更多信息,其他媒体如需转载,请与稿件来源方联系,如产生任何问题与本网无关。
版权保护:本网登载的内容(包括文字、图片、多媒体资讯等)版权属中国日报网(中报国际文化传媒(北京)有限公司)独家所有使用。 未经中国日报网事先协议授权,禁止转载使用。给中国日报网提意见:rx@chinadaily.com.cn