让机器“能听会说更懂人类”, AI数据发挥怎样的关键作用?

来源:消费日报网    2021-05-06 09:52
来源: 消费日报网
2021-05-06 09:52 
分享
分享到
分享到微信

智能语音技术是人工智能应用最广泛的技术之一,拥有天然的交互性,拥有巨大的市场空间。基于大量数据的积累、深度神经网络模型的发展及算法的迭代优化,近年,智能语音技术的识别准确率取得了不断的提升,相关场景应用也是不断深化。这其中,智能语音技术对数据的依赖愈发明显。

在人工智能技术推动下,智能语音具备的巨大的场景落地潜力。在企业和技术的推动下,语音交互技术在智能家居、智能车载、语音助手、机器人等领域取得迅猛发展,迸发出鲜活的生命力。

如今的语音交互虽然囊括了大部分场景对话,但还有更多复杂场景的问题需要解决 —— 听懂人类情感是非常复杂的过程,这涉及到情感识别、语义分割、声纹识别等等,对算法模型训练背后的数据提出了巨大的挑战。

高质量AI数据,智能语音走向成熟的必由之路

从根本出发来考虑,语音交互几乎和手势一样,是人类最自然的交互方式之一,通过声音与朋友家人交流、与客户同事沟通都是人类自古以来的通用场景。语音能够传达的细节相当丰富,其中蕴含了大量语义、情绪以及未尽之意,信息浓度非常高。因此,也可以说语音交互技术是让机器听懂世界的技术。

在这些发展需求商业化落地的背后,必然需要大量高质量、能被机器识别理解的结构化数据投入训练,场景化、高质量的数据让各类终端变得更加聪明。因此,无论出于技术还是商业需求,都需要以云测数据为代表的AI数据服务提供商介入,生产纯净、安全、精准的训练数据,助力智能语音技术深化落地。

云测数据扎根于AI数据服务领域,在服务众多智能语音企业的过程中,积累了丰富的数据采集标注经验,支持专业音频设备与多条件场景,可以帮助企业获得精细化、高质量的AI数据,在智能语音方向拥有丰富的项目经验。

首先,云测数据拥有充足的被采资源,可最大程度还原搭建应用场景,为企业提供语音类、视觉类数据的场景化采集。诸如在采集过程中云测数据会运用专业的软/硬件设备,来满足客户的环境光照要求;如果客户需要纯净音频数据,云测数据会搭建一个录音棚,满足诸如混响或者高底噪的采集需求,包括使用麦克风阵列等专业设备进行录制。

目前云测数据覆盖智能语音主流应用场景,支持专业音频设备与多条件场景,交付能力强。支持常见采集类型,如:唤醒词、控制词、指定语料、情绪类型、方言、背景音、情景对话、指定文本念句、远场语音等等类型的数据类型。

在语音标注能力方面,支持ASR语音转写、声纹识别标注、说话人识别、语音切割、情绪判定标注等;在自然语言处理方面,支持OCR转写、NLU语句泛化、文本信息抽取、实体标注、词性标注、槽位填充等,具备全方位的语音标注能力。

同时,云测数据具有自主知识产权的数据标注平台拥有灵活、高效、智能的特点,帮助标注人员提效减负。在保证数据隐私安全的同时,支持平台私有化部署,可最大程度保障数据安全性。

在拥有场景化精准语音数据前提下,算法训练所需要的数据精准度就决定了智能语音产品的“聪明”上限,它贯穿在智能语音产品的探索期与商业落地阶段。在人工智能领域中有着这样一句话:garbage in,garbage out。换而言之,数据的质量的高低直接影响语音交互应用的结果,实现人机交互顺畅。

随着技术的不断突破,语音交互体验方面还有望得到进一步提升。比如在设备的唤醒率、识别率、误报率、环境降噪等方面,仍然需要在高质量、场景化的语音数据的助力下不断进化,持续提升用户使用的体验感,创造更加自然的交互设备,实现智能语音技术应用的深化落地。

免责声明:该文章系我网转载,旨在为读者提供更多新闻资讯。所涉内容不构成投资、消费建议,仅供读者参考。
【责任编辑:钟经文】
中国日报网版权说明:凡注明来源为“中国日报网:XXX(署名)”,除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系;凡本网注明“来源:XXX(非中国日报网)”的作品,均转载自其它媒体,目的在于传播更多信息,其他媒体如需转载,请与稿件来源方联系,如产生任何问题与本网无关。
版权保护:本网登载的内容(包括文字、图片、多媒体资讯等)版权属中国日报网(中报国际文化传媒(北京)有限公司)独家所有使用。 未经中国日报网事先协议授权,禁止转载使用。给中国日报网提意见:rx@chinadaily.com.cn