毫无疑问,数据量的飙升是AI产业爆发的原因之一。很快我们可以发现,将数据采集、整理、清洗、标注再输送给AI企业用作模型训练,已经成为了一条运行流畅的产业链。
很长一段时间以来,数据服务都处于一种粗放原始的状态之中,甚至出现了一种“数据农场”的说法:数据服务从业者们从各种公开数据集或移动互联网产品中获取数据,以几乎零门槛的形式聘请大量廉价劳动力进行简单的清洗标注工作,例如勾选出一张照片中哪里是天空哪里是大地。最后再将这些粗糙处理过的数据一股脑地投入神经网络的黑箱之中。
但现如今,我们已经看到这一现状正在发生变化,AI企业对于数据的应用需求逐渐开始分化,以往一味粗放的处理模式已经不能满足他们的需求,也因此搅动了AI数据服务市场,潮水从奔腾到平静,让泥沙沉淀,清流上涌。云测旗下的AI数据服务品牌“云测数据”的出现,就是一个典型案例。
这一次,我们采访了云测数据的总经理贾宇航,听他来谈谈,他眼中的数据服务中场战事。
风起云涌的数据服务战场
如果说数据是AI的养料,那么养料的营养含量,自然也决定了AI的强壮程度。算法模型的精准与否、对不同环境的适应性究竟如何等等能力,几乎都来自于原始数据的累积。
最先发生变化的,是AI产业。清华大学发布的《2018年中国人工智能发展报告》显示,去年中国人工智能产业市场规模达到237亿元,同比增长67%。据预计2019年一年中,中国人工智能行业的增长率高达75%。
产业规模的爆发式增长,意味着竞争将进一步严峻。面对这种竞争,AI企业对于数据的需求必然发生变化。