腾讯汤道生:行业大模型是企业拥抱大模型的更优选项

腾讯汤道生:行业大模型是企业拥抱大模型的更优选项

来源: 中国日报网
2023-07-07 16:56 
分享
分享到
分享到微信

7月6日,2023世界人工智能大会在上海举办。腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生,在大会全体会议-产业发展论坛,做主题演讲。他表示,通用大模型有很强的能力,但并不能解决很多企业的具体问题。企业的大模型应用需要综合考虑行业专业性、数据安全、持续迭代和综合成本等因素。基于行业大模型,构建自己的专属模型,也许是企业更优的选项。

“通用大模型可以在100个场景中,解决70%-80%的问题,但未必能100%满足企业某个场景的需求。”汤道生表示,通用大模型一般是基于广泛的公开文献与网络信息来训练的,许多专业知识与行业数据积累不足,导致回答的行业针对性与精准度不够。但用户对企业提供的专业服务,要求高、容错性低,企业一旦向公众提供了错误信息,可能引起严重后果。

他表示,企业如果基于行业大模型,再加上自身数据进行精调,可以建构专属模型,打造出高可用的智能服务。而且模型参数比通用大模型少,训练和推理的成本更低,模型优化也更容易。

同时,行业大模型和模型开发工具,也可以通过私有化部署、权限管控和数据加密等方式,防止模型训练和使用带来企业敏感数据的外泄。

另外,大模型落地过程,还需要经过算法构建、模型部署一系列环节,每个环节都不能“掉链子”。模型后续还需要不断地迭代调优,这需要用到系统化、工程化的工具。

针对这些问题,腾讯云最近也公布了腾讯云MaaS服务全景图,基于腾讯云TI平台打造行业大模型精选商店,提供金融、文旅、政务、医疗、传媒、教育等10大行业,50多个解决方案;推出行业大模型精调解决方案,帮助模型开发者与算法工程师,一站式解决模型调用、数据与标签管理、模型精调、评估测试与部署等任务,减轻创建大模型的压力。在这些模型和工具平台基础上,企业只用加入自己的场景数据,就可以快速生成自己的“专属模型”。

“伴随着大语言模型的发展,产业和社会,也将从数字化、网络化,走向智能化。在这个过程中,腾讯始终认为,人工智能发展的根本目标是落地于产业,服务于人。能真正解决用户需求、距离场景和数据更近的企业,将拥有大模型的未来。腾讯将携手各方伙伴,以优质模型、澎湃算力,让每个企业的‘黄金数据’发挥出高效用,助力产业创新发展。”汤道生说。

以下是演讲全文:

大家好!非常高兴参加世界人工智能大会。今天在这里抛砖引玉,也请各位专家指正。

腾讯公司参加世界人工智能大会已经整整5年。在这5年中,我们参与和见证了人工智能“上海高地”的建设。腾讯在青浦的数据中心、松江的长三角人工智能超算中心,累计已经投产了数万台服务器。我们其中一个AI实验室——优图实验室,就在上海,也获得了超过1600 项全球专利。同样设立于上海的科恩安全实验室,在AI安全等领域,也达到了国际领先水平,被称为中国网络安全的“梦之队”。

这5年中,腾讯的人工智能技术和产品也在各行各业落地生根:我们的数智人“入职”了130多个行业,担任金融客服、虚拟主播等“数智员工”,为用户提供个性化的服务。我们的工业AI质检已经在3C零部件、锂电等多个制造业产线上使用,提高良品率的同时,帮助企业降本增效。我们借助AI、游戏引擎等游戏技术以及南航虚像显示技术,生成虚拟飞行环境,为民航飞行员提供更高效、安全的飞行训练。

过去几个月,大语言模型与生成式AI的发展实现了强大的语言理解与推理能力,并能按提词生成完整的段落、精致的图片、视频甚至代码等,让AI成为更强大的个人助手。

很多实体企业既兴奋又焦虑,迫不及待地想要拥抱大模型技术,推动设计、销售、服务等环节的智能化升级,提升生产、经营、管理效率。

事实上,虽然通用大模型很强大,但并不一定能解决很多企业的具体问题。大模型在产业场景中是否真正可靠、可用?怎样才能保护好企业数据产权和隐私?如何降低大模型的使用成本?这些都是企业需要考虑的现实问题。

企业基于行业大模型构建自己的专属模型,也许是更优的选项。同时也要借助高效的专业工具,不断优化、迭代模型,满足企业和市场持续变化的需求。

首先,借助行业大模型,更高效地为用户提供精准服务。

通用大模型一般都是基于广泛的公开文献与网络信息来训练的,网上的信息可能有错误、有谣言、有偏见,许多专业知识与行业数据积累不足,导致回答的行业针对性与精准度不够,输出的信息也相对宽泛。虽然通用大模型整体水平在不断提升,但策略上有点像要把大海煮沸(Boil the Ocean),并不聚焦。通用大模型可以在100个场景中,解决70%-80%的问题,但未必能100%满足企业某个场景的需求。

但用户对企业提供的专业服务,要求高、容错性低,企业一旦向公众提供了错误信息,可能引起巨大的法律责任或公关危机。因此,我认为,每个企业都可以基于由专业知识和数据训练出来的行业大模型,再加上企业自己的数据进行精调,建构独有的“专属模型”,更高效地打造出高可用的智能服务。

同时,基于行业大模型的企业专属模型,模型参数比通用大模型少,训练和推理的成本更低,模型优化也更容易。

其次,借助专属模型,保护企业数据,保证数据安全。

数据是大模型的原材料,模型最终要在真实场景落地,达到理想的服务效果,往往需要把企业自身的数据也用起来。过程中如果数据保护不当,可能会造成企业核心数据、敏感数据的泄漏。

行业大模型和模型开发工具可以通过私有化部署等方式,让模型训练更放心,也可以避免员工访问模型时,发生企业敏感数据的外泄。

如果模型服务是面向用户,用户的反馈数据也可以用来优化专属模型,不断提升服务体验。

再次,借助高效率的平台开发工具,实现模型快速、低成本的持续优化。

模型在产业中的落地是一个复杂的系统化工程,要经过数据处理、算法构建、模型部署一系列环节,每个环节都不能“掉链子”。

同时,企业模型的应用也不是一次性部署完了就结束了。还需要在使用中不断根据新的数据调整,让模型跟上不断变化的市场和用户需求。过程中就需要管理好大量的数据与标签,不断测试与迭代模型。这就需要用系统化、工程化的工具保障模型的持续运行。

基于这些企业现实问题和需求的思考,上个月,我们也正式公布了腾讯云MaaS服务全景图。

基于腾讯云TI平台打造的行业大模型精选商店,提供金融、文旅、政务、医疗、传媒、教育等10大行业,超过50个解决方案。在这些能力模型基础上,伙伴们只需要加入自己独有的场景数据,就可以快速生成自己的“专属模型”。我们也可通过模型的私有化部署、权限管控和数据加密等方式,帮助企业用户在使用模型时保护好自身数据,更加安心。

我们也推出基于腾讯云TI平台的,行业大模型精调解决方案。帮助模型开发者与算法工程师,一站式解决模型调用、数据与标签管理、模型精调、评估测试与部署等任务,减轻创建大模型的压力。

比如,我们和国内的头部在线旅游公司,基于“文旅大模型”打造了机器人客服。当用户咨询假期行程,如果是基于通用大模型的客服机器人,只能给出一些简单的景点介绍。但当我们基于行业大模型,加入企业数据进行模型精调之后,客服机器人的回答变得更加精准、可用和详细,能够规划出交通、景点、酒店安排,甚至可以直接提供预订链接,以及优惠券等信息。不仅实现了贴心的服务,也具备了更强的销售转化能力。这才是企业所需要的。

我们也将行业大模型能力融入到腾讯自身的企业级应用,通过更智能的服务,帮助客户提高工作效率。

例如,新一代的腾讯企点智能客服基于行业模型,结合客户业务需求进行训练与精调,可以提供更精准、更详细的回答,用户体验也更人性化。同时,借助企点分析平台,销售人员用自然语言提问就可以实现准确的商业分析,不需要花费大量的时间学习复杂的软件、制作看板。

我们的数智人也因为融入了AI生成算法,提升了数字形象的复刻速度。2D数智人的制作只需要录制3分钟的真人口播视频,借助平台的多模态处理能力,就可以实时建模并生成高清人像,在24小时内,制作出与真人近似的“数智人”,成本大大降低。

各位嘉宾!伴随着大语言模型的发展,产业和社会正在从数字化、网络化走向智能化。在这个过程中,我们始终认为人工智能发展的根本目标是落地于产业,服务于人。能真正解决用户需求、距离场景和数据更近的企业,将拥有大模型的未来。

腾讯将携手各方伙伴,以优质模型、澎湃算力让每个企业的“黄金数据”发挥出高效用,助力产业创新发展。

腾讯人工智能的产业实践,也将在腾讯分论坛和游戏AI分论坛中,与大家做详细分享。另外,也非常欢迎大家到腾讯展台,体验一下录制3分钟视频制作自己的数智人等技术。

谢谢大家!

【责任编辑:张天磊】
中国日报网版权说明:凡注明来源为“中国日报网:XXX(署名)”,除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系;凡本网注明“来源:XXX(非中国日报网)”的作品,均转载自其它媒体,目的在于传播更多信息,其他媒体如需转载,请与稿件来源方联系,如产生任何问题与本网无关。
版权保护:本网登载的内容(包括文字、图片、多媒体资讯等)版权属中国日报网(中报国际文化传媒(北京)有限公司)独家所有使用。 未经中国日报网事先协议授权,禁止转载使用。给中国日报网提意见:rx@chinadaily.com.cn