5月25日至30日,由科技部、国家发展改革委、工业和信息化部、国务院国资委、中国科学院、中国工程院、中国科协、北京市政府共同主办的中关村论坛在京召开,来自80多个国家和地区的科学家、企业家汇聚中关村,围绕人工智能、生命科学、清洁能源等前沿领域,探讨科技创新趋势。百度首席技术官王海峰出席人工智能大模型发展论坛,以《文心一言,读书破万亿》为题,阐述大语言模型技术及产业模式,展示文心一言在知识问答、写文稿、作诗、生成视频、推理计算,以及工作场景中智能总结等多方面能力,展望大模型将与实体经济深度融合,加速产业升级和经济增长。
百度首席技术官王海峰
当前,以大语言模型为代表的人工智能技术在全球掀起科技和产业创新浪潮。我国高度重视,中共中央政治局4月28日会议指出,要夯实科技自立自强根基,培育壮大新动能。要重视通用人工智能发展,营造创新生态,重视防范风险。5月5日二十届中央财经委员会第一次会议特别强调,要把握人工智能等新科技革命浪潮,适应人与自然和谐共生的要求,保持并增强产业体系完备和配套能力强的优势,高效集聚全球创新要素,推进产业智能化、绿色化、融合化,建设具有完整性、先进性、安全性的现代化产业体系。
基于强算法、大算力和大数据的大模型成为人工智能发展的主流方向,尤其是能理解、有逻辑、会推理、能创作、有情感的大语言模型,为发展通用人工智能带来曙光。
据了解,文心一言是百度自主研制的知识增强大语言模型,以文心系列大模型为基础,从超过万亿的数据和知识中融合学习得到预训练大模型,在此基础上采用有监督精调、人类反馈的强化学习和提示等技术,并具备知识增强、检索增强和对话增强等技术优势。同时,得益于百度在人工智能技术栈的全面布局和技术积累,尤其是飞桨深度学习平台和文心大模型的联合优化,文心一言在一个多月时间推理性能提升了近10倍,效率更高,效果更好。目前,飞桨深度学习平台已凝聚了535万开发者,服务20万企事业单位,基于飞桨创建了67万个模型,位居中国深度学习平台市场综合份额第一。
王海峰在演讲中展示了文心一言多场景能力。在回答“2023中关村论坛开幕式发布了哪些重大科技成果”时,文心一言一一列举了中关村论坛开幕式上发布的10项重大科技成果,回答时效性强、准确性高,体现了检索增强的技术优势;针对“中关村论坛对我国科技自主创新的意义”等问题,文心一言总结到位,条理清晰,还以“创新发展”为题创作了藏头诗,并生成了介绍中关村论坛的视频。
在工作中,文心一言成为智能办公“超级助手”,与智能工作平台如流结合,率先在百度内部开启人机协作的工作新范式,实现了IM对话智能总结、代码智能生成、知识库智能创作等,相当于具有丰富专业知识、实时响应的智能工作助理,助力员工提升工作效率。
当前,人工智能已经成为新一轮科技革命和产业变革的重要驱动力量,大模型具有效果好、泛化性强、研发流程标准化程度高等特点,为人工智能产业发展带来新机遇。面对大模型产业化的挑战,王海峰说,类似芯片代工厂模式,一些具有算法、算力和数据综合优势的企业,可以将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务。据了解,这一产业化路径已在文心大模型产业实践中得到验证。百度与各行业头部企业、机构共建了包括能源、金融、航天、制造、传媒、城市、社科以及影视等行业大模型。
未来,大模型将改变云计算的游戏规则,云智一体的MaaS(模型即服务)将成为云计算的主流商业模式。各类应用将基于大模型来开发,每个行业需要打造行业自己的大模型。大模型将与实体经济深度融合,赋能千行百业,加速产业转型升级,促进经济高质量发展。