阿里云通义千问720亿参数模型宣布开源

来源：中国日报网 2023-12-01 16:58

来源：中国日报网

2023-12-01 16:58　

分享到

分享到微信

12月1日，阿里云通义千问720亿参数模型Qwen-72B宣布开源。随着Qwen-72B的开源，通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。至此，通义千问共开源18亿、70亿、140亿、720亿参数的4款大语言模型，以及视觉理解、音频理解两款多模态大模型，实现“全尺寸、全模态”开源。

据介绍，此前，中国大模型市场还没出现足以对标Llama 2-70B的优质开源模型。Qwen-72B填补了国内空白，以高性能、高可控、高性价比的优势，提供不亚于商业闭源大模型的选择。基于Qwen-72B，大中型企业可开发商业应用，高校、科研院所可开展AI for Science等科研工作。

如果说Qwen-72B“向上摸高”，抬升了开源大模型的尺寸和性能天花板；发布会上的另一开源模型Qwen-1.8B则“向下探底”，成为尺寸最小的中国开源大模型，推理2K长度文本内容仅需3G显存，可在消费级终端部署。

从18亿、70亿、140亿到720亿参数规模，通义千问成为业界首个“全尺寸开源”的大模型。用户可在魔搭社区直接体验Qwen系列模型效果，也可通过阿里云灵积平台调用模型API，或基于阿里云百炼平台定制大模型应用。阿里云人工智能平台PAI针对通义千问全系列模型进行深度适配，推出了轻量级微调、全参数微调、分布式训练、离线推理验证、在线服务部署等服务。

阿里云是国内最早开源自研大模型的科技企业，8月以来开源了Qwen-7B、Qwen-14B和视觉理解模型Qwen-VL。几款模型先后冲上HuggingFace、Github大模型榜单，得到中小企业和个人开发者的青睐，累计下载量超过150万，催生出150多款新模型、新应用。发布会现场，多位开发者伙伴现身说法，分享了他们用Qwen开发专属模型和特定应用的实践。

阿里云CTO周靖人表示，开源生态对促进中国大模型的技术进步与应用落地至关重要，通义千问将持续投入开源，希望成为“AI时代最开放的大模型”，与伙伴们共同促进大模型生态建设。

同日，首届“通义千问AI挑战赛”开赛，参赛者可免费畅玩通义开源模型家族，包括刚刚发布的720亿参数模型Qwen-72B。主办方为参赛者提供价值50万元的免费云上算力和丰厚奖金。赛事分为算法和Agent两大赛道，前者聚焦通义千问大模型的微调训练，希望通过高质量的数据探索开源模型的代码能力上限，后者鼓励开发者基于通义千问大模型和魔搭社区的Agent-Builder框架开发新一代AI应用，促进大模型在各行各业的落地应用。即日起开发者可通过天池平台报名参赛。

【责任编辑：涂恬】