百川智能 × 昇腾AI|百川重磅发布Baichuan2大模型!已上线昇思开源社区

来源:中国网    2023-09-07 15:22
来源: 中国网
2023-09-07 15:22 
分享
分享到
分享到微信

【2023年9月6日,北京】百川智能在北京召开大模型发布会,正式发布Baichuan2开源大模型,昇腾AI基础软硬件平台正式支持Baichuan2大模型,并在昇思MindSpore开源社区大模型平台上线Baichuan2-7B模型开放体验。

发布会现场,百川智能宣布正式开源微调后的Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat与其量化版本4bit,面向学术及商业市场提供大模型服务,并且均为免费可商用。

  文理兼备性能优异,全面领先 LLaMA 2

Baichuan2-7B-Base和 Baichuan2-13B-Base,均基于2.6T 质量多语 数据进 训练,在保留了上一代开源模型良好的生成与创作能力,流畅的多轮对话能力以及部署 槛较低等众多特性的基础上,两个模型在数学、代码、安全、逻辑推理、语义理解等能 有显著提升。其中Baichuan2-13B-Base相比上 代13B模型,数学能力提升49%,代码能 提升46%,安全能力提升37%,逻辑推理能力提升25%,语义理解能力提升15%。

本次开源的两个模型在各 评测榜单上的表现优秀,在MMLU、CMMLU、GSM8K等几 权威评估基准中,以绝对优势领先LLaMA 2,相比其他同等参数量大模型,表现也十分亮眼,性能大幅度优于LLaMA 2等同尺寸模型竞品。

更值得一提的是,根据MMLU等多个权威英文评估基准评分 Baichuan2-7b以70亿的参数在英文主流任务上与130亿参数量的LLaMA 2基本持平。

  7B参数模型的Benchmark成绩

  13B参数模型的Benchmark成绩

Baichuan2-7B和Baichuan2-13B不仅对学术研究完全开放,开发者也仅需邮件申请获得官方商用许可后,即可以免费商用。

Baichuan2大模型

Baichuan2大模型是由百川智能开发的一系列开源可商用的大规模预训练语言模型。包含了70亿、130亿、530亿参数的模型。百川智能 成 之初,就将通过开源 式助 中国 模型 态繁荣作为公司的重要发展 向。此次开源的两款Baichuan2 模型,得到了上下游企业的积极响应,华为等众多知名企业均参加了本次发布会并与百川智能达成了合作。

昇腾AI

昇腾 AI是以昇腾 AI基础软硬件平台为基础构建的人工智能计算产业。昇腾AI基础软硬件平台包括 Atlas系列硬件及伙伴自有品牌硬件、异构计算架构 CANN、全场景AI框架昇思 MindSpore、昇腾应用使能 MindX、一站式开发平台 ModelArts和统一工具链MindStudio等。

 

免责声明:该文章系我网转载,旨在为读者提供更多新闻资讯。所涉内容不构成投资、消费建议,仅供读者参考。
【责任编辑:钟经文】
中国日报网版权说明:凡注明来源为“中国日报网:XXX(署名)”,除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系;凡本网注明“来源:XXX(非中国日报网)”的作品,均转载自其它媒体,目的在于传播更多信息,其他媒体如需转载,请与稿件来源方联系,如产生任何问题与本网无关。
版权保护:本网登载的内容(包括文字、图片、多媒体资讯等)版权属中国日报网(中报国际文化传媒(北京)有限公司)独家所有使用。 未经中国日报网事先协议授权,禁止转载使用。给中国日报网提意见:rx@chinadaily.com.cn