人大卢志武教授团队推出国产多模态通用大模型“元乘象Chatimg”

来源: 环球网
2023-04-07 14:32 
分享
分享到
分享到微信

近日,一款名为“元乘象 Chatlmg”的国产 AI 模型吸引了众多关注。它不仅支持文字聊天,还能看懂图片上的内容并根据图片内容回答问题。

据了解,“元乘象 Chatlmg”上线后十分火爆,关注微信公众号“元乘象”就可以体验该应用。元乘象Chatlmg初体验

如果给你一幅名画图片,可以想象一下,如果不知道这幅画的名字,我们要怎么才能得到这些答案?首先,我们要把图片输入搜索引擎,从而根据匹配结果得到画的名字,然后再拿着这个名字去搜想知道的信息。而且这些信息可能以大篇幅的形式弹出,需要你自己去找感兴趣的段落。而借助“元乘象 Chatlmg”,我们只需要上传图片、提问题就可以了。

给“元乘象 Chatlmg”一张油画的图像,它可以迅速识别出图片内容是梵高的《星夜》,并做出鉴赏和评判。

甚至,它还能根据图片编个故事,而且编的故事往往比较积极、阳光。如果你想聊聊艺术,“元乘象 Chatlmg”也能陪你聊,并告诉你艺术品背后的故事。

Chatlmg有一些对于生活比较实用的功能,比如美食建议,给出一些食材,它给出的建议,已经是“美食达人”的水准。

“元乘象 Chatlmg”的这些能力不止可以用来闲聊,还可以用来写各类建议、商品文案、旅游宣传词…… 这些都是可以商业变现的场景。

虽然结果可能不能直接拿来用,但用作参考还是很实用的。

当然,如果你对结果不满意,还可以要求“元乘象 Chatlmg”重写,完整体验做甲方的感觉。

此外,我们还在测试过程中发现了一些有趣的现象。比如,如果“元乘象 Chatlmg”仅根据图像和文字线索回答不出你的问题,它会让你帮忙提供更多信息。在增加信息之后,它有可能给出正确答案。

此外,Chatlmg还有交往建议、穿搭建议、秒懂情绪、美食点评、艺术品鉴赏等一系列新潮、好玩、实用的功能应用。

背后的技术与团队

如今,大模型在 NLP 任务中取得了成功的应用。但真实世界的数据模态是多样的。在通用人工智能的发展过程中,多模态感知极为重要的一环,也是解锁大模型技术应用的关键。

据了解,“元乘象 Chatlmg”就是搭载了自研的百亿级别参数多模态大模型,从而能让我们像体验的那样能感知图片并进行对话。

简单介绍来说,目前元乘象 Chatlmg 大模型参数规模大概 150 亿;数据方面目前主要是图文对数据、VQA 数据等。而在训练过程中,该模型放开尽量少的可学习参数,从而保证在有限算力上的高效训练。

未来,除了当下的图文互动外,该模型还将集成图片生成的能力并加入视频、音频等多种模态,甚至与数字人等技术结合,开发出更生动立体的形象。

值得一提的是,这个好玩的应用来自中国人民大学高瓴人工智能学院教授卢志武带领的团队。卢志武教授曾主导设计了首个公开的中文通用图文预训练模型文澜 BriVL,并发表于 Nature Communications。该模型经过6.5亿弱相关中文图文对的预训练,学习到独特的中文语义理解能力并能很好地将中文语义与视觉信息联系起来,尤其擅长读取中文独有的含蓄语义与图片中的抽象概念。

免责声明:该文章系我网转载,旨在为读者提供更多新闻资讯。所涉内容不构成投资、消费建议,仅供读者参考。
【责任编辑:钟经文】
中国日报网版权说明:凡注明来源为“中国日报网:XXX(署名)”,除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系;凡本网注明“来源:XXX(非中国日报网)”的作品,均转载自其它媒体,目的在于传播更多信息,其他媒体如需转载,请与稿件来源方联系,如产生任何问题与本网无关。
版权保护:本网登载的内容(包括文字、图片、多媒体资讯等)版权属中国日报网(中报国际文化传媒(北京)有限公司)独家所有使用。 未经中国日报网事先协议授权,禁止转载使用。给中国日报网提意见:rx@chinadaily.com.cn