又一大模型技术开源!网易有道自研RAG引擎QAnything正式开放下载

来源: 中国网
2024-01-17 14:34 
分享
分享到
分享到微信

昨日,网易有道宣布将自研的知识库问答引擎QAnything正式开源,除了可以调用云端大模型服务,还支持纯本地部署,所有用户可免费在开源社区Github内进行下载,一键部署即可使用。该系统目前支持word、ppt、excel、pdf、图片等多种文档格式,直接导入进去即可实现像"ChatGPT"一样问答。

据了解,QAnything的主要原理是基于检索增强的生成(Retrieval Augmented Generation,简称RAG),RAG是目前很火的一种技术框架,它能够利用检索外部内容的方式增强大语言模型的准确度、专业能力和个性化等各方面的性能。

目前,通用大模型能力很强,但无法使用用户的私有数据,且存在胡乱编造的幻觉问题。QAnything作为有道自研的RAG引擎,则结合了用户私有数据和大模型的优势——用户的任何内容,以任意的形式存在,比如各种格式的文档,音频,数据库等,都可以在QAnything的支持下,变成可以针对其内容进行问答的使用方式,通过这个技术框架用户可以很方便地搭建自己的智能知识助手。

(QAnything系统架构图)

值得一提的是,本次开源的QAnything是一套完整的RAG系统,包括专门优化的自研的embedding和rerank模型,微调后的LLM,优化后的推理代码,向量数据库,以及一个立即上手可用的前端。所有的算法模型(包括7B大模型+embedding/rerank+OCR)占用显存不超过16G。

如今,QAnything已在有道的多个产品中应用,包括有道翻译文档问答、有道速读及有道内部业务的客服系统等。

以有道速读为例,它是前不久子曰教育大模型最新发布的创新应用成果之一,目前上线在有道翻译中。针对大家在日常生活中的阅读文档需求,有道速读内置了文档问答、文章摘要、要点解读、引文口碑和领域综述五大功能,能够帮大家更快更准地获得信息和对文档的理解。而该功能背后的驱动就是QAnything,在大模型技术的加持下,用户能够实现快速理解文档、定位要点,实现1分钟读完万字长文。

“目前,QAnything项目还在不断迭代,欢迎大家参与开发,并给予我们更多反馈。我们希望能帮助有需要的开发者们,和更多伙伴一起推动大模型的落地。”网易有道首席科学家段亦涛介绍道。

(辛文)

免责声明:该文章系我网转载,旨在为读者提供更多新闻资讯。所涉内容不构成投资、消费建议,仅供读者参考。
【责任编辑:钟经文】
中国日报网版权说明:凡注明来源为“中国日报网:XXX(署名)”,除与中国日报网签署内容授权协议的网站外,其他任何网站或单位未经允许禁止转载、使用,违者必究。如需使用,请与010-84883777联系;凡本网注明“来源:XXX(非中国日报网)”的作品,均转载自其它媒体,目的在于传播更多信息,其他媒体如需转载,请与稿件来源方联系,如产生任何问题与本网无关。
版权保护:本网登载的内容(包括文字、图片、多媒体资讯等)版权属中国日报网(中报国际文化传媒(北京)有限公司)独家所有使用。 未经中国日报网事先协议授权,禁止转载使用。给中国日报网提意见:rx@chinadaily.com.cn