2012年5月17日,谷歌提出“知识图谱”概念,是优化搜索引擎返回结果、增强用户搜索质量及体验的技术。此后10年时间,知识图谱技术得到了长足的进步,它不仅在搜索、问答、推荐等互联网场景中得到广泛应用,更在医疗、电商、金融等诸多垂直领域也有丰富的成功案例,被视为推动人工智能发展的核心驱动力之一。自2022年ChatGPT人工智能大模型诞生以来,因其在语言理解和知识问答方面的优异表现,受到了学术界和工业界的广泛关注。知识图谱和大模型作为表示和处理知识的手段,二者高度互补,不仅补足了大模型的语言理解能力,更丰富了知识图谱的知识表示方式,二者的融合发展可有效推进各行业、各领域信息系统的智能化进程。
天津大学博士生导师、智能与计算学部人工智能学院副院长、天大智图(天津)科技有限公司首席科学家王鑫教授,多年来致力于知识图谱与图数据库领域的研究。多年来,主持国家重点研发计划项目、国家自然科学基金项目等多项,并参与了科技创新2030“新一代人工智能”重大项目、国家高技术研究发展计划项目、国家科技支撑计划项目,均取得了先进的科研成果。目前,他们团队在产学研融合方面取得了重要的进展。
创新研发国产知识图谱数据库
知识图谱作为人工智能的重要基石,其包括知识获取、知识组织、知识存储、知识查询与检索、知识推理与应用等方面,是人工智能符号主义学派的新发展,是解决人工智能可解释性难题的关键工具。
知识图谱数据管理是实现新一代人工智能的基础技术,在国家重点研发计划项目“分布式知识图谱数据管理关键技术与系统”的支持下,王鑫带领团队研发了自主研发国产知识图谱数据库OggDB,主要应用于新一代人工智能场景和信息创新领域,该数据库能够一站式解决传统图数据库数据模型、存储方案和查询语言不统一的问题,支持万亿边PB级图数据存储。同时,具备毫秒级点边查询能力,10+层的深度链路分析能力,具备数据2D和3D展示能力。在国产适配方面,基于国产数据库内核,填补了国产知识图谱数据库产品空白。
现如今,OggDB已经发布2.0版本,它通过大模型智能助手,能够帮助用户自动抽取文本内的实体与关系信息;提供通用的插件接口,实现基于插件平台的功能扩展;内置的大模型智能助手,支持将自然语言转化为图查询语句的能力;通过性能测试,OggDB在大部分场景下搜索性能处于行业领先水平。
王鑫表示,OggDB的发布引起了学术与产业界专家、企业客户、行业组织的广泛关注和热烈反响,随着赋能“复杂关联的业务场景”需求增多,OggDB将充分释放AI能力,更好的进行深链查询与融合分析,推进国产知识图谱数据库技术创新,未来应用前景十分广泛。
知识图谱赋能中医药领域大模型
中医药是我国的文化瑰宝,从古至今上下五千年,中医药为中华民族的健康发挥着举足轻重的作用。在科技发展日新月异的今天,中医药也以前所未有的速度与广度,融入现代科技的洪流之中,走向现代化、数字化发展之路。
2022年,我国国家中医药管理局印发《“十四五”中医药信息化发展规划》,提出加快中医药关键数字技术攻关。2024年3月,王鑫课题组与现代中医药海河实验室、天津中医药大学、天津市人工智能计算中心合作,由天大智图(天津)科技有限公司落地实现,推出了“海河•岐伯”大语言模型。这一面向中医药领域的大模型是中国第一个基于知识图谱检索增强技术打造的中医药大语言模型,在技术层面实现了全面国产化,通过深度挖掘和分析海量中医证候数据,并与知识图谱交互,能够帮助临床医生进一步提高诊疗效率,优化医疗服务和中医药研究模式,助力实现知识积累和数据共享。
相传岐伯是我国上古时期的著名医家,精于医术脉理,名震一时,后世尊称为“华夏中医始祖”、“医圣”。如今传世的中医古籍《素问》就是黄帝询问,岐伯作答,以阐述医学理论,显示了岐伯高深的医学造诣。同样,“海河•岐伯”大模型内含古代医家经典典籍、开源图书库医学古籍、国家规划中医药教材、中医药试题数据共上万种中医药文献语料,8万余首经典中医药方剂,多个流派的中医临床问诊数据等,正因有这些丰富的中医药领域数据,大语言模型才能学习和理解传统医学的深层次知识。可以说,它是传统医学与现代人工智能技术相结合的产物,这也是“海河·岐伯”大模型能达到高准确率的关键所在。
王鑫表示,“海河•岐伯”的应用场景非常广泛,分别可以用在中医药教育、临床诊疗和养生保健等领域。在教育行业,利用大模型辅助教学,可以提高中医药教育和培训的质量和效果,培养具备跨学科知识和实战技能的复合型中医药人才;在临床诊疗方面,可以将“海河·岐伯”应用于更广泛的中医药临床诊疗领域,通过分析四诊仪等专业仪器产生的数据,为医疗团队提供更全面的视角,辅助制定个性化治疗计划;而在养生保健方面,可以充分发挥中医“治未病”的优势,为用户提供便捷的养生保健建议,助力“治病于未然”。
王鑫带领着团队不断探索国医传承、基于中医药领域知识图谱的问诊,以及结合四诊仪与多模态的诊疗模式。他们正在通过建立中医证候数据库,实现中医证候的标准化和规范化,提高中医诊疗的准确性和可靠性。同时,将“海河·岐伯”应用于基层医疗机构,通过智能化解决方案为基层医疗降本增效,提升基层医疗服务水平。据了解,“海河·岐伯”可用于提升偏远地区的医疗水平,促进中医药文化的传承与创新,助力中医药走向海外市场。
中医药大模型是中医现代化的重要发展趋势,大模型强大的数据处理和分析能力,为中医药传承与创新注入了新的活力。在过去研究的基础上,王鑫带领团队创新研发国产知识图谱图数据库,用知识图谱赋能中医药大模型,推动了产学研融合发展。未来,“海河·岐伯”的产业化应用必将极大地推动中医药行业的现代化和国际化,通过智能化诊疗,提高诊疗效率与精准性,降低医疗成本,为更多的人造福。(供稿人:王超)