平安科技知识图谱技术团队历经两年项目打磨,深耕智慧法律领域,运用语言模型、要素抽取、关系提取、4W事件提取、语义匹配与相似等AI创新技术,打造了覆盖诉前、诉中、诉后全流程的智慧法律技术中台。法律中台技术工具可以进行灵活配置组合,从而实现各类法律场景的快速落地与实践应用。
图一:智慧法律技术中台
语言模型:
基于海量法律文本无监督学习得到的法律领域的预训练语言模型,构成其余各个技术工具模块的底层支撑。相较于通用语料的语言模型,法律语言模型更适合处理专业法律场景的自然语言任务。
要素抽取:
基于BERT、BILSTM、CRF等不同模型组件构建得到的法律信息抽取模型,可快速解构裁判文书、合同、卷宗、商标等法律要件,从而得到关键的核心法律要素。当前法律中台要素抽取工具可覆盖裁判文书要素、合同要素、卷宗要素、商标要素,应用于资产线索提取、判决预测。
关系提取:
基于BERT预训练的法律关系抽取模型,可快速从法律文书、合同等文本中提取得到多种法律关系。包括人物与机构关系(担保、质押、股权等)、法理映射关系、判决结果与法律事实映射关系等,运用实体识别、实体链接、指代消解等技术,可构建得到实体关系图谱,还原案件关键节点与关系面貌。
应用场景:企业诉讼风险画像
基于要素与关系抽取工具,系统可抽取企业诉讼维度的关联对象、法律关系,从而构建得到企业诉讼风险画像。基于企业的诉讼风险画像,用户可从法律诉讼角度,深入了解企业自身风险要素与关联对象存在的法律风险点,从而赋能风控。
4W事件提取:
利用事件元提取技术从法律文书中抽取包含时间(When)、人物/机构(Who)、地点(Where)、经过(What)触发词的事件信息,构建案情时间线。
应用场景:案件时间线串联与案情梳理
抽取法律案件核心要点(4W),串联案件发生的各个时间点,还原核心案情,助力法官与法律人士快速回顾案情,节约梳理阅读案件的时间。
语义匹配与相似:
结合无监督(BM25)与有监督(DSSM、K-NRM)的语义匹配方法,用于计算不同文本的语义相似程度。基于上述语言模型、要素提取、关系提取和事件提取模型的输出,结合语义相似匹配技术,应用于智能检索、合同比对与审查、类案推送、商标侵权判定。