8月29日,由直讯中国主办的2019零售信贷智变大会在北京正式开幕,来自中央财经大学金融创新与风险管理研究中心、数字金融百人论坛,以及近百家银行和持牌消金机构的三百余位嘉宾就零售信贷生态构建、科技赋能应用、资产运营等话题展开了深入交流。
随着社会资金流的发展越来越快,以大数据、人工智能为代表的创新技术对零售信贷业务的发展模式、市场竞争格局产生了深远影响。
RealAI联合创始人及金融合伙人刘荔园
作为清华大学人工智能研究院唯一孵化企业,国内首家致力于安全、可靠、可解释第三代人工智能的创新企业,RealAI联合创始人刘荔园受邀出席本次会议并分享第三代AI的金融业务新机遇。
一、科技赋能金融迎来新范式
人工智能发展到今天,已经从“量化”进入到“质变”阶段,但回顾对比金融领域与AI技术的发展,科技对金融领域的赋能只是实现了数据的拉平与补充,AI算法真正意义上的突破并未出现,刘荔园表示,当下这一时间点正好为更新、更前沿技术的应用落地提供了契机。
目前金融业务场景中采用的技术大多是全监督学习,但这存在一大前提条件,就是需要有标签高质量的数据,需要知道对应的客户是好是坏且需要非常大量的数据,才能够训练模型。但在实际业务场景中,数据的表现形式大多是缺乏标签,甚至样本量非常稀少,如果仅仅依赖于全监督,很多问题显然无法解决。
依托清华大学在人工智能领域深厚的技术沉淀,基于以贝叶斯深度学习为核心的第三代人工智能技术,RealAI实现小样本、无监督以及半监督学习,打破全监督的范式框架,为解决营销风控等传统金融业务难题提供了新思路:
●业务冷启动:传统解决方法是依赖专家的业务经验制定冷启动的评分卡,但在完全崭新的业务场景,或者原有的业务经验无法有效迁移的情况下该方法无法应用,小样本建模就凸显出优势;
●表现期不够:传统解决方法是等表现期足够,所有样本搜集完标签后再应用全监督方法,根据不同业务需求可能需要等12个月或6个月,但采用半监督学习,哪怕只有部分标签也可以解决;
●风控回捞:银行放贷时出于审慎的原因可能会去掉大部分客户,但这部分客户不一定就真的是坏客户,如何对这些宝贵流量做二次分析呢?传统解决方法是增加数据源或者拒绝演绎(Reject Inference),但效果存疑,更像“玄学”。RealAI通过弱监督、迁移学习、稳定学习的方法,实现从拒绝场景中回捞出10%的群体,该部分资产的质量表现跟通过客群的质量表现一致,帮助金融机构在风险可控的情况下,有效提升资产规模。
二、第三代人工智能的提出
小样本、无监督、半监督的学习方法技术本源上来自于清华大学人工智能研究院院长张钹院士提出的「第三代人工智能」,刘荔园介绍到,当前以深度神经网络为代表的第二代人工智能存在结构性缺陷,在数据知识缺乏、非完全信息、不确定性等场景下存在局限,在自动驾驶、金融业务等实际应用场景中,进一步发展面临很大的问题。
为此,清华大学提出“后深度学习时代”的概念,提出发展安全、可靠、可解释的第三代人工智能,融合贝叶斯学习和深度学习的技术优势,支持对结构化的先验信息做建模,让决策过程更接近人的思维方式,同时支持对经验信息做更精确的描述,为处理不确定信息、提高可解释性等提供新方法。此外,基于领先的AI对抗攻防技术提高深度学习模型的鲁棒性与安全性。
三、第三代AI下金融业务的新突破
从金融业务本身来看,第三代人工智能技术的出现为金融业务带来了全新突破:
突破1:模型上线效果靠祈祷
以往建模利用全监督做的只能是有偏模型,跟上线的使用场景存在本质区别,所以经常会有模型训练效果KS 40,上线验证之后KS 只有20。所以今后也不用祈祷上线效果跟建模效果一样好,本质上两者是不同的东西,效果本身就不可控。
传统基于全监督学习的模型为有偏模型,只依靠通过域的样本,产生幸存者偏差,回捞效果差,RealAI无偏算法则可以有效解决幸存者偏差问题,最大程度上进行模型纠偏,回捞更多的优质客户,助力资产翻倍。
突破2:特征工程是登上诺亚方舟的“旧”船票
在现有技术瓶颈的限制下,人们需要通过特征工程来解决建模问题,但特征工程不仅耗时耗力,还极度依赖经验,局限性很大。RealAI新技术栈则可以使用底层原始数据一键建模,省去特征工程环节,大幅节省时间成本。
突破3:解救黑盒,刻不容缓
传统的xgboost等树模型拟合效果优异,但其决策过程为黑盒,结果不可解释。基于RealAI第三代人工智能技术可以实现将模型由“黑盒”转成“白盒”,输出模型层面与实例层面的解释,为业务人员提供充分的决策支持。
突破4:算法病毒崭露头角,你的脸安好吗?
目前主流的AI人脸识别技术存在安全漏洞,犯罪团伙可利用技术隐患进行骗贷等欺诈行为,造成企业财产损失,RealAI防御技术“AI防火墙”则可以有效识别、拒绝该类攻击者。
四、未来AI将持续快速迭代
对于未来人工智能的应用发展,刘荔园认为,未来AI技术将持续高效稳健增长,行业AI化进程将进入摩尔加速阶段,自研算法、可解释性、攻防安全将获得更高程度的关注度。此外,未来人工智能行业将由“数据时代”迈入“算法元年”,过去大家认为数据重要、算法不重要,但未来AI算法将帮助肃清整个技术环境。
最后,她强调道,过去的问题都是“劣币驱逐良币”,未来“良币”的优势将逐渐凸显,行业整体水平将得到大幅度提升,竞争优势突显。