智能风控平台AI多模型融合技术实践方案
所属单位:中金支付有限公司
参与奖项:AI科技进步奖
评委评分:
热度 (转发微信朋友圈或群可以帮助增加热度)
微信扫码分享此评选

中金支付运用AI多模型融合技术自主研发建设了客户交易风险监测智能化平台(以下简称“平台”),集数据处理、特征计算、推理分析和预警输出为一体,依托大数据及人工智能技术,准确、快速地甄别风险交易,还兼容了反洗钱大额、可疑交易报送、客户评级管理、名单回溯的合规报送及管理职能。

平台基于客户主体信息、交易流水以及外部非结构化数据,使用数据清洗、关联分析等知识抽取技术,充分提取客户、交易关键要素及其关联关系,依赖强大的AI推理引擎,对客户的属性特征和交易特征进行高效计算,采用多种人工智能模型对多维数据进行挖掘,提取数据潜在的深层特征,并充分运用专家经验,灵活配置风控规则,对不同风险进行分类分级监测,帮助风控人员制定风险决策,实现了实时拦截、限额管控、人工审核等处置措施,从而有效地提高反洗钱反欺诈的风险管控水平和业务效率。

方案背景

随着互联网金融欺诈手段的不断升级和内外部环境因素的影响,互金行业反欺诈反洗钱工作面临的挑战日益严峻。一是近年来支付行业业务模式不断创新,不法分子通过多方联合,利用移动支付的便利性转移非法资金,各种洗钱方式层出不穷。二是随着互联网支付行业蓬勃发展,欺诈犯罪手法层出不穷,为了有效防范各类违法欺诈事件的发生,要求企业不断开发优化线上化、系统化的反欺诈监控技术。人民银行在多个监管文件如261号、49号、163号等均要求企业要充分运用技术手段,强化可疑交易监测,对企业交易欺诈行为进行及时有效地识别与防控。三是监管处罚不断加码,国内反洗钱检查处罚力度加大,国际监管问责从严态势持续加剧,对金融支付领域的反欺诈反洗钱工作提出了更高要求。在此背景下,中金支付运用先进的大数据以及人工智能技术,自主研发建设了覆盖全业务场景的智能风控平台,有效地解决了企业对反洗钱、反欺诈的各类需求。

方案目标

智能风控平台提供了“事前一事中-事后”一体化的风险监控能力,集数据处理、特征计算、推理分析和预警输出为一体,涵盖了从商户入网到交易监测,再到事后处置全流程的监测,为支付业务提供了坚实的安全保障,守护交易资金安全,保证业务合法合规。基础底座是海量分布式数据集市与高性能AI推理引擎。

分布式数据集市对多源异构的业务数据和交易数据进行统一化管理,充分释放数据的有效性。对非结构化数据,使用数据清洗、关联分析等知识抽取技术,充分提取客户、交易关键要素及其关联关系,并通过字段名称转换、字段拉平、数据连接、数据去重等操作进行数据转换,将多源异构的数据转化成统一的结构化数据。

在AI推理引擎方面,智能风控平台运用多种算法,针对不同业务场景建立了不同的人工智能模型,比如周期监测模型、交易突增模型、交易连续性监测模型、移动平均模型等,采用集成策略对多种模型进行融合,减少单个模型的过拟合风险,提高模型的鲁棒性和稳定性。此外,平台充分利用高性能的NVIDIA GPU显卡驱动及CUDA、CuDNN为AI推理提供了强大的算力,利用GPU的并行计算能力,对分布式数据集市中的全业务场景数据进行挖掘和建模,充分发挥海量数据的价值,实现交易风险的全面监测和综合评估。并使用Jupyter进行交互式的数据分析和可视化展示,极大地提升了数据分析、验证和测试的效率。

方案业务流程图

图1智能风控平台示意图

智能风控平台使用数据清洗、关联分析等知识抽取技术,充分提取客户、交易关键要素及其关联关系,计算相应的指标,再结合时序预测等人工智能算法,挖掘数据潜在的深层特征。然后,运用专家经验灵活配置风险规则,进行异常检测和风险打分。最后,对同一机构的不同告警记录进行压缩,避免大量告警造成的信息拥堵,进一步降低告警处理的人工成本。平台打通公司业务系统,风控人员可与业务系统联动制定风险决策,实现了实时拦截、限额管控、人工审核等处置措施。

实现功能展示

1、搭建风控数据集市,筑牢AI基础设施

智能风控平台依托于数据中心(DataCenter)的数据调度和抽取能力,使用DataX技术将各核心支付业务库数据抽取到MongoDB数仓集群,并以MongoDB数仓为基础进行数据清洗,对错误数据、测试数据进行过滤,然后将数据抽取到ClickHouse分布式风控数据集市,并通过字段名称转换、字段拉平、数据连接、数据去重等操作进行数据转换,将多源异构的数据转化成统一的结构化数据。这些治理后的“干净”数据就成为数据分析和数据挖掘的重要原料。数据抽取流程如图2所示。

图2 数据集市数据抽取流程

2、构建人工智能模型,时序分析预测风险

智能风控平台运用多种算法,针对不同业务场景建立了不同的人工智能模型,比如周期监测模型、交易趋势监测模型、移动平均模型等,并采用Bagging、Boosting和Ensemble等集成策略,使用包括平均、加权平均、投票等模型融合方法实现多模型的融合,以获得更准确的预测结果。对于回归预测场景,平台使用加权平均值来确定最终的预测值。对于分类问题,使用投票或加权投票来获得最终的预测标签。

周期监测模型

由于业务类型和交易背景的不同,有些客户的交易是随机的,而有些客户的交易是有周期性的。周期监测模型运用数据差分和自相关分析的方法来识别交易的周期性规律。通过计算序列值与其k阶滞后值之间的相关系数来评估一个序列中各个数值之间的相关性。如果自相关系数在滞后阶数为k及k的倍数时出现峰值,则该序列就是有周期的,且周期长度为k。如图3所示,当滞后阶数为7及7的倍数时,自相关系数出现峰值,这说明当前所分析的交易序列每7天为一个周期。

图3自相关系数示意图

交易趋势监测模型

交易趋势监测模型主要用于交易趋势的突增监测和风险评分,主要包括三个环节:

1)运用周期监测模型对各个机构的交易量序列进行周期性监测。

2)根据机构周期性的不同,通过环比分析、同比分析等不同子模型对交易进行趋势预测,结合当前实际交易观测值产生相应的风险分数。

3)根据各个子模型的性能对其结果赋予不同的权重,通过加权整合得到最终的风险分数。

移动平均模型

移动平均是一种简单平滑预测技术,能够消除随机波动的影响,反映长期的发展趋势,预测未来变量值。智能风控平台部署了以下4种移动平均模型:简单移动平均模型(SMA)、指数加权移动平均模型(EWMA)、自回归整合移动平均模型(ARIMA)、季节性自回归整合移动平均模型(SARIMA)

前三种属于环比分析,适用于无周期特点的交易,最后一个SARIMA属于同比分析,适用于有周期规律的交易。采用不同模型对历史交易值进行分析,可以得到当前时间的不同预测值,然后使用三西格玛准则衡量当前实际观测值出现的概率大小,进一步计算出当前交易的风险分数。

3、AI推理引擎,提高风险处理效率

智能风控平台的AI引擎由规则引擎和AI模型构成。规则引擎包括:规则管理、规则模型、指标计算、规则判断以及规则预警,如图4所示,其中,指标计算和规则预警均与人工智能模型集成,指标计算完成,便进行规则判断,规则判断完成后继续由AI模型深度计算。

图4 AI引擎

方案案例及效果

经典案例

风控平台应用在某知名支付公司的业务监测中:某保险股份有限公司的业务场景为保费缴纳,图4展示了该企业从5月8日到9月5日的交易趋势。周期监测模型识别出该企业的交易具有周期性,且周期为7天,从图中可以看出该企业的交易的确呈现一定的周期性规律,每7天一个周期,印证了周期监测模型的准确性。

该企业在9月5日触发交易突增预警,当天交易笔数为97845笔,之前120天的单日平均交易笔数为35064笔,最大单日交易笔数为70549笔,经计算可知,9月5日交易笔数相比于历史120天的平均值增长了179%,相比于最大值增长了38.7%,经风控人员分析核实,该企业确实存在交易突增风险,足以证明交易突增模型的准确性。

图5某保险股份有限公司的交易趋势图

方案未来展望

智能风控平台有效助力了企业反洗钱、反欺诈相关风险监测工作的开展,下一步,我们将进一步探索人工智能与风控平台的集成能力,重点围绕数据治理和AI模型两个方面进行优化,不断提升智能风控平台的数据分析和风险决策能力。

1)数据治理方面:扩大数据采集范围,丰富外部数据接入,构建持续性的数据质量监测、反馈和提升机制,不断提高数据质量;探索研究联邦学习相关技术,在保障数据安全和用户隐私的前提下,实现数据的安全交互和共享,打造全方位的风险标签体系和客户风险画像。

2)AI模型方面:根据业务需求和应用效果持续优化现有的模型算法,并引入更多有效的AI算法和技术,基于多元化的客户主体数据、交易数据和外部数据,构建金融风控知识图谱,并结合图算法和元启发式算法,针对特定问题提炼出相应的数据特征,建立迭代搜索的智能优化模型,提高风险监控的精准性和敏捷性。

随着多模态海量数据的不断汇聚和AI模型的不断优化,相信智能风控技术一定能为企业的风险监控体系赋予更多的能力,实现更精准、更高效的风险监控,为行业的健康稳定发展保驾护航。