您当前的位置: 政策发布  >  政策分析 > 正文
课题组:基于AI决策的财务监控预警平台构建及应用

「摘要」财务监控预警平台在AI决策领域做出有益探索,利用数据重塑了财务费控的形态,从人控转型为数控,从现场监督转型为在线监督。本文从农发行财务风险监控预警领域切入,分析财务数字化转型的内生需求,重点介绍财务监控预警平台的构建及应用,并从费用标签构建、风险形态识别、政策文本挖掘、用户行为分析等方面对财务职能转型进行了探索研究。

「关键词」财务监控预警平台 AI决策 大数据 财务风险画像

当前,银行业的财务可持续性受LPR贷款基础利率长期阶梯状下行、全球贸易摩擦、多边贸易政策变化等外部不确定性因素的影响持续承压,银行利差不断收窄、ROE持续下滑、财务压力持续增大。在此背景下,如何通过数字化和智能化技术,辅助农发行守住财务底线,增强财务风险管理能力,并进一步提升自身财务可持续,是亟待探讨和研究的课题。通过建设财务监控预警平台,以数字赋能农发行财务费控,可推进财务实现精细化管理、优化业务决策且加强内部风险控制,服务农发行高质量发展。

一、财务监控预警平台的建设背景及意义

财政部发布了《会计改革与发展“十四五”规划纲要》,《纲要》中提出会计职能要实现从传统的算账、记账、核账、报账功能向价值管理、资本运营、战略决策辅助等职能转型升级。农发行“十四五”发展规划明确提出依托大数据和人工智能等技术建设财务监控预警平台,实现财务分析和风险监控。在规划对财务费控提出数字化转型外在要求的同时,财务监督工作反映的一些深层次问题,也揭示了内在的智能化需求,如:业务财务未实现真正的融合统一导致业务违规而财务合规的风险问题;过分依赖于人为判断识别财务异动、可疑、逻辑不符和虚假不实而导致的信息滞后性;账务影像数据的标准化供给和数据分析处理之间衔接性、关联性不足的问题等。上述问题的解决,均需要通过“技术+数据”驱动,充分发挥数据要素作用。随着农发行“数云融合”“数智融合”的企业大数据服务体系日渐成型,人工智能(AI)、决策引擎(RE)、商务智能(BI)、专家知识库(ES)和工作流(WorkFlow)等技术开始深度应用并创新融合,已形成完整的决策智能技术架构,能够较好地应用到财务风险识别、监控、决策、处置、反馈等流程,为推进财务风险管理数字化和智能化创造了有利条件。通过推进财务监控预警平台建设,可赋能财务实现精细化管理、优化业务决策且加强内部风险控制。其中,在财务智能化方面,利用回归模型,构建公共费用和宣传招待费用预测探索模型,预测机构-月份维度的费用情况,挖掘季节性或事件性差异。在财务决策方面,利用决策引擎搭建决策预警规则模型,基于聚合算子灵活构建风险评估指标,将风险特征规则化。在财务价值挖掘方面,结合财务数据蓝图规划,构建财务价值门户,支持数据可视化、灵活查询、上卷下钻、场景联动等分析功能。在财务知识发现方面,打造财务知识库支持财务费控知识管理和发现,包括合规政策库、监督事项库、预警规则库,实现财务知识统一维护、分类存储和全行共享。在财务监督方面,基于工作流,完成风险信号、合规单生成和下发等财务风险管理工作流配置,形成风险管理闭环。通过持续深化AI决策在财务监控预警的实践并推广至财务会计、管理会计的过程管控和决策支持,也可推动业财一体化,提升内部财务管理水平,提升经济效益。

二、财务监控预警平台的构建

财务监控预警平台的构建以问题为导向,以技术为驱动,以赋能业务为归宿,遵循“一体两翼六化”的建设思路,设计和确定平台的技术架构和数据架构。

(一)建设思路

在财务监控预警平台建设过程中,采用了“一体两翼六化”的建设思路,即以大数据为主体,机器学习和决策引擎为两翼,围绕智能财务和财会监督体建设,探索大数据、决策引擎、机器学习等智能决策技术在财务监控预警领域的实践和应用,以期通过数据化、智能化、流程化、场景化、价值化和知识化,促进财务可持续发展。在财务监控预警平台建设中,围绕“一体两翼六化”的主线,以大数据技术的Spark、Hive、ClickHouse为核心组件,构建了数据存储、处理和加工的底座;以决策引擎的指标、规则和决策流为核心功能,构建了基于规则模型的全生命周期智能决策能力;以人工智能平台的自动机器学习及模型训、管、用为核心功能,打造了AI模型构建全流程低代码能力;同时针对数据化、智能化、流程化、场景化、价值化和知识化的“六化”目标,除采用大数据和人工智能技术外,同时引入了商务智能、工作流、知识库等技术,进而实现数据价值的挖掘、知识的沉淀和预警信号的流程化处理。

(二)技术架构

财务监控预警平台整体分为三层(如图1所示),分别为数据层、平台层、应用层。数据层承载数据集成、数据建模、模型分层、数据聚合、宽表加工和数据同步等能力,即“一体”部分。平台层承载规则模型、工作流、数据分析、可视化、作业调度,以及预测模型的特征提取、模型训练、模型测试、模型上线、服务发布等能力,即“两翼”部分。应用层承载成本动因分析、预警信号展示和处理、归因分析、预警规则管理、知识库管理等能力,即“六化”部分。

 

1.数据层。主要完成数据集成、数据建模、模型分层、数据聚合、宽表加工和数据同步。基于Hadoop、Spark、Hive和ClickHouse等组件,提供集群、作业和数据等管理的一站式大数据处理分析服务;支持创建Spark、Hadoop、Hive、Spark SQL和Shell等丰富的作业类型,实现财务管理系统、影像内容平台的数据采集,贴源、整合、集市等各层数据存储,数据模型计算和作业调度,以及财务AI模型、规则模型计算等;该层完成了机构、科目、COA段值等主数据的标准化映射和还原,同时围绕主数据完成了贴源层、整合层、宽表层数据的加工。

2.平台层。主要包括智能决策和人工智能两个部分。智能决策主要功能模块包括场景管理、指标管理、数据管理、规则管理、模型管理、决策流管理等,提供策略自定义配置、测试、发布上线全生命周期管理,提供专家规则、评分卡、规则流等决策模型,实现从传统决策走向深度应用AI的智能决策,可辅助开展不同业务场景的决策支持。人工智能主要功能模块包括财务费用预测模型的特征提取、模型训练、模型测试、模型上线、服务发布,为AI 应用提供各种特征工程、训练、评估、测试、上线的工具,以及AI应用开发、运行、管理的编译器、调试器、应用编程接口(API)和服务,同时高效管控各种硬件和软件资源并调度程序运行。

3.应用层。根据依赖关系分为数据、知识库、规则模型和数据分析四个模块。数据模块提供本地数据导入、用户行为数据采集等功能。知识库模块支持参数管理或业务积累的各种监控经验的分类汇总,并形成参数管理、基础知识管理、预警知识管理、可视化知识管理等4类库。规则模型模块实现费用管控的预警归因分析和预警规则库管理。归因分析是基于科目费用对应的作业动因和业务动因构建多元线性回归模型和AI模型,根据模型拟合结果确定显著动因排名和影响权重。预警规则库则结合业务流程划分为监督规则库和通用规则库;预警规则模型均是基于标准化费控数据和衍生预警指标数据,结合知识库管理层的预警规则逻辑,在会计科目维度实现预警指标的创建、规则逻辑的配置、模型效果的测试,实现预警规则模型规范化管理、模型化调度。数据分析层模块以场景费用分析为导向,基于数据标准层的可视化数据,包括标准化费控数据、成本动因数据、费控标杆数据和模型预警数据,实现多维图表的可视化联动、上卷、下钻和切片分析,以及预警信号的流程化管控。

(三)数据架构

财务监控预警平台三个层通过接口调用、数据集成、数据同步等方式实现了数据的定向流动和共享(如图2所示)。数据层(EMR)提供财务管理系统、影像内容平台、管理会计等源数据的采集和加工,为智能决策和模型运行提供数据和计算资源。平台层的智能决策模块(IDSS)主要用于构建风险预警规则库,利用财务管理、管理会计等系统的数据,建立一套完整的业务指标、规则预警体系,对潜在财务风险和疑似合规问题进行预测;人工智能模块(DUBHE)提供数据处理、特征工程、模型构建、模型发布和模型自学习等功能,支持财务数据的价值探索,实现从原始数据到模型构建,再到模型应用的价值提升闭环,并通过模型自学习保障稳定的模型效果。

 

财务监控预警平台定时将财务管理系统等数据源的业务数据通过数据交换平台抽取到数据层,数据层将加工好的集市数据通过接口同步至人工智能模块、智能决策模块和OLAP分析数据库ClickHouse;人工智能模块和智能决策模块将模型推理结果通过ETL同步至ClickHouse;最后由应用层的商务智能工具(BI)进行统一分析、展示和预警。

三、财务监控预警平台的应用场景

财务监控预警平台所具备的数据处理、数据分析、模型构建、流程控制、知识管理的能力在多个财务费控的场景得到应用,并产生了积极的效果。从业务视角看,支撑了机构、员工、供应商分析等基础场景,战略成本投入、重点战略支持、财务可持续等战略场景,财务规定落实、主责主业履行等管理场景,人员费用、折旧摊销、公共费用等动因场景,公共费用、宣传招待费、车辆维修费等预警预测场景,合规政策库、监督事项库、预警规则库等知识管理场景,业务分析场景均可以实现从目标费用层层钻取,直到最细粒度的标准化费用数据。主要场景介绍如下:

(一)基础画像

基于机构、员工、部门、供应商等COA段值确定的具体费控对象,利用描述性统计方法计算某段时间内的费用发生额合计数、最大最小值、均值、中位数、均值、标准差、四分位数等数据指标,以及费控事件发生次数的频率统计。利用近5年费用历史数据,对群体费控对象的集中度、费用使用效率的概貌进行可视化分析,支持管理行多维度、多视角及时掌握财务费用情况的基本面。

(二)对比画像

主要包括同级别横向对比、子级别占比分析和基于费用标杆的合理性分析。同级别横向对比、子级别占比分析包括机构层级、业务条线和财务科目交叉划分的各对比分析情景,涉及的对比分析内容包括不同形式的绝对值费用横向对比分析和费用占比的分布对比分析。具体费用数据的展示逻辑包括以年、季、月为单位的汇总费用、平均费用、中位数费用、同环比指标等。费用标杆的合理性分析贯穿到上述对比分析和占比分析的每个情景中,费用标杆分为同级平均费用、预算金额、行业标杆三类,并支持费用标杆融合到以上全部对比分析情景,供业务人员参考比对。

(三)占比画像

占比画像是对子级别进行费用占比分析,即子级别数据占其父级别数据的比例,如上级科目下的直属子科目数据占比、某条线下某机构的部门数据占比、总行下区域数据占比、总行下分行数据占比等。涉及画像对象为机构、业务条线、业务部门、财务科目、供应商、员工等;计算方法是画像对象费用除以同类型同等级对象的该费用合计。

(四)趋势画像

主要包括费用变动趋势分析、同环比增速分析和基于费用标杆趋势合理性分析。费用趋势分析和同环比增速分析包括业务场景、机构层级、财务科目三个段值交叉产生的对比分析情景,涉及的趋势分析内容包括自由设定历史期限长度和年、季度、月不同时间单位的汇总费用、人均费用、中位数费用的绝对值数值分析和对应时间单位的同环比增速费用数据分析。费用标杆趋势合理性分析贯穿于以上趋势分析的每个情景中,费用标杆会以相同的时间单位按照时间序列的方式嵌入到各分析情景的图表中,供业务人员参考比对。

(五)成本动因画像

基于业务场景和财务科目梳理的成本动因列表,构建多元线性回归模型,然后基于应用层规则模型模块的回归模型结果数据,分析成本动因正负方向(动因系数)和各动因对费用的影响权重(回归系数),并将模型显著性F检验和回归系数显著性t检验转换成是否有效的标签,同时支持对标签的可视化展示和钻取。

(六)偏离度画像

费用偏离度分析是基于最新一期费用数据和对应科目的成本动因数据情况,判断其在历史费用和历史动因的分布情况是否存在偏离。计算逻辑为考虑当期费用和对应动因与上一期的偏离程度,其计量单位为时间序列上的历史费用数据和对应动因的标准差,并将偏离程度按对应标准差的绝对值倍数排序,且保留正负变动方向,方便业务人员参考。

(七)风险预警画像

风险预警分析是基于风险预警模块对风险信号的识别和汇总,进行描述性统计分析、对比分析、占比分析及趋势分析,进一步判断风险状态,为管理层采取因应对策提供直观的参考依据。预警画像主要统计机构、条线、部门、科目、供应商、员工出现预警信号的次数、等级分布、类型分布以及合规单下发次数和反馈数量。

四、持续提升财务监控预警效能的思考

财务监控预警平台在AI决策领域做出了一些有益探索,利用数据重塑了财务费控的形态,从人控转型为数控,从现场监督转型为在线监督。为了进一步推进数字赋能,可以从以下四个方面持续优化:

(一)基于标签与特征的费用事项预警

将平台前期积累的异常费用事项进行汇总,形成附带异常标签的费用数据,进行监督学习。基于信息熵的增益、增益率、基尼指数等信息进行费用特征的判断,筛选出能够区分“是否违规”的关键特征,并作为已学习到的知识,纳入机器学习模型。当新的费用事项产生,可以根据已知的关键特征及其取值,预测还尚未形成预警信号的费用事项是否违规、违规概率大小、具体触发违规的特点等,使得风险预警的时间充分提前,将违规事项扼杀在摇篮中,前置费用风险处理,降低费用风险带来的损失。重要的违规特征集合还可结合业务情况做进一步分析,有助于管理者扩大监督覆盖面,进行全面风险识别。

(二)基于聚类算法的风险形态识别

分别以费用事件、机构、个人作为分组的依据,根据已有数据中包含的特征,运用聚类算法(如基于距离、基于密度、基于层次的聚类算法),将相似的样本进行聚合,得到数类各不相同的聚类类别。通过分析聚类后各类样本的特征,如机构人均费用水平、费用高频类别、费用发生时间密度等,归纳总结出风险立体面,有助于重点观察异于一般水平的类别,或各项特征水平较为正常但风险积聚效应巨大的类别,便于管理人员进行全面风险识别与报告。特定类别的特征,如地区聚集性,可以显著展现违规事项高发地区情况,将有效帮助预算及政策制定者进行地区针对性调整。

(三)基于文本挖掘的政策规定提炼

利用文本挖掘技术,在费用新政策规定出台后,进行文本挖掘,提取出费用规定的关键主题和条例,识别政策变化点及新增点,通过比对新旧政策差异点,自动更新已有规则,避免人工维护的时效问题;将冗长的政策提炼为具体的要求和阈值,提升财务费用管理人员的政策落实的工作效率;将行内外各类政策规定进行统一分析,可从海量文字中概括政策的重点关注范围、场景,对于未形成具体规则的情况,对于管理人员而言,不失为对已有管理体系、知识体系深化补充的有效方式。

(四)用户操作埋点和行为数据分析

以具体费用使用人的视角作为切入点,模拟仿真用户在使用财务监控预警平台时的行为与心理特点,如频繁点击模块、模块停留时长、模块点击路径、功能点击频率、单个规则试算次数、删除规则次数、发布新规则次数及频率等,对平台用户的各类行为数据进行埋点;或模拟“规则攫取”用户的心理特点,着重记录为反向推断出规则阈值而重复试验规则的行为,将用户使用心理及行为结合,及时发现用户异常行为,并重点关注具体用户、机构的后续费用事项。