您当前的位置: 政策发布  >  政策分析 > 正文
农发行主数据管理研究和实践

摘要」目前我国数字经济发展从技术引领进入到数据驱动的新阶段,数字化转型是当前金融机构面临的一项重大挑战和机遇。数据治理是实现数字化转型的必由之路,本文从数据治理的主数据管理领域入手,阐述主数据管理的重要意义及主数据与数据治理各领域的关系,剖析农发行主数据管理现状,研究确定主数据管理的主要思路,论述主数据物理模型制定情况,分析面临的问题并提出解决措施,进而推动业务、技术应用实践,从治本上发力,全面提升数据质量。

关键词」数字化转型 数据治理 主数据管理 数据架构 数据标准

2020年4月9日,中共中央、国务院正式发布《关于构建更加完善的要素市场化配置体制机制的意见》,首次将数据升格为继土地、劳动力、资本、技术之后的第五大生产要素,并提出要加快培育数据要素市场。2021年12月12日,国务院印发《“十四五”数字经济发展规划》,明确数字经济是继农业经济、工业经济之后的主要经济形态,是以数据资源为关键要素,以现代信息网络为主要载体,以信息通信技术融合应用、全要素数字化转型为重要推动力,促进公平与效率更加统一的新经济形态。数字经济发展速度之快、辐射范围之广、影响程度之深前所未有,正推动生产方式、生活方式和治理方式深刻变革。在金融领域,2018年5月21日,银保监会发布《银行业金融机构数据治理指引》,要求银行业金融机构加强数据治理,提高数据质量,充分发挥数据价值,提升经营管理水平,全面向高质量发展转变。农发行作为我国唯一一家农业政策性银行,不论从加快业务发展,提高综合竞争力,还是满足监管数据报送要求来看,都面临巨大的挑战,必须加快推进数据的基础性研究和管理工作,进一步提升全行数据治理水平。

一、主数据的内涵及其意义

(一)主数据的概念和主数据管理的重要意义主数据(Master Data)是指具有高业务价值的、可以在企业内跨越多个业务部门或者在多个系统中被重复使用的核心数据,是单一、准确、权威的数据来源,具备共享一致性、识别唯一性、长期有效性、业务稳定性等特征。如客户信息数据是银行开展对客服务的基础,贯穿于整个经营活动的始终,机构和员工信息数据是银行经营管理的最基本组成要素,贯穿于整个组织架构,也是信息系统建设的数据主线和基础。此类主数据如果在业务管理和信息系统建设中缺乏系统性的思维和顶层设计,必然出现系统建设各自为战、数据来源多头采集的问题,导致整体数据的不一致、不唯一、不关联等现象。主数据是企业的核心数据资产,其质量的好坏决定了数据应用价值的高低。主数据的管理是保证源头系统之间、报表系统之间数据一致性、唯一性的重要基础工作之一,对于提升监管报送、夯实内部经营分析的数据质量具有重要意义。从数据层面上看,有助于消除数据的冗余,提升数据质量和数据准确性,实现数据高效共享。从业务层面上看,能够统一各部门对数据定义,减少在数据沟通整理过程花费的人力成本和时间成本,强化数据应用处理能力,提高业务的协同力,提升企业基础管理水平。从技术层面上看,有助于精准识别主本数据,准确、快速地完成系统间数据接口、数据加工等环节的系统开发工作。(二)主数据管理与数据治理其它领域的关系根据行业通用数据治理方法论,银行数据治理体系包括数据标准管理、数据质量管理、元数据管理、数据安全管理、主数据管理、数据架构管理、数据生命周期管理、数据模型管理等8个核心领域。同时各个领域为了保障有关内容有效落地执行,又需要从政策制度、组织、流程及技术等4个方面制定相应的管理机制和技术支持。其中主数据通常长期存在且应用于多个系统,体现业务经营的关键属性,共享且被复用在多个业务领域。结合银行业务,按主题分类,主数据可划分为客户、机构、员工、账户、产品等内容。主数据的管理可以理解为是对企业级的业务架构、应用架构、数据架构、数据标准、数据模型、元数据中最为主干和关键数据进行的专项管理,主旨在实现核心数据的业务语言统一、数据的合理分布和流转,满足跨部门业务协同需要,保证关键数据的准确和一致。

二、农发行主数据管理现状

在银行信息化进程中,内部保持主数据一致性、准确性和权威性是银行实现决策分析、提升战略协同的前提。这既是企业级战略的核心,也是数字化转型的关键支撑,影响着利用数据的效率和数据价值发挥的程度。从国内外银行业来看,大多数银行系统建设都经历了从分散到集中的过程,数据也同样经历了冗余、不一致、不准确等过程,但随着战略驱动,业务管理、信息系统加强顶层设计和重构,数据也同样随之逐步驱向统一。

农发行与同业相似,在发展初期因缺少企业级业务架构、数据架构的指导,存在部门银行现象,系统建设业务牵头部门间缺乏整体设计,各自为政开展系统建设,导致出现数据孤岛情况。如:客户编码数据标准不统一,重要的客户数据在核心、信贷等系统中多头采集管理,客户数据相互打架,信息难以互通共享;机构、员工编码数据标准不统一,不同系统各自编码,信息难以互通共享。经过IT信息规划的发布与实施,以及数据治理工作近年来持续推进,特别是随着新一代核心系统、新一代信贷管理系统、运营大集中系统等农发行“两弹一星”重大项目群建设实施,各系统间的客户、机构、员工等关键编码数据在技术上已基本上实现互联互通,全行数据治理意识和数据质量明显提升。

但在企业级架构规划中面临着业务架构没有主管部门,权威性和指导性不足,应用系统建设周期短、自主可控水平不高以及业务、技术、数据融合不足等因素的制约,仍有部分重要主数据问题需大力推进互联互通,减少多头采集,在“有没有”的基础上进一步向“好不好”迈进。如:客户信息管理系统(ECIF系统)没有对客户的很多公共属性全部统管,存在多头采集且未同步,导致数据不一致性,难以关联;部分主数据的字段在源头系统缺失,监管报送数据抽取不到,手工补录增加基层负担;对源头系统的取数来源口径存在认知上的差异,部分数据取数需要“多方拼凑”,导致加工逻辑复杂,引发报表间数据不一致等情况。

三、农发行主数据管理的主要路径

主数据管理研究以农发行信息科技发展规划为参考,以现状和问题为导向,制定和发布主数据物理模型,规范全行主数据管理工作,指导后续源头系统的业务架构、应用架构和数据架构优化,实现主数据即采、即管、即用,提升监管数据报送整体水平。

(一)主数据管理的主要思路

以IT架构规划主数据逻辑模型为基础,结合现有各系统建设现状,从以下五个方面开展研究工作。一是与监管报送要求对标,在充分与系统建设现状比对的基础上,补充监管报送所需的主数据属性,覆盖EAST、1104等监管报送需要。二是结合IT架构规划数据分布和系统建设现状,开展主数据逻辑模型的字段级物理化工作,精确定位和明确各字段所属源头系统。三是结合各系统架构定位和数据转流情况,厘清主数据管理边界,为推动源头系统优化和数据同步、减少源头系统数据一致性问题提供依据。四是梳理主数据字段所对应的数据仓库供数表和字段参考,为下游提供取数指南,减少数据应用类系统取数来源不统一导致的问题。五是规范全行主数据管理,形成良性闭环管理机制。

(二)主数据物理模型总体制定情况

为进一步强化主数据管理,提高全行精细化管理水平,统筹兼顾银行数据架构规律、覆盖监管报送范围需要,结合农发行系统建设实际,信息科技部研究制定了“农发行主数据物理模型”(见图1)。该模型涵盖了农发行机构、员工、客户、科目、产品、账户六大主题,共计439个字段,涉及客户信息管理(ECIF)、人力资源、机构员工、信贷、内部评级、核心、总账、反洗钱、小微智贷、客户关系等10个源头系统。该模型厘清了主数据管理的边界,包含了目前监管报送所需的主数据字段,明确了字段级的主数据权威来源系统、数据仓库供数层信息,为解决主数据的业务管理边界不清、系统间数据一致性问题、提升监管报送数据质量提供基本遵循。

 

(三)六大主数据物理模型制定具体情况和划分原则

结合主数据管理方法论和监管有关指导性文件,明确主数据分布和数据流转要求,指导主数据物理模型制定和落地实施,确定三项原则:一是由频繁使用数据的应用系统作为主本数据源;二是由共享数据的应用系统作为主本数据源;三是由产生数据的应用系统作为主本数据源。三项原则中按前序原则优于后序原则研判使用。按照三项原则,结合业务和系统建设情况,明确了农发行机构、员工、客户、科目、产品、账户六大主题的主数据字段的来源和主数据系统的划分,并分析系统的承接现状。

1.客户主数据物理模型字段的来源和划分。客户主题下共制定258个关键字段,来源于已纳入客户信息管理系统(ECIF系统)统一管理的客户编码等113个客户公共信息字段,在此基础之上补充目前仍在不同系统多头采集的客户状态等40个客户公共信息字段、以及监管报送和行内经营分析所需的105个字段。明确客户信息管理系统(ECIF系统)是农发行客户信息跨多部门、多系统被重复使用的客户公共信息数据权威主数据系统,统一管理客户的基本信息、联系信息等主数据。由信贷系统、内部评级系统等承接客户授信、财务报表、集团信息等专业信息的主数据。

2.机构、员工主数据物理模型字段的来源和划分。机构主题下共制定33个关键字段,来源于机构员工系统和人力资源系统已经实现对接的公共信息字段,在此基础之上,补充目前2个系统仍在多头采集的公共信息字段、以及监管报送和行内经营分析所需的字段。员工主题下共制定52个关键字段,来源于机构员工系统和人力资源系统已经实现对接的公共信息字段,在此基础之上补充2个系统仍在多头采集的公共信息字段,以及监管报送和行内经营分析所需的字段。明确人力资源系统与机构员工系统都有的机构、员工公共信息字段以数据的全集机构员工系统为主数据系统,其它字段根据专业领域划分,分别由机构员工系统、人力资源系统、核心业务系统承接主数据。

3.产品主数据物理模型字段的来源和划分。产品主题下共制定16个关键字段,来源于行内经营分析、监管报送使用较频繁的重要基本信息和条件信息字段。明确贷款基础产品、贷款营销产品以信贷系统为主数据系统,贷款核算产品和存款产品以核心业务系统为主数据系统。

4.科目主数据物理模型字段的来源和划分。科目主题下共制定21个关键字段,来源于监管报送需要的字段以及行内经营分析需要的字段。明确核心业务系统承接科目级别、类型、状态等科目定义类相关字段的主数据,总账系统承接科目余额、发生额等汇总数据结果相关字段的主数据。

5.账户主数据物理模型字段的来源和划分。账户主题下共制定59个关键字段,来源于行内经营分析、监管报送需要的贷款、存款、内部和资金账户关键字段。明确以农发行贷款账户、存款账户、内部账户和资金账户等四大主要账户实际的业务承接系统确定主数据系统。

(四)主数据管理面临的问题及整改措施

在农发行主数据物理模型制定过程中的数据探查以及数仓、监管集市在日常加工处理中发现监管报送数据质量的一些深层次问题,主要集中在客户、机构、员工等领域的相关数据,主要表现在以下几个方面。一是主数据系统信息缺失。如:客户信息管理系统(ECIF系统)缺少同业客户企业规模、国民经济部门等监管报送字段,此类数据源头无采集入口,加重基层行在报表系统重复补录负担。二是公共信息数据已纳入主数据系统管理,但在系统间仍未互联互通,数据不一致。如:客户的经营范围、联系电话、注册资本等字段各系统采集数据后未与客户信息管理系统(ECIF系统)保持数据对接和同步。三是主数据系统对公共信息数据管理不全面。如:监管报送用到的法人代表名称、证件种类、证件号码等部分字段在信贷、核心等系统各自为政、多头采集,未纳入客户信息管理系统(ECIF系统)统一管理。四是校验刚性控制规则覆盖不全。如:数据录入环节对空值、长度、格式、逻辑等刚性控制功能不全面,不符合监管报送要求,自动抽取的数据需基层行在报表上手工调整等。

对于主数据物理模型制定过程中发现的相关问题,初步已拟定了相关整改措施。一是针对主数据系统信息缺失问题,明确人力资源、机构员工、客户信息管理、信贷、综合前端、运营大集中等系统增加相关监管要求报送的字段和采集入口。二是针对公共信息数据已纳入主数据系统管理,但在系统间仍未互联互通问题,明确了客户信息管理(ECIF)、核心、信贷、小微智贷等系统间数据的同步要求和数据优先级更新规则。三是针对主数据系统对公共信息数据管理不全面问题,明确了机构员工、客户信息管理(ECIF)等系统需增加纳管相关公共信息字段。四是针对校验刚性控制规则覆盖不全问题,以监管报送校验要求为导向,形成了客户、机构、员工相关源头系统刚性控制规则,要求相关系统对照排查并进行控制功能的优化。

四、主数据价值展望

主数据的研究成果重在落地实施,下一步要以主数据物理模型的落实为抓手,推动农发行业务架构、应用架构和数据架构的优化,提升数据精细化管理能力,为实现监管报送和行内经营分析数据的一致性、完整性、规范性奠定坚实基础。

(一)充分认识加强主数据管理的重要意义

健全自上而下、协调一致的数据治理体系至关重要,要将主数据管理纳入全行数据治理,完善覆盖业务需求提出、系统开发测试、生产运营管理等数据全生命周期各环节的工作机制和流程,确保主数据管理有效组织开展,推动全行数据质量持续提升,切实将主数据的管理作为提升农发行精细化管理水平和现代化治理能力的重要举措。通过主数据管理和实施,提升数据的完整性、准确性和一致性,加强“以数连接”的系统互通能力,提高“由数驱动”的部门协作能力,提升“用数重塑”的创新驱动能力,塑造全行数字化、智能化业务形态。

(二)建立全流程主数据管理机制

建立事前、事中、事后的主数据管理机制,在事前制定主数据标准和数据质量标准,业务信息采集相关的业务制度、操作规范,强化系统架构设计和控制功能。在事中数据采集、加工过程中,聚焦主数据持续做好数据质量监控,通过数据管控平台部署数据质量监控规则,确保数据质量问题及时发现、及时预警、及时整改。在事后重点关注问题产生的源头及根因,建立“精准定位、分层管控、溯源治理”三个步骤,强化“以数治数”,形成主数据管理数字化运营机制。

(三)增进主数据管理工作协同配合

主数据管理是从企业战略和IT战略的目标出发,对企业级业务架构、应用架构、数据架构等最核心、关键的数据进行识别和管理,离不开业务、技术的有效融合、协作。因此要完善数据治理组织架构,建立敏捷数据治理组织,在业务条线、科技条线分别设立跨职能的数据治理团队,加强各部门、各条线横向协同、纵向联动,在业务需求制定、架构管控实施和系统建设各环节,将业务流程优化和数据主副本互联、一致、共享作为数据治理重点之一,形成“协同治数”格局,从而减少系统间的信息孤岛和烟囱式建设。 

(四)切实加强主数据质量的管理

在推进主数据模型实施时,做好系统新增字段实施、系统间数据对接的同时,要保证各系统互联互通后增量数据的一致,同时要开展存量数据的清洗、转换和补录工作。在系统建设阶段,根据实际情况多措并举实施主数据模型,统一系统间交流的“业务语言”,切实保证主数据在系统间业务定义一致、数据有效连接。在日常运营阶段,建立数据质量评价模型,发现主数据的质量问题,按照数据质量管理流程及时进行整改,优化数据质量控制机制,持续开展主数据质量的监测、整改与考核工作。

(五)充分发挥主数据业务价值

充分利用主数据管理和实施成果,强化数字思维、培育数字文化、提升全员数字素养,驱动全行业务管理进一步规范化、流程化和制度化,迭代对主数据进行丰富和完善,统一客户、机构、员工、产品等全景数据视图,实现各类监管报送、行内经营分析等工作提质增效。同时有效与工商、税务、司法、同业等外部数据实现关联、识别,开展大数据领域的数据分析,拓展农发行在客户营销、客户授信、风险管控、运营优化等智能分析领域和数据挖掘业务场景,充分发挥数据价值,持续推动农发行向全面数字化转型迈进。