文 | 交通银行信息技术管理部副总经理张漫丽
大数据隐含着巨大的社会、经济、科研价值,已引起了各行各业的高度重视。如果能通过人工智能技术有效地组织和使用大数据,将对社会经济和科学研究发展产生巨大的推动作用,同时也孕育着前所未有的机遇。
在过去的五年中,云计算、大数据及人工智能的发展催生了金融行业的一系列产品和业务模式创新,可以预见,迅猛发展的大数据和人工智能技术未来可能使整个金融环境和交易模式产生彻底性的、颠覆式的改变。2016年,AlphaGo把人工智能推向了风口浪尖,AlphaGo围棋的获胜体现的不仅是人工智能的水平,更是背后云端大数据处理和分析能力的提升。
1.银行转型改革恰逢“大数据+人工智能”全面崛起
近年来,我国经济金融形势都呈现出新的态势,银行业面临经济增速放缓、结构调整加快、化解产能过剩和金融改革等诸多挑战。加上全球金融监管日趋严格、新巴塞尔协议对资本的约束,银行业金融机构面临着前所未有的压力和风险。市场竞争空前激烈,不仅银行之间的竞争愈发激烈,银行与非银行金融机构、类金融机构的跨界式竞争也愈演愈烈。依靠规模和高速扩张的外延式发展方式已严重透支,银行纷纷开始主动或被动地进行内涵式发展转型。
统计显示,全国小微企业贷款覆盖率仅21.6%,还有78.4%的小微企业得不到银行资金的支持。这表明银行服务覆盖的广度、深度还远远不够,仍存在巨大的服务空间。但在规模和效益驱使下,银行基于传统风险和成本考量,仍难以有效开拓维护小微客户。
伴随着高质量的大数据积累,同时得益于强大的并行计算能力,特别是深度学习算法上的突破,人工智能技术近年来全面崛起。“大数据+人工智能”的相关理论与分析方法,很好地弥补了数据获得的时间连续性、数据的地理位置分布、数据样本的覆盖程度等传统分析方法中的不足,其精准度更高、覆盖面更广和响应速度更快的特点,有助于银行优化资源配置,降低服务成本,提高服务效率,丰富风控手段。将其定位为降本增效、提升体验、扩大获客的有效工具,运用到银行运营、营销及服务等业务中将大有裨益。
2.金融同业应用探索
银行是信息密集型服务产业,其数据强度高踞各行业之首——银行业每创收100万美元,平均就会产生820GB的数据,在整体价值、企业平均数据量、绩效波动性、交易密度等方面遥遥领先于其他行业。人工智能所展示的机器深度学习能力让大数据处理呈现了新的方向。
无论是大型银行还是中小股份制银行都开始大范围地尝试通过大数据来驱动业务运营,比如工商银行的大数据风控、建设银行的大数据模型实验室、招商银行利用大数据开展小微贷款、光大银行建立社交网络数据库等。人工智能机器人也走进交通银行、农业银行、浦发银行等各家银行营业网点。2016年12月招商银行强势发布了财富管理应用摩羯智投,推出了中国银行业的首个智能投顾,实例证明金融科技将为金融产业带来新生。
交通银行在业务发展过程中首先积累了海量的客户信息、交易信息等各种信息,具有数据优势;
其次拥有数据仓库处理传统海量结构化数据的经验,经过几年的整合,交通银行数据信息管理工作已经形成了以数据标准制定、数据信息采集、数据信息工具设计、数据信息质量控制为主线的数据集中管理模式,为基础数据信息同源统一提供了基本条件。
加上近年来大数据多维查询、搜索、图计算等技术的兴起,对信息视图多层次、灵活化的诉求提供了有力的技术支持;
最后是IT技术和人才储备相对充裕,具备实施大数据的基本条件和巨大发展潜力,在发展模式转型、金融创新和管理升级等方面充分利用人工智能技术、运用大数据思维更具潜在价值和针对性。目前交通银行也在上述领域进行了探索,并取得了一些成果。
1.建立“顶层设计,自上而下”的创新组织体制
交通银行高度重视金融科技创新工作,2010年就成立产品创新与推进委员会(简称“创新委”),目前基本建立了自上而下分三层的矩阵式创新组织体制,以项目制改革大力推动重点产品创新。
总行创新委是全集团产品创新工作的决策机构,下设公司、零售、同业三个产品创新委员会,并设有创新项目评估与推进委员会,作为集团创新项目评估和推进的议事、协调和决策机构。各省直分行也参照设置了相应创新委员会,统筹分行层面产品创新工作。初步形成了突出重点、分类管理的创新产品体系,建立了重大创新项目、常规创新项目、创新实验项目三大产品创新体系。
首批明确了七项重大创新项目,成立了重大创新项目制改革试点领导小组,出台了指导意见,通过专项团队、专项授权、专项政策、专项资源、专项考核的“五专机制”集中资源重点突破,着力打造品牌产品。同时依托产品创新实验项目机制,总分联合快速研发了二十余项创新产品,经创新产品发布会发布后在各省直分行大力推广,取得了良好的市场反响。
2.依托创新实验室开展大数据和人工智能基础研究
目前,交通银行已依托创新实验室对区块链、人工智能等新兴技术开展基础研究,对大数据、生物识别等已有储备技术开展在金融业的综合应用研究。同时与金融科技企业、高校保持良好的沟通互动,积极开展重点金融科技相关领域的联合创新,建立快速获取新科技并转化为银行产品服务应用的能力。
3.完善大数据平台,促进和支撑业务创新
建设集团统一、数据标准、运行高效、技术强大的数据服务平台。完善大数据应用环境,支持对用户数据进行超百万维度的数据建模,深刻洞察用户的行为和特征,为全新价值点、商业决策以及新业务商机的挖掘提供更加科学、全面的业务支持,为集团经营管理、业务发展和内部控制提供良好的技术支持和服务。
4.整合外部数据丰富银行数据资源,健全客户信息统一视图
联合业务部门及分行共同进行大数据的搜集、整理、存储、分析和应用,全面采集、多方式整合行内外各类有价值数据,增加外部数据业务视图和数据探查功能,为各部门在业务开展过程中查询和使用外部数据提供便利。将金融服务与社交网络、电子商务、移动网络等深度融合,与行内数据形成有效互补,充分发挥外部数据资产价值,实现广义通用的客户信息统一视图。
5.依托大数据技术实现客户行为分析及精准营销
在产品开发、营销方面,通过对客户在交通银行及关联单位的海量交易、行为、及访问足迹数据进行收集、分析和挖掘,科学构建数据模型,使不同层级客户的差异化金融需求可以得到充分展示,进而针对客户需要、市场需求研发产品、开展营销,真正做到以客户为中心进行产品开发设计,实现精准营销,而不是以银行为中心制造、推销产品。通过对智慧感知技术、互联互通技术和智能洞察技术的综合应用,实现对用户的行为感知和需求预测,从而提供新型的主动推送或推荐式金融服务,实现对特定族群的精准营销,提升客户交叉销售率。
6.推进风险管理的精细化
当前银行的贷前授信和贷后监控,无论从深度和广度均有不足,交通银行着重研究银行业风险发展方向和趋势,以大数据思维将现场调查与非现场数据挖掘分析相结合,更加全面地评估客户风险状况,大幅提升贷前风险判断和贷后风险预警能力,实现对潜在风险的及时防控。
首先,结合挖掘的外部数据进行客户关联画像,将企业登记状态、资金、信用、声誉、征信、股东、法人、主要管理人员、控股及关联企业等信息均纳入风险监测系统中,有效提升客户识别及风险预警水平。
其次,依据预先设定的风险指标及已知的风险客户评级,通过机器学习算法进行近似性匹配,完成数据挖掘分析,并依据机器学习的结果,逐步调整指标范围和关联程度,完善机器学习的风险模型及算法,以实现机器学习结果与人工认定结果达成极高匹配为目标,训练出更精准的风险防控模型。
最后,深度挖掘历史数据,并逐步扩展机器学习所涉及的数据范围,做出更专业的判断,使风险识别、防范、决策更加可靠、更加贴近实际。
7.强化分布式架构研究,拓展数据实时处理展示范围
近年来,IT系统面对的数据量越来越大,业务对处理时效要求越来越高,数据量和处理时效的矛盾越来越突出。目前银行传统应用由于在事物一致性方面的要求,基本仍然采用集中式应用架构,但是随着互联网金融的发展,数据分析正在向更多类型的分布式架构和实时智能服务发展,通过实时的智能服务可以支持实时的决策制定。从而最终优化和解决处理数据越来越大、处理时效要求越来越高的问题。
前期已实现的交通银行头寸、销售、授信等信息实时展示获得行内各部门一致好评。搭建的实时数据服务系统专注于处理实时和准实时数据需求,支持CDC、MQ等多种准实时同步技术,尽可能压缩传统业务链条,应用大数据的处理模式,以高实时性的中间数据层为媒介,引入机器学习和数据湖概念,建立效率更高、实时性更强、管理者自定义程度更深的商业智能系统,实现报表的实时化、移动化、定制化。
8.研究和拓展人工智能应用场景
充分利用大数据平台研究成果,结合人工智能在语音识别、语义处理、生物识别、机器学习、专家系统等方面的核心技术,围绕数据跨界融合和深度挖掘进行应用探索,进一步升级和优化大数据平台功能与模型,并重点应用在客户画像、需求挖掘、精准营销、服务质检、智能投顾等环节,为客户提供定制化、智能化、有管控的金融服务,综合提升交通银行服务创新和产品营销能力。
交通银行于2014年6月率先在业内建立了全行统一的生物识别身份认证平台。该平台是以虹膜、人脸、指纹及指静脉等多种生物识别技术为核心的跨平台的、开放的、可扩展的统一身份认证平台,实现了客户身份安全便捷、真实、准确认证。通过与现有业务系统对接,大大提高了客户的满意度、忠诚度和舒适度。目前,人脸识别技术已在全行智能柜、ITM机、个性化发卡机上推广使用,提升身份认证效率的同时,有效挖掘了各个渠道潜在的客户营销信息。
未来,交通银行准备在如下场景拓展人工智能应用:一是结合多种生物识别技术,如语音识别或声纹识别技术,来提高金融中心或客服中心的质检水平和服务质量。二是结合私人银行部多年资产管理经验、大数据分析及人工智能技术研发智能财富管理系统,为中产阶级客户提供更加全面和优质的投资顾问服务,提升客户忠诚度及黏度。三是通过人工智能技术和大数据风控,将曾经繁琐的业务审批流程自动化处理,通常数十秒即可完成,其中超过85%的审批都不需要人工操作,纯自动化实现。
1.面临的挑战
(1)虽然银行经过多年数据仓库建设对信息、流程及渠道进行了全面整合,构建了统一的数据标准和信息模型,但目前的数据结构基本上是条块分割的,“线下为主”的体制对互联网数据价值的不适应,数据规划、清洗和标签不尽合理,将这些数据进行大数据分析,现实情况下仍不尽如人意。
(2)客户行为偏好数据往往隐藏在海量的移动网络设备及社交网络之中,现有银行系统难以有效分析和利用。最好的行为数据在BAT,但BAT不会与银行分享。目前主流的数据源供应模式包括传感终端、互联网、政府机关、运营商等,主要是以数据为产品输出,不涉及数据的分析处理,但信息安全的政策风险较高,市场空间有限,特别是《中华人民共和国网络安全法》将于今年6月1日起正式生效,为涉及客户隐私的大数据合作画上了红线。
(3)数据挖掘和深度学习方面的专家目前非常稀缺,一个好的平台需要好的人才方能发挥最大效用,目前银行主要以软件开发人员为主,缺乏数据和算法方面的人才,特别是真正的数据专家在银行不是很多,顶尖的数据科学家更是稀缺。
2.存在的机遇
正如互联网和电子商务曾经风靡一时一样,虽然“大数据+人工智能”如今方兴未艾,但作为人工智能发展的原动力,大数据正在史无前例地聚集,我们有理由相信只要它朝着健康的方向发展,未来必将成为社会发展的新引擎。
文 | 交通银行信息技术管理部副总经理张漫丽 大数据隐含着巨大的社会、经济、科研价值,已引起了各行各业的高度重视。如果能通过人工智能技术有效地组织和使用大数据,将对社会经济和科学研究发展产生巨大的推动作用,同时也孕育着前所未有的机遇。 在过去的五年中,云计算、大数据及人工智能的发展催生了金融行业的一系列产品和业务模式创新,可以预见,迅猛发展的大数据和人工智能技术未来可能使整个金融环境和交易模式产生彻底性的、颠覆式的改变。2016年,AlphaGo把人工智能推向了风口浪尖,AlphaGo围棋的获胜体现的不仅是人工智能的水平,更是背后云端大数据处理和分析能力的提升。 一、“大数据和人工智能”金融行业发展现状 1.银行转型改革恰逢“大数据+人工智能”全面崛起 近年来,我国经济金融形势都呈现出新的态势,银行业面临经济增速放缓、结构调整加快、化解产能过剩和金融改革等诸多挑战。加上全球金融监管日趋严格、新巴塞尔协议对资本的约束,银行业金融机构面临着前所未有的压力和风险。市场竞争空前激烈,不仅银行之间的竞争愈发激烈,银行与非银行金融机构、类金融机构的跨界式竞争也愈演愈烈。依靠规模和高速扩张的外延式发展方式已严重透支,银行纷纷开始主动或被动地进行内涵式发展转型。 统计显示,全国小微企业贷款覆盖率仅21.6%,还有78.4%的小微企业得不到银行资金的支持。这表明银行服务覆盖的广度、深度还远远不够,仍存在巨大的服务空间。但在规模和效益驱使下,银行基于传统风险和成本考量,仍难以有效开拓维护小微客户。 伴随着高质量的大数据积累,同时得益于强大的并行计算能力,特别是深度学习算法上的突破,人工智能技术近年来全面崛起。“大数据+人工智能”的相关理论与分析方法,很好地弥补了数据获得的时间连续性、数据的地理位置分布、数据样本的覆盖程度等传统分析方法中的不足,其精准度更高、覆盖面更广和响应速度更快的特点,有助于银行优化资源配置,降低服务成本,提高服务效率,丰富风控手段。将其定位为降本增效、提升体验、扩大获客的有效工具,运用到银行运营、营销及服务等业务中将大有裨益。 2.金融同业应用探索 银行是信息密集型服务产业,其数据强度高踞各行业之首——银行业每创收100万美元,平均就会产生820GB的数据,在整体价值、企业平均数据量、绩效波动性、交易密度等方面遥遥领先于其他行业。人工智能所展示的机器深度学习能力让大数据处理呈现了新的方向。 无论是大型银行还是中小股份制银行都开始大范围地尝试通过大数据来驱动业务运营,比如工商银行的大数据风控、建设银行的大数据模型实验室、招商银行利用大数据开展小微贷款、光大银行建立社交网络数据库等。人工智能机器人也走进交通银行、农业银行、浦发银行等各家银行营业网点。2016年12月招商银行强势发布了财富管理应用摩羯智投,推出了中国银行业的首个智能投顾,实例证明金融科技将为金融产业带来新生。 二、交通银行探索实践和发展思路 交通银行在业务发展过程中首先积累了海量的客户信息、交易信息等各种信息,具有数据优势; 其次拥有数据仓库处理传统海量结构化数据的经验,经过几年的整合,交通银行数据信息管理工作已经形成了以数据标准制定、数据信息采集、数据信息工具设计、数据信息质量控制为主线的数据集中管理模式,为基础数据信息同源统一提供了基本条件。 加上近年来大数据多维查询、搜索、图计算等技术的兴起,对信息视图多层次、灵活化的诉求提供了有力的技术支持; 最后是IT技术和人才储备相对充裕,具备实施大数据的基本条件和巨大发展潜力,在发展模式转型、金融创新和管理升级等方面充分利用人工智能技术、运用大数据思维更具潜在价值和针对性。目前交通银行也在上述领域进行了探索,并取得了一些成果。 1.建立“顶层设计,自上而下”的创新组织体制 交通银行高度重视金融科技创新工作,2010年就成立产品创新与推进委员会(简称“创新委”),目前基本建立了自上而下分三层的矩阵式创新组织体制,以项目制改革大力推动重点产品创新。 总行创新委是全集团产品创新工作的决策机构,下设公司、零售、同业三个产品创新委员会,并设有创新项目评估与推进委员会,作为集团创新项目评估和推进的议事、协调和决策机构。各省直分行也参照设置了相应创新委员会,统筹分行层面产品创新工作。初步形成了突出重点、分类管理的创新产品体系,建立了重大创新项目、常规创新项目、创新实验项目三大产品创新体系。 首批明确了七项重大创新项目,成立了重大创新项目制改革试点领导小组,出台了指导意见,通过专项团队、专项授权、专项政策、专项资源、专项考核的“五专机制”集中资源重点突破,着力打造品牌产品。同时依托产品创新实验项目机制,总分联合快速研发了二十余项创新产品,经创新产品发布会发布后在各省直分行大力推广,取得了良好的市场反响。 2.依托创新实验室开展大数据和人工智能基础研究 目前,交通银行已依托创新实验室对区块链、人工智能等新兴技术开展基础研究,对大数据、生物识别等已有储备技术开展在金融业的综合应用研究。同时与金融科技企业、高校保持良好的沟通互动,积极开展重点金融科技相关领域的联合创新,建立快速获取新科技并转化为银行产品服务应用的能力。 3.完善大数据平台,促进和支撑业务创新 建设集团统一、数据标准、运行高效、技术强大的数据服务平台。完善大数据应用环境,支持对用户数据进行超百万维度的数据建模,深刻洞察用户的行为和特征,为全新价值点、商业决策以及新业务商机的挖掘提供更加科学、全面的业务支持,为集团经营管理、业务发展和内部控制提供良好的技术支持和服务。 4.整合外部数据丰富银行数据资源,健全客户信息统一视图 联合业务部门及分行共同进行大数据的搜集、整理、存储、分析和应用,全面采集、多方式整合行内外各类有价值数据,增加外部数据业务视图和数据探查功能,为各部门在业务开展过程中查询和使用外部数据提供便利。将金融服务与社交网络、电子商务、移动网络等深度融合,与行内数据形成有效互补,充分发挥外部数据资产价值,实现广义通用的客户信息统一视图。 5.依托大数据技术实现客户行为分析及精准营销 在产品开发、营销方面,通过对客户在交通银行及关联单位的海量交易、行为、及访问足迹数据进行收集、分析和挖掘,科学构建数据模型,使不同层级客户的差异化金融需求可以得到充分展示,进而针对客户需要、市场需求研发产品、开展营销,真正做到以客户为中心进行产品开发设计,实现精准营销,而不是以银行为中心制造、推销产品。通过对智慧感知技术、互联互通技术和智能洞察技术的综合应用,实现对用户的行为感知和需求预测,从而提供新型的主动推送或推荐式金融服务,实现对特定族群的精准营销,提升客户交叉销售率。 6.推进风险管理的精细化 当前银行的贷前授信和贷后监控,无论从深度和广度均有不足,交通银行着重研究银行业风险发展方向和趋势,以大数据思维将现场调查与非现场数据挖掘分析相结合,更加全面地评估客户风险状况,大幅提升贷前风险判断和贷后风险预警能力,实现对潜在风险的及时防控。 首先,结合挖掘的外部数据进行客户关联画像,将企业登记状态、资金、信用、声誉、征信、股东、法人、主要管理人员、控股及关联企业等信息均纳入风险监测系统中,有效提升客户识别及风险预警水平。 其次,依据预先设定的风险指标及已知的风险客户评级,通过机器学习算法进行近似性匹配,完成数据挖掘分析,并依据机器学习的结果,逐步调整指标范围和关联程度,完善机器学习的风险模型及算法,以实现机器学习结果与人工认定结果达成极高匹配为目标,训练出更精准的风险防控模型。 最后,深度挖掘历史数据,并逐步扩展机器学习所涉及的数据范围,做出更专业的判断,使风险识别、防范、决策更加可靠、更加贴近实际。 7.强化分布式架构研究,拓展数据实时处理展示范围 近年来,IT系统面对的数据量越来越大,业务对处理时效要求越来越高,数据量和处理时效的矛盾越来越突出。目前银行传统应用由于在事物一致性方面的要求,基本仍然采用集中式应用架构,但是随着互联网金融的发展,数据分析正在向更多类型的分布式架构和实时智能服务发展,通过实时的智能服务可以支持实时的决策制定。从而最终优化和解决处理数据越来越大、处理时效要求越来越高的问题。 前期已实现的交通银行头寸、销售、授信等信息实时展示获得行内各部门一致好评。搭建的实时数据服务系统专注于处理实时和准实时数据需求,支持CDC、MQ等多种准实时同步技术,尽可能压缩传统业务链条,应用大数据的处理模式,以高实时性的中间数据层为媒介,引入机器学习和数据湖概念,建立效率更高、实时性更强、管理者自定义程度更深的商业智能系统,实现报表的实时化、移动化、定制化。 8.研究和拓展人工智能应用场景 充分利用大数据平台研究成果,结合人工智能在语音识别、语义处理、生物识别、机器学习、专家系统等方面的核心技术,围绕数据跨界融合和深度挖掘进行应用探索,进一步升级和优化大数据平台功能与模型,并重点应用在客户画像、需求挖掘、精准营销、服务质检、智能投顾等环节,为客户提供定制化、智能化、有管控的金融服务,综合提升交通银行服务创新和产品营销能力。 交通银行于2014年6月率先在业内建立了全行统一的生物识别身份认证平台。该平台是以虹膜、人脸、指纹及指静脉等多种生物识别技术为核心的跨平台的、开放的、可扩展的统一身份认证平台,实现了客户身份安全便捷、真实、准确认证。通过与现有业务系统对接,大大提高了客户的满意度、忠诚度和舒适度。目前,人脸识别技术已在全行智能柜、ITM机、个性化发卡机上推广使用,提升身份认证效率的同时,有效挖掘了各个渠道潜在的客户营销信息。 未来,交通银行准备在如下场景拓展人工智能应用:一是结合多种生物识别技术,如语音识别或声纹识别技术,来提高金融中心或客服中心的质检水平和服务质量。二是结合私人银行部多年资产管理经验、大数据分析及人工智能技术研发智能财富管理系统,为中产阶级客户提供更加全面和优质的投资顾问服务,提升客户忠诚度及黏度。三是通过人工智能技术和大数据风控,将曾经繁琐的业务审批流程自动化处理,通常数十秒即可完成,其中超过85%的审批都不需要人工操作,纯自动化实现。 三、挑战和机遇 1.面临的挑战 (1)虽然银行经过多年数据仓库建设对信息、流程及渠道进行了全面整合,构建了统一的数据标准和信息模型,但目前的数据结构基本上是条块分割的,“线下为主”的体制对互联网数据价值的不适应,数据规划、清洗和标签不尽合理,将这些数据进行大数据分析,现实情况下仍不尽如人意。 (2)客户行为偏好数据往往隐藏在海量的移动网络设备及社交网络之中,现有银行系统难以有效分析和利用。最好的行为数据在BAT,但BAT不会与银行分享。目前主流的数据源供应模式包括传感终端、互联网、政府机关、运营商等,主要是以数据为产品输出,不涉及数据的分析处理,但信息安全的政策风险较高,市场空间有限,特别是《中华人民共和国网络安全法》将于今年6月1日起正式生效,为涉及客户隐私的大数据合作画上了红线。 (3)数据挖掘和深度学习方面的专家目前非常稀缺,一个好的平台需要好的人才方能发挥最大效用,目前银行主要以软件开发人员为主,缺乏数据和算法方面的人才,特别是真正的数据专家在银行不是很多,顶尖的数据科学家更是稀缺。 2.存在的机遇 正如互联网和电子商务曾经风靡一时一样,虽然“大数据+人工智能”如今方兴未艾,但作为人工智能发展的原动力,大数据正在史无前例地聚集,我们有理由相信只要它朝着健康的方向发展,未来必将成为社会发展的新引擎。