大数据分析技术在银行业的应用及思考

随着信息和互联网技术的普及应用,大数据时代已经到来,大数据数据分析因其自身显而易见的应用价值,从而得到了迅猛发展,与此同时“数据化管理、数据化运营、数据化决策”等管理理念也渗透到了各行各业。放眼当下,企业间的经营竞争越发剑拔弩张,面对日益激烈的竞争环境,各级决策者更加注重对海量数据的分析利用。

大数据是动态发展的非结构化数据,同时兼具时效性与经济性的特征。大数据的应用将重新构建社会信息和关系网络,而作为长期的社会信息和信用中心,商业银行势必受到外部的冲击。当然挑战也伴随着机遇,本文将着眼于银行业务,通过分析国外银行模式和国内银行相关案例,展现大数据在零售银行业务的应用现状,并对未来发展思路进行探讨。

大数据与一般数据的主要区别在于,其包含大量非结构化数据。在非结构化数据的收集和处理方面,互联网企业具备一定先发优势,同时凭借丰富的客户和流量资源向银行发起挑战。不过,有效利用大数据同样给银行带来了诸多好处,多维度的数据分析和应用使银行零售业务在服务创新、客户评价和精准营销等方面均有明显提升,在这一领域海外银行有不少成功经验值得借鉴。

反观国内银行业,虽然对大数据的概念并未过早提及,但是实际业务中也积累了不少成功案例,其中最早应用于信用卡领域,并已成为全行业发展的方向。而在小微业务方面,阿里小贷是大数据应用的典范,阿里完备的数据体系使其能够在线快速提供小额融资服务。当然,国内银行业在大数据应用方面仍存在不少问题,本期报告也进行了必要的分析。

身处大数据时代,银行业挑战与机遇并存。银行业必须正视来自外部的冲击,通过大数据重塑商业模式,提升经营管理水平。当然,海量数据的席卷而来,海量机遇也随之而来,这为银行业务转型和产品创新创造了条件,我们相信未来银行业服务及管理模式都将发生根本性改变。

商业银行处于大数据时代变革之中

2012年3月奥巴马政府公布了大数据(Big Data)研发计划,旨在提高和改进人们从海量和复杂的数据中获取知识的能力,这是时隔近20年美国政府宣布信息高速公路计划后的又一重大科技发展部署。1993年诞生的信息高速公路计划改变了全世界信息的生产和传输方式,推动了全球化的Internet的发展,掀起了世界性的互联网革命。

作为信息革命的第二个高潮,可以预见大数据即将对未来的世界产生重大影响。当前银行业服务及管理模式都发生了根本的改变。统计显示以ATM、网上银行、手机银行为代表的电子银行在我国当前已经成为主要交易渠道,对传统银行渠道的替代率超过了60%。接下来的大数据革命可能对银行的一些观念和经营模式再次加以颠覆,银行业应如何主动变革、变挑战为机遇是一个值得探讨和深刻思考的问题。

(一)大数据的三个主要特征

自1980年以来,世界上的数据以每40个月翻一番的速度增长,现在每一天约有2.5E字节的新数据产生;商业公司数据产生量更迅速,每翻一番的时间大概为14个月。但大数据绝不能简单等同于海量数据,大数据主要有三个主要特征:

1、动态发展

根据麦肯锡公司的定义:大数据往往是指传统手段和工具无法处理的数据。这是一个比较主观的定义旨在强调大数据是动态的,会随时间和技术而扩展。另外大数据也随着行业的不同而变化,视该行业所使用的软件以及一般数据集大小而定义,当前对一般行业来说落在几十个T(1T=1024G)与几个P(1P=1024T)之间的数据量就会感到难以处理,对它们来说就是大数据。

2、时效性、经济性

大数据是传统技术无法处理的数据,严格地说只要时间足够长没有无法处理的数据。而大数据是难以在业务容忍时间内使用传统软件捕获、管理和处理的大尺度数据集,因此大数据的尺度是随任务时间变动的。除了技术,经济性是应对大数据挑战需要考虑的另一个重要因素。当世界上的数据量以年40%的速度增长的时候,信息科技(IT)投入的增长率仅有5%。技术和经济两方面决定无法使用传统方法应对大数据时代的到来。

3、非结构化数据

大数据一个具有很多非结构化的异构数据种类的数据集,这些异构数据种类包括社交网络文本、射频认证、相机照片、手机信号、传感器网络信息等,随着技术的进步这类数据增长率更快,数量更巨大,世界上有90%的数字内容是非结构化的。银行中的数据具有典型的异构化特征数,包括传统业务数据、办公信息、开发测试数据、业务运行日志、与客户进行沟通的邮件和短信、电话银行和服务的语音记录等。

(二)银行、信息与关系网络

近年来大数据的概念被反复提及,一个主要原因是电子商务活动的全面兴起,无论是B2B还是B2C,在线交易规模的迅速扩大带来了数据信息的爆发式增长。最引人关注的是,记录客户行为的大量非结构化数据开始影响到金融领域。作为社会信用的中心,商业银行始终占据着最关键的社会信息资源,然而非结构化数据的普及应用使得互联网企业不断冲击银行的核心地位。大数据的有效利用,帮助互联网企业迅速拓展关系网络,其搭建的各类公共平台正试图成为社会关系的核心,可谓是银行业的巨大威胁。

1、银行占据社会信息中心

商品经济的发展,要求信用在全社会进行放大,与之适应构造了这样一种社会关系:银行对其他行业企业单向提供信用,处在支配地位,成为信用社会信用中心;企业为了获取更多信用主动向银行提供自己的信息,银行也自然成为社会经济信息收集中心行业。这种关系的形成的缘由是只有作为信息收集中心,银行才可能使用信息对信用进行社会性放大。这时以银行为中心,企业间信用和信息构成雪花和网状的混合结构,企业之间能够进行更大更广的信用连接,形成更复杂社会关系。

2、计算机应用强化银行竞争优势

信息的具体存储使用形式,是限制社会信用进行有效扩展的一个重要因素,计算机技术的普及应用极大的提升了银行收集和处理信息的能力。社会信用状况处于不断变化之中,因此也需要对持续变化的信息进行判断。计算机技术发展的初期,银行的标准化需求是直接推动力之一。这种标准化一方面是指将单据等信息进行数字化标准化,另一方面是指将企业的经营活动用标准化指标表示,银行是这种规则的构建者,企业只能屈从建立所谓规范化的制度。一个典型的例子是由于反映了关系网络因此关系型数据库成为信息行业的重要产品和标准。

使用计算机技术银行强化了它的经济信息收集中心地位,同时可以更深度地探测分析它的借款人关系网络。基于对客户信息更深刻和正确的探测,银行能够进行信用更有效的放大,结果是以银行为中心筛选出适应社会发展的最良好的企业关系群体,优化、加速了整个社会资源配置。银行还通过信息技术如POS机、ATM不断扩大优化以它为中心的信息和信用关系网络。

3、互联网冲击银行信息中心地位

广泛意义的网络出现后,银行业的主要竞争优势体现在信息中心,能够高效的探测集合到各种行业以及企业的信息,这是其他行业做不到的,银行业主要任务是对客户信息进行去伪存真。

然而,当前各种传统业务正在向互联网迁移,当然也包括银行业。但是银行在互联网上发展业务仅仅是借助这一渠道,它依然使用传统的数据关系。不过,互联网构建的原则是形成一种联网机构相对平等的关系,没有唯一的核心行业,于是银行在互联网上不再是经济关系的信息中心。银行成为了被动的服务者,除了去伪存真,银行业必须主动吸引客户;这个时代银行只有遵循网络规则,除此之外别无它途。

以往面对处于支配地位的银行,企业愿意主动提供信息并配合进行标准化,但在全新的网络环境下,银行是服务方,信息不可能按照银行的意愿标准化并主动推送。银行必须采用新的能够检测非标准化的企业信息/数据的装置和手段,并不断改善其对社会关系探测灵敏度。

(三)国外银行模式分析与借鉴

互联网冲击着银行信息中心的地位,而商业银行也在利用信用和资源优势巩固自己的领地。为了得到客户真实关系网的信息,国外一些银行开始研究如何通过获取、整合各种网络大数据对客户真实社会网络关系加以映射和应用。在具体实践中,主要有四种表现形式。

1、扩大数据分析范围、提升信用评估能力

在美国由个人消费信用评估公司(FICO)开发的FICO信用积分指标大概包含15~20个变量,大多数美国银行对个人信用评估也建立在该基础上,再添加本行的其他一些侧重指标。这造成了一个问题,这个标准简单划一,不注重细节。这与我们了解的客观世界的复杂性不相符,人不是机器,不可能存在任何时候都是非好即坏的绝对情况,同样的人不同的环境会形成不一样的结果,人的信用也如此。在此意义下FICO信用积分显得过于主观,究其原因是银行过去信用评定者由于缺乏先进的技术,要判断每个人的信用所形成的环境只能使用客户经理人为判断,成本十分高昂。

ZestCash是这样一家公司,它的客户群体主要瞄准了信用记录不好或者没有信用卡历史的人。ZestCash的创始人是Google的前首席信息官,Google是大数据研究的开拓者之一,其MapReduce技术是被认为当前研究大数据最常用的有效技术。ZestCash使用MapReduce进行大数据分析,考察贷款人的数千个信息线索(对比FICO的几十个指标),从而造就了它独特的竞争力。例如对于一个无法进行某次还款的客户不论他是否主动解释,传统银行都认为他是高风险的,但ZestCash发现如果这种顾客主动解释其原因,他们更有可能全额还款;ZestCash还会探测客户在ZestCash网站上停留的时间(这反映了真实世界人们对信用申请的谨慎程度与还款诚意)作为信用评价的考量因素,这些都是过去FICO信用评分系统所无法想象的。

ZestCash的分析技术的核心就是把握客户的差异化行为,理解网络对真实世界的反映。如果仅仅分析一个数据可能是噪音,但如果将多方面展示客户的数据收集起来,并理解它们的关系,则可能出现不同的效果。而这些数据不可能是规规矩矩的,需要我们使用不同的探测方法加以寻找,更敏锐的分析能力会令我们发现更多商业机会。例如对我们周边那些太忙碌或者一时糊涂遗忘了信用卡还款时间的人,这样一种技术使得我们不会轻易丢失一个优质客户。

2、提供深度分析服务、打造消费信息中心

国内的一些银行已经尝试根据顾客购买产品的历史,分析他们的兴趣使用各种手段主动营销,但这仅仅是数据初步应用,还没有做到将线下的购买行为与客户浏览行为结合起来进行更进一步分析。尤其是当今经济热点切换频率快,各种产品收益轮动,客户对银行产品的兴趣会紧随这种波动,这种分析能力国内银行尚欠缺。

国外银行现在已经开始根据大数据的分析尝试提供超越银行领域的产品和服务。新加坡花旗银行基于消费者的信用卡交易记录,有针对性地给他们提供商家和餐馆优惠,并且根据反馈不断学习提升推荐准确度。服饰零售商Gap为了提高吸引力,与Visa卡合作,由Visa采集数据,如果客户在Gap店附近进行刷卡的就会得到折扣优惠,形成龙卷风效应。

这种看似与银行主业风马牛不相及的行为目的何在?传统银行的优势在于它是经济信息中心,客户对银行的信任依赖是建立在这种信息收集处理能力的认可上。因此花旗和Visa这种行为还是一种信息中心的争夺,不过银行处在服务方,并且变为消费信息中心。客户不关注服务的目标从银行本身转移到客户,他们只是亲身感受到银行信息获取和处理能力的强大,进而认为银行是可依赖和安全的,这就大大提高了客户的认同度。

3、进行非账务性线索排查的有力手段

以反洗钱为例,洗钱疑犯虽然与银行发生了直接关系,但他绝非像普通交易那样有意无意的将银行作为他的信息中心。对银行来说洗钱疑犯如此讨厌,使用标准的方法和工具去判断这些伪装起来的异常客户不是传统银行的强项,将大大增加银行工作量。银行的目标是行为可预测的合法借贷客户,在一定程度上客户的行为以及与银行契约关系是标准的。就此《经济学人》举例说“对照顾客姓名看其是否处在制裁黑名单之上这件事情并不容易,因为一家银行可能会有数千位顾客和这些制裁黑名单上的顾客重名,如果稍有不慎,就可能毁掉一份顾客关系。”

对此花旗银行引入了Watson,能从各种不同数据源获取信息,“通过搜集顾客的国籍、地址、家庭成员的姓名,以及他们是否曾经在某些国家旅游或者从这些地方收到过汇款等记录,来确定这个顾客是否正是制裁黑名单上的那位。”Watson这种杰出的处理非结构化数据的能力——像专家那样观察真实客观世界对细节加以洞察得到特殊结论,使它的领域又扩展到反欺诈、零售业务分析等领域。必须承认,银行的结构化的数据在某些方面是有局限性的,因此即使非刻意增加与客观世界更相符的非结构数据,也必须明确大数据是对付我们常规业务之外挑战的有效武器。

4、强化市场营销、优化商业模式

大数据比银行传统处理的数据复杂,是否意味着运用大数据的银行业务会比传统银行更复杂?其实不然,以美国最大的网上ING Direct为例,该行成立于2000年,2011年其存款规模达820亿美元,客户数量已经达到700万。该行的独特运营模式就是:简单并且对追求高回报的客户具有吸引力。为此该行只提供网上银行服务;只向客户提供最基本的金融服务,如普通储蓄存款账户、定期存单、简单住房按揭贷款、普通基金理财服务等;该行自成立以来没有发放过一张信用卡;该行对支票账户会支付平均4%的高额利息,保证了客户从自己的存款中得到最高的回报。但是这种简单的运营模式完全是建立在基于对复杂大数据的分析基础上,ING Direct所以能够提供如此高额的回报在于他们已经计算到:相对传统银行办理业务所需要的材料费和人工费ING Direct能大量节省成本。

基于所有的可获取的各种异构数据分析基础上,ING Direct甚至主动解除不符合它们发展模式的客户。例如给呼叫中心太多电话的客户,可能是恶意的,至少与ING Direct简单以到达节省成本的企业经营模式不匹配;甚至对ING Direct网站浏览太多时间的客户,ING Direct也会质疑客户没有必要花费这么多时间(同时也增加了银行的维护成本)来理解这些简单易懂的产品。为此ING Direct每年要主动解除成千上万与其公司经营理念不符的客户,节省上百万美元成本。在ING Direct这种看似简单的经营理念下我们看到它的基础是能够实现对大量异质数据进行复杂分析从而抽取出反映真实世界的简单有效的网络关系,貌似简单实则复杂。

大道至简的ING Direct和上文提到的化腐朽为神奇的ZestCash看似两个极端,但是他们都取得了成功,原因不外乎:不管经营模式有多么不同,它们都有足够的分析真实社会关系的能力,能够通过数据分析出与自己的经营模式最匹配的社会关系,从而有针对性的筛选同质的客户。

纵观国内,大数据分析应用在银行业还刚刚起步,但不乏涌现出了一批掌握着核心先进技术的公司,他们深入挖掘银行用户的方方面面的数据,将银行的自身数据将外部互联网数据有机结合起来,为用户提供更有价值的、精准性的服务。例如数据科技就是这样的一家公司,尽管这家公司成立时间不长,但已掌握了国际前沿的先进大数据钻取和挖掘技术,并致力于通过技术和业务的创新,为客户带来安全、合规、高效、并且低成本的价值数据互联运营服务,目前已有多项成功案例。

当前一种观点认为,我国商业银行对互联网的了解和应用以及对大数据概念的认识都是不足的。这种看法有失偏颇,一直以来我国银行业十分重视对科技建设的投入,甚至在互联网企业出现以前,就建立了自己的全国性计算机网络。随着信息和互联网技术的不断进步,我国银行业正在快速向经营管理的信息化和数据化发展,已经建立起了以数据仓库为核心的经营管理数据体系,数据分析技术已经大量应用在客户评级、风险识别等方面,电子银行业务替代率超过70%,各种在线远程业务渠道和相关产品日趋丰富。

不过,大数据时代我国银行也确实需要继续更新观念,跟踪学习新技术、新方法。目前来看,银行在互联网应用和IT系统建设方面仍存在一些问题。如非结构化数据采集和处理能力不足,数据应用在行为预测、市场营销方面有所欠缺,业务联动亟待提升,如线上线下业务联动、支付融资联动、资金流和信息流结合等。

从长远来看,随着数据化和网络化的全面深入发展,金融服务将向虚拟化方向发展,从而全面颠覆金融服务形态。一是产品的虚拟化,资金流将越来越多的体现为数据信号的交换,电子货币等数字化金融产品的发展空间巨大。二是服务的虚拟化,通过移动互联网、全息仿真技术等科技手段,银行完全可以通过完全虚拟的渠道向客户提供业务服务,现有的实体柜面可能趋于消亡。三是流程的虚拟化,银行业务流程中各类单据、凭证等将以数字文件的形式出现,通过网络进行处理,从而提高处理的便利性和效率。在这样的服务形态下,银行的整体运作就是一个数据的洪流,“数字金融”得以全面实现,银行的管理理念和运营方式也随之得以全面颠覆。

本文转至数矩科技,数矩科技是中国领先的价值数据互联运营服务商!我们致力于通过技术和业务的创新,为客户带来安全、合规、高效、并且低成本的价值数据互联运营服务!

矩盟:数矩联盟数据服务管理平台,基于数据联盟计算平台提供全链数据计算服务,使您轻松驾驭大数据,助力您的业务创新。

矩智:数矩智能建模平台,易用的操作界面,丰富的算法模型,可以使您轻松地应用机器学习和预测分析,以解决当今最具挑战性的业务问题。


:数矩金融决策引擎平台,具有全球领先金融模型算法,结合国内金融业务特征优化,并应用大数据机器深度学习算法进行完善,形成最佳的金融决策引擎应用。

你可能感兴趣的:(大数据分析技术在银行业的应用及思考)