大家好,我是jacky,朱元禄,很高兴与大家做直播分享,我一直都认为直播是一种生活方式,是一种通向未来的沟通方式,所以,今天就以直播的方式,跟大家做分享。
今天,我要分享的主题是《数据科学风云之互联网金融》,我会从三个方面跟大家分享:
互联网金融的生存哲学
机器学习、用户画像、语义分析、决策引擎技术在互联网金融中的应用
数据科学构架下的金融风控。
在主题开播之前,我对未来社会发展、进化的方式谈谈我的看法:三句话,跟大家分享:
第一句:五年之后,我们的竞争环境将从人与人的竞争,转变为人与机器的竞争,这是第一句话。
第二句:十年之后,一切生意都将成为数据生意。
第三句:十五年后,这个社会上只有一种道德,叫机器道德,一种数据科学构架下的机器人的道德。
上面的三句话,作为开场白,下面正式开始我的主题分享。
对于什么是互联网金融的理解,现在的专家、屌丝和普通吃瓜群众的观点差异是很大的,概况起来分为三种观点
第一种观点:“去中介论”
第二种观点:马云提出的“互联网金融不是金融互联网”
未来的金融有两大机会:一个是金融互联网,金融行业走向互联网;第二个是互联网金融,纯粹的外行领导,其实很多行业的创新都是外行进来才引发的。金融行业也需要搅局者,更需要那些外行的人进来进行变革。
所以,我作为一个外行者,一个不懂金融的人,对金融好奇,不是因为他能赚多少钱,而是因为它可以让很多人赚钱,可以让很多人发生变化。我希望外行人能够参与这个领域,不仅仅是来搅局,而是共同创造一个未来。金融是为外行人服务的,不是自己圈里自娱自乐、自己赚钱的。——《马云》
第三种是媒体观点
我们接着马云提出的“互联网金融不是金融互联网”,引出第一板块,互联网金融生存的第个个讨论点
这部分分享两句话:
第一句话:互联网文化就是屌丝文化
第二句话:互联网金融的出生就是为生存而奋斗
互联网改变了我们的社交方式、改变了我们的行为方式、改变了我们的人性。很多人在线上和线下是两种人格,很难进行统一。线下是禽兽,线上往往是道貌岸然;有些人线下是君子,到了线上就满嘴喷粪。
互联网的文化就是屌丝文化,拿直播平台举例吧,首先这次直播得感谢云学APP给我提供的服务,感谢育茹老师的文案宣传和直播辅助。回到屌丝文化,回到直播平台,我自己本身也是一个屌丝,年龄越大,越希望当一个屌丝,可以更自由,随意的更大家分享,可以不用穿着西服去跟人喝茶握手,其实,做一个屌丝的感觉很好。
其实我本人是反感今日头条和快手直播的,我觉得它们把人类的价值观带入了误区。但是快手直播的用户人数达到了5.6亿,恐怕现在微信的活跃度也就如此吧,快手拿什么取胜,得屌丝者得天下,我们企业的管理者要时刻想着屌丝的需求,
其实这种屌丝文化对于社会来说是一把双刃剑,对于互联网金融企业来说,P2P既是可以融资的好地方,一样是可以诈骗的好地方。人性一旦发生变化,自然也会改变人的生活方式以及行为逻辑,最终导致金融逻辑也发生极大的变化。如何适应互联网文化,对金融机构而言是个极大的挑战。而这个挑战我们不得不面对,就像开场白我说的一样,人类未来会无可避免的面临互联网生活。
上面就是我跟大家分享的第一部分:互联网金融的生存哲学,一句话总结:适者生存,不断进化。
下面跟大家分享这次主题的“主菜”了,数据科学与互联网金融
互联网金融行业完完全全是一个数据驱动的行业
业务数据
公开数据
用户授权数据
知识图谱
决策引擎
机器学习
用户画像技术
语言分析技术
上面的技术,在后面的分享我会展开来讲。
营销环境
信用风险管理
反欺诈
贷后管理
合规检测
为什么要讲本部分?
对我们了解业务,提升能力,提高应聘的成功率是很有帮助的,更能帮助学习数据分析和数据挖掘的朋友,厘清学习思路,数据科学领域,我们哪些该学,哪些学习就不要浪费时间了
数据准备包含哪些技术呢?
数据仓库
网络爬虫
ID Mapping
从业者和应聘者要具备哪些能力和技能?
Hadoop通俗的解释
假如说你有一个篮子水果,你想知道苹果和梨的数量是多少,那么只要一个一个数就可以知道有多少了。
如果你有一个集装箱水果,这时候就需要很多人同时帮你数了,这相当于多进程或多线程。
如果你很多个集装箱的水果,这时就需要分布式计算了,也就是Hadoop。
前面说过,用户的人法失信,企业黄页,工商的数据,我们要有能力抓下来,具体的过程和教学分享,我在新浪微博 数据分析-jacky,和微信公众号:数据分析部落,都有视频教学的分享,感兴趣的朋友,可以观看一下,都是免费分享的。
我们拿到的数据都是放在不同的数据源当中的,我们要通过ID Mapping把这些数据做关联,可以根据用户ID关联起来,也可以根据用户的手机号关联起来,或是通过其他的字段关联起来的,做完ID Mapping之后,我们就能形成一个完整的数据视图,供后续的各种技术和环节进行使用。
下面说一说互联网领域“引以为傲”的技术—知识图谱,前面我们说我们通过数据准备,通过ID Mapping,已经把数据关联起来了,但是实际上,这些数据是有很复杂的网状结构的,我们需要把这些数据用知识图谱的形式进行组织。
授信建模
反欺诈建模
在互联网金融中,很多的交易环节是在线上操作的,我们要在线上,在看不到客户的情况下给客户授信,把我们的贷款放出去,那很多别有用心的人就来了,我们在构架了知识图谱的体系之后,就有很多的技术手段,从图谱中侦破出这些欺诈的案件。
我们在给用户授信的过程中,是要做非常多的决策的,给用户多少的额度,给他什么样的费率,给他多长的期限,这些都需要做决策。
通常,互金企业会使用一些决策引擎软件:
商用的:blaze
开源的:
机器学习包括深度学习技术,已经应用到我们互联网金融中的各个环节,从开始的营销、授信、反欺诈,贷中管理,到最后的客服,都用到了机器学习的技术。
授信环节举例:
反欺诈环节举例:
我们也可以通过机器学习挖掘出啊黑产中使用的术语,我们也可以在网络上挖掘贷款中介在网络上留下的电话,以上都是机器学习在发欺诈环节中的一些应用。
营销获客环节举例:
这里可以观看我的免费视频课程,内容很多,就不赘述了。
贷中管理环节举例:
用机器学习预测是否需要提前介入。
用户画像跟前面机器学习技术是交互来使用的,比如我们给用户打标签,经常也是机器学习的方法来做的。
互联网金融企业经常会有一些线上的活动,这些活动通常是根据不同客群来的,我们就要对客户进行分群,针对不同的客户进行研究,,我们就要了解我们客群的整体的画像,我们通过这样一个画像,了解到我们整体面对的客群是什么样的,从而优化我们产品策略,优化我们的市场活动,优化我们客户的策略。
在整个互联网金融当中,有很多需要跟客户进行接触的环节,从最开始获客阶段,到后面客服服务的阶段,包括客户没有还款,催收介入的环节,都需要跟客户接触。跟客户接触的过程中,有语音的交互,也有文字的交互,那我们需要了解客户真实意图是什么。
举例来说,某一客户打来电话,向我们咨询问题的时候,我们的知识库里面是有标准答案的,我们通过语义分析的技术,来对语义的相似度进行计算,从而在话术方面给予更优,更快的一个回复
同样,对内来说,语义分析也可以检测我们业务人员的服务质量,互联网金融越来越合规了,我们一线的业务人员跟客户打交道的时候,经常会说一些不太合格的语言,我们通过语义分析,可以分析我们的业务人员跟客户交互的时候都用了什么语言来说。