来源:绿色金融科技
作者:海松老师
本文长度为2525字,建议阅读5分钟
本文为你探讨财经专业学生应该如何学习人工智能。
我读大学的时候专业是自动控制,当时正是人工智能的冬天。有一天我对神经网络产生了兴趣,于是问一个老师该如何学习神经网络。结果老师摇着头说,神经网络上世纪就已经被研究烂了。这个画面至今记忆犹新,常在我脑子里浮现。很多年之后我还是很疑惑:神经网络真的没啥前途么?由此可见,大学老师不能随便对一件事情做出主观性太强的判断。
今天我将从三个方面去谈财经学生怎样学习人工智能:学习的目的,学习的内容以及学习的方式。
财经人才→财经(金融)科技人才
因为知识背景和思维特点的差异,财经学生和工科学生学习AI的出发点和规律都是不同的。工科学生比较容易上手,但是在寻找应用场景方面会比较薄弱;财经学生专业知识比较强,但是对一些技术的掌握速度比较慢。理想的情况应该是两者相互合作或者财经专家领导工程专家。但从目前的情况来看,传统财经专业的学生很难具备这样的领导力。
我认为财经学生学习AI并不是要去替代工科学生,而是要成为领导角色。不是领导人,而是领导机器。这种领导角色具有良好的专业知识,理解编程的基本逻辑,能够将AI的框架与专业知识框架进行融合。这也是未来各行各业顶尖人才必须具备的能力:你不用很会编程,但是你要知道程序是怎么写出来的,以及如何与技术人员进行对话与合作。
在进一步之前,需要破除一个误区。
现在很多人以为金融科技就是量化投资,智能投顾等。不少财经类的学生一听到这样的词汇就感到很兴奋,觉得高大上,趋之若鹜。
我想泼一下冷水:在量化投资领域,财经学生基本上不是工科学生的对手。因为这个应用场景实在是太简单了,无法发挥财经专业的优势。
量化投资只是金融科技里面一个很简单的场景,它的潜力被舆论高估了。真正的蓝海是其他更加广泛的财经领域,比如会计,资产评估,保险等等。这些领域的特点是商业模式更加复杂,需要更深厚的专业背景,并不是简单用一些复杂的机器学习算法就能完成的。
财经专业学生应该把重点放到这些行业,也就是与自己所学专业密切相关的领域,这才是你们真正有优势的地方。每个细分领域都需要一个AI,财经学生应该尽快的去思考自己所在的领域应该如何设计和使用AI,有哪些数据是可用的。你们在学校里虽然不能做出一些非常复杂的应用,但是应该进行一些简化的训练,以具备基本的技能。等你们毕业之后,要用一生的时间去优化和实现自己的AI,就像你的孩子一样,不可复制。
计量模型→数据科学
那么下一个问题,利用AI进行数据分析与现在的计量分析有什么不同呢?UCLA的朱松纯老师做了一个很好的归纳。他讲的比我好,直接把原文复制过来:
同样是在概率统计的框架下,当前的很多深度学习方法,属于一个被我称作“大数据、小任务范式(big data for small task)”。针对某个特定的任务,如人脸识别和物体识别,设计一个简单的价值函数Loss function,用大量数据训练特定的模型。这种方法在某些问题上也很有效。但是,造成的结果是,这个模型不能泛化和解释。所谓泛化就是把模型用到其它任务,解释其实也是一种复杂的任务。这是必然的结果:你种的是瓜,怎么希望得豆呢?我多年来一直在提倡的一个相反的思路:人工智能的发展,需要进入一个“小数据、大任务范式(small data for big tasks)”,要用大量任务、而不是大量数据来塑造智能系统和模型。
沿用朱老师的观点,我认为大家课堂上学的计量分析可以归纳为第三种范式:小数据、小任务范式(small data for small tasks)。虽然我也认为大数据是过度炒作,应该回归到“小数据、大任务范式(small data for big tasks),但从学习的角度来讲,财经学生应该这三种范式都去训练。
大数据的好处是可以容错,容易产生一些pattern,但是大部分领域的数据量是远远谈不上大数据的,对模型和场景的理解的要求会更高,这对于财经学生来说是个好消息。
在这里我还要强调一点,计量虽然很重要,但是不要局限在这个层面,一定要从数据科学的高度去理解数据,这样才能更好的理解新的概念和方法。
数据是一个江湖
到目前为止,我们谈到了三个问题:数据,模型(场景)和算法。这三个维度是AI的核心三角。一般来说工科人才强于算法和数据处理,弱于场景设计,财经人才则相反,强于场景,弱于算法和数据。
针对这个问题我的建议是,财经学生应该按照场景、数据和算法的顺序设定优先目标。场景也就是建模,这是专业知识的训练,永远是核心竞争力的关键。数据则是第二优先的目标。财经学生要从很早就开始思考,自己行业的数据能够从哪里来,具有什么样的特点,应该如何去组织和结构化?
对于数据,我的观点是公开数据已经足够做出很好的东西。很多人一谈数据就觉得一定要有私有数据。这种狭隘的认知导致在大数据时代,数据孤岛的现象反而更加严重了。
数据是一个江湖,只有数据没有用,必须要有处理数据的技术能力。单一的数据也没有用,必须要与其他的数据进行融合才能发挥价值。对于数据一定要建立开放的价值观,分享优于孤立。你只有不断的与他人分享合作,才能逐渐理解数据的内涵,建立起更强大的AI系统。因为数据本身是死的,处理数据的方式才是关键,你与别人的链接是方法的链接。 如果把一个行业的公开数据搞明白了,那你已经处于绝对领先的地位。还有一个告诫:一定要尽早积累原始数据,因为其实很多数据会很快消失的,时间可能是比数据规模更重要的维度。
风险!风险!风险!
那么财经学生在进行场景设计的时候重点应该考虑什么呢?
简而言之:围绕着风险做文章!
财经科技的第一波浪潮以办公自动化为主,通过安装财务管理系统之类的方法,以提高效率,降低成本,而这些工作一般的专业IT公司就能够承担。但人工智能时代,核心问题并不是效率或成本,而是风险管理。
谁能够利用新的方法和数据去发现未知的风险,谁就能占据这个领域的新高点。因此财经学生在利用AI解决问题的时候,必须紧紧围绕风险这一概念。注意这个风险是个广义的风险,并不是简单的信用风险或交易风险。围绕着风险去寻找数据和设计模型,这个方向一定不会错。
越早开始越好
有了上面的认知之后,下面谈一下基本的学习方法,财经学生应该掌握哪些基本技能,从什么时候开始学习最好?
我认为从大一下学期就应该开始相关的学习了,重点是编程语言,例如Python。我发现很多学生到了研究生还没学过Python,这实在是太晚了。Python应该成为财经学生的公共基础课。
大二时至少掌握以下基本的编程技能,例如:编写爬虫程序,抓取基本的数据,调用程序接口,自动生成报告,使用AI开源平台等。有了这些准备之后,到了大三就可以开始搜集数据和解决一些更为复杂的问题了。
如果错过了上述的时机,就比较麻烦了,因为高年级学生要做的事情太多,相关的学习就不得不推迟到研究生阶段。一拖再拖,永远落后。
对于一些AI算法,我的观点是会用即可,不用深究其中的细节和原理,因为很多算法本身还是黑箱。要充分利用网络上的资源,多去尝试不同的场景,了解每个算法的优缺点,如果有兴趣再去学习更深的东西。因此,切不可有畏难心理,照葫芦画瓢也是一种很好的学习方式。
关于财经学生学习人工智能的方法还在研究之中,我们的AI特训班还在探索,相信很快会有很好的经验供大家参考,请关注我们的后续文章。
注:本文由绿色金融科技实验室海松老师撰稿。
校对:叶龚兵
为保证发文质量、树立口碑,数据派现设立“错别字基金”,鼓励读者积极纠错。
若您在阅读文章过程中发现任何错误,请在文末留言,或到后台反馈,经小编确认后,数据派将向检举读者发8.8元红包。
同一位读者指出同一篇文章多处错误,奖金不变。不同读者指出同一处错误,奖励第一位读者。
感谢一直以来您的关注和支持,希望您能够监督数据派产出更加高质的内容。