再谈量化交易

再谈量化交易


赚钱是我要读博之前答应我男朋友的,之前虽然也做过一些量化交易的程序和研究,但是感觉实际上还是停留在demo阶段,要赚钱谈何容易.在这篇文章中再总结一下马上要开展的量化交易的设想;


三年又三年,现在太晚吗?

2016年我就在用python写一些简单的股票策略了,大概就是爬取一些新浪股指的数据,然后用一个线性判别模型拟合来预测走向,做短线交易.现在三年过去了,这期间作为不大,是不是现在才搞会太晚了呢?

但是通过近期的观察发现,国内这几年量化交易还是处于被收割的起步阶段,原因我等会儿会分析,虽然机器学习大火,但是拟合模型似乎对股票趋势一直都处于"不来电"的状态,而量化交易api的领军者 VN.PY (这个大佬我2016年就开始关注了)似乎也没能在市场上叱咤风云,倒是在VN.PY的程序编写和量化交易培训/接口发放上搞得有声有色.

综上,量化交易这两年质量真正有进步的不是各种程序策略,而是数据的易获取程度,由于优质带python/JAVA API的数据源越来越多,还有类似tushare这样的开源项目,相比2016年,现在的量化交易员只需要花更小的成本即可获取比当时优质得多的数据(有爬虫基础的程序员可以自己爬取,但是会有时间延迟…)


需要哪些才能上路?

要自己写代码,第一主要解决的问题是数据来源问题,行情数据要准确和完整.现在我个人感觉Tushare和VN.PY的数据覆盖都相当不错,散户一个月也只需要2000-4000即可获取到优质的数据(有的人可能会觉得还是不太能接受,实际上这个价格不止包含了数据服务,还有…).

还有就是报单,你有了数据,但是要和市场交互,你要买,你要抛,你需要报单,报晚了,机会就稍纵即逝,因此一个好的保单API就异常重要,有的人为了有效保单一次性挂50-500个账户的多如牛毛…

最后就是策略了,这是核心和需要精心打磨的武器,好的策略不会有人无偿分享给你,顶多会给你一些demo或者教学级别的策略.策略是蕴含了数学、金融、市场背景等各个要素的动态判别器.


为什么:统计机器学习不Work

统计机器学习连text2img和img2text这么恼火的事都能干,为啥也是多维统计决策的量化交易场景里,人工智能方法全都罢工?先来看看实例:

我去一家量化交易公司实习,一次meeting中,我和老总还有一个资深大佬谈机器学习在股票和期货里面的应用。我:LSTM在时间序列上应用的效果比较好,我们可以尝试把LSTM应用在股票预测上。此时,大佬在阴笑,老总默不作声…我:你为啥笑大佬: 不work啊!我:为什么不work?!这时老总也在旁边强掩笑容,大佬终于忍不住说了,有两个原因,第一个是你如何保证你的因子有效?老总就补充到:对啊,你的模型很可能garbage in garbage out. 我说:那你们提供因子来训练模型啊大佬阴笑…然后大佬又继续说:第二个就是,你非常可能过拟合!我说:那我们可以加regularization啊。接着他们俩忽略我的话了,老总接着说:其实我们是想要一个模型能根据每天的数据进行反馈,自动更新。我一想,这TM的不就是reinforcement learning嘛,我说:可以用reinforcement learning试试。大佬又开始笑了,我很纳闷。大佬说:我就是知道他们有些人在用reinforcement learning,我才能赚钱!!!
最后实习结束之后,在大佬的带领下,我才明白了交易的三重境界

  • 归纳
  • 演绎
  • 博弈
    所谓的深度学习不过是基于历史数据进行拟合的归纳法罢了,如果把深度学习用来做股票预测,长期的是expected亏钱的,因为市场在变,规律在变,历史可能重演,但是又不尽相同。深度学习肯定是可以用在股票市场的,比如针对某只股票的新闻情感分析等。但是不能用来预测市场走向!!!想在市场上赚钱,就得博弈,你得知道其他人在干什么,因为市场是有所有的参与者共同决定的。

再明显的例子:

某现货交易员朋友以前还跟我说过几个奇葩手段。比如通过和船长搞好关系,可以让他在卸货时把油轮的倾斜角度加大,可以导出更多的油。不同国家对于油品的要求不一样,但原油的现货价格是一样的,他们会利用这一点把好坏油掺杂,在不同国家之间做套利。还有两个关于电的奇葩策略:一个是在核电站周围布置红外监测设备,可以检测发电情况,从而对电价进行调整。另一个是人们发现在足球比赛中场时英国电力网的电力需求会突然加大,因为中场休息时英国人会集体烧水泡茶。。。

因此,交易制胜的关键要点是归因推理,而不是统计回归拟合!!!

这就是根本原因,现在明白了这点,就需要在量化策略算法的归因逻辑推理上下功夫,应该会很难!

你可能感兴趣的:(随感)