从股票历史数据量化回测看交易

从股票量化回测数据看交易

从数据看市场交易特征

一般的量化思路都是从历史数据入手,因为纵使你有很好的交易模型,也需要验证才能有把握。
而验证交易模型的最快方式就是从历史数据入手,因为实盘验证以天为最小单位,耗时成本极高。

可能大家会觉得历史数据已是过去式,与未来可能并无关联,但是历史并非简单的重复,但确是惊人的相似。

因为就算大环境可能千差万别,由于市场机制的约束,交易在不自知中反复印拓了自己,这就是规律。

而今日和明日的未知未定的未来,也会成为未来的历史。所以,从历史数据中提炼对数据的感知是很重要的。

这里不做具体的量化策略分析,因为赚钱的策略肯定是不会扩散分享的,正因为如此,这些策略才会有持久的有效期。

所以,自己研究琢磨属于自己的策略才是最靠谱的,别轻易复制他人的量化因子和参数。一定要明白这样的策略为何能从市场上刮一杯羹,才算是真正明白了交易。并且切记,自己的模型不要分享,不要分享!

认识市场单从龙虎榜单,南北向资金流向,或者是单纯的从缩量放量,亦或是板块市场情绪是很难建立起总体认识的。人和机器最大的劣势是感性决策,模糊记忆,从而导致对数据的认识不稳定,容易变动。

当然,灵活和难以总结的直觉也是人类大脑的优势,但是就如期望值一样,乘以胜率得到的收益很可能为负。

所以在这个数字时代,借以计算机这个工具,我们可以很容易的实现对海量数据的量化分析,描边出这个市场真正的模样。

比如,在A股市场中,可能大家的直觉都知道,早盘集合进价之后,交易十分活跃,但是具体随时间变化的交易活跃度曲线是什么样的呢?为什么会出现这样的曲线?

如果没有数据分析,你可能很难得到这些关于市场大盘中奇怪的交易现象,也就不会察觉背后到底有哪些力量导致这样的曲线出现,如果这样的曲线只是偶尔出现,并不会形成规律的曲线。

但如果这样的曲线无论是长周期还是短周期,或者在也特定的区间相似出现,这背后往往意味着某种机制约束或者激发着这样的行情存在。这就是比较可靠的套利机会。

与其说这是市场不成文的约定也好,默契也罢,总体来说,在合适的时候参与交易,概率论上你可能会更有胜率。

例如下图是2015(大股灾之后)~至今的整体市场价格曲线图


image.png

2015~至今 股票行情历史数据统计汇总

得出的信息,因人而异,这里不做表明。

如果没有计算机的辅助,人眼每天翻3000只股,可能脑海里也形成不了这样对市场的认识,甚至很可能因为自己的偏好和既有认知导致得出错误的认识。

人脑对海量数据的学习效率,大概率是比不过计算机的。

上图只是恰好在自己电脑里找到的一张图,之前还做过很多角度归总的统计图,估计清理文件删除了,因为代码和数据还在,稍事修改就可以复原很多信息。这里只是简单举个例子。

获取股票的历史数据,可以从一般的财经网站抓取,一般k线是开放的。

但是作为日内交易,用k线回归数据粒度还是太粗,无法得知某一日内的交易明细,比如开盘后走势,午盘后走势等等。所以如果你做量化,一定要注意从现在开始积累数据,每一分数据都是不可重复获得的。

我每天都会分两个机器接收level1和level2的数据推送,一是注入策略做交易,二来保存文件入库,这也是价值最大化利用。

每天全市场5000多只票,全实盘压缩保存下来,几百兆每天,这都是市场的印记,未来回归时我就有了别人没有的数据,这也是你跟别人的策略结论拉开差别的原因。

所以,做回归回测,历史数据的质量很重要,最好是level2,事无具细,统统记录在案,留着后面由你决定模型回测的粒度。

level2和level1行情实盘交易差异_FuckTheWindows的博客-CSDN博客

websocket level2行情推送接口 行情实盘记录 历史数据包下载_FuckTheWindows的博客-CSDN博客

原文链接:https://blog.csdn.net/FuckTheWindows/article/details/132482097

你可能感兴趣的:(从股票历史数据量化回测看交易)