这是邢不行第 64 期量化小讲堂的分享
作者 | 邢不行、助教林奇
本文内容也有视频版本,点击观看:量化交易中,筹码分布指标如何计算【邢不行】
记得小时候的某个暑假,一边吃西瓜,一边看港剧《大时代》。
里面炒股的场景给我留下了很深的印象,也为之后进入金融行业埋下了一个种子。
剧里有经典的一幕,一位投资大师为了让主人公帮其报仇,教他炒股。图中大师正使用香烟代表筹码,推演股价走势。
小时候的我只是记得这一幕但并不理解,之后回想才明白,他们在讲的应该是筹码分布理论。
有一定经验的A股投资者,应该都或多或少的听过筹码分布,本文我们就谈谈在量化投资中如何计算筹码分布,附有计算代码。
我是08年左右开始炒股的,之前的市场没有亲历,不清楚筹码分布理论具体是什么时候引入中国市场。
只能通过查看资料,大致推测A股市场的筹码分布最早是由行情软件“指南针”在1997年提出的。
那么筹码分布到底是什么呢?
我们都知道一只股票在上市时会发行很多股份,那这每一股就代表了一个筹码。
而每一股在成交后都会有一个最近的成交价格,比如某只股票在13元成交1000股,14元成交500股,15元成交2000股。
分布就是指将筹码按照其最近成交价格进行分类,统计每个成交价格上筹码的数量。
我们把一只股票所有的筹码都按照最近一次成交价进行分类排列,就能得到筹码分布图:
一般的行情软件都会提供筹码分布图。以同花顺为例,在K线图的右侧就有筹码分布图,图中价格上的柱线代表了筹码分布的数量。
上图中45元左右集中了很多筹码,说明很多股票都是在45元附近成交的。
随着鼠标在K线上移动,筹码分布图也会跟着变动,这是一个随着每天的交易而变动的动态过程。
虽然筹码分布问世多年,但至今热度依旧不减。各种新闻上经常提到,也有很多同学加我问我筹码分布相关的问题。
各类行情软件上的筹码分布图
基本上所有的行情软件也都提供筹码分布指标,这使得我们可以很方便的查到任意一只股票的筹码分布。
但我们做量化投资,光看这个图是没用的,一定要有最原始的数据。
只有有了筹码分布的具体数据,才能对此进行加工处理,构建各类量化交易策略。
行情软件上的筹码分布到底是如何计算的呢?
让我们回到股票发行的起点。
假设股票A以10元的价格发行1000股,那它发行时的筹码分布是这样的:
所有筹码的成本都是10元,其他价位上的筹码是0。
假设股票A开始上市交易,并且我们获取到了股票A的逐笔交易数据。
第一笔交易以10.3的价格成交了300股,在这一笔交易结束之后,筹码分布会变成这样:
10元的筹码减少300股,10.3元的筹码增加300股。
第二笔交易以10.5的价格成交了200股,毫无疑问10.5元的筹码会增加200股,但关键问题是,这200股从哪里来呢?
这其实取决于这200股到底是从10元的价位卖出,还是从10.3元的价位卖出,亦或两者都有。
遗憾的是这个数据只有交易所知道,并且绝对不会对外公布。
所以我们从第二笔交易开始就已经算不清楚准确的筹码分布了,更何况之后更多的交易了。
所以理论上,经过以上简单的推理,我们根本画不出准确的筹码分布图。
既然我们都不知道筹码的准确来源,那行情软件是怎么画筹码分布图的呢?
其实方法非常简单粗暴,既然不知道卖出的筹码到底从哪个价格来,那么干脆一刀切,强制让所有价格的筹码都卖出相同的比例。
什么意思呢?比如刚刚第二笔交易以10.5元成交200股。
这200股占总股本的20%,我就从原来的所有价位都卖出20%。
经过第二笔交易后,10.3元的价位卖出20%变为240股,10元的价位也卖出20%变为560股。
知道第二笔交易怎么处理后,第三笔、第四笔可依此类推,只要有逐笔数据我们就能画出筹码分布图。
有的行情软件算法会更高级一点,并不是所有价格档位都按照相同的比例卖出。
有的算法认为盈利越多的价格,越倾向于减仓。10元的盈利比10.3元高,所以10元的减仓比例高于10.3元。
而有的算法认为持有时间越长,越倾向于减仓。
当然,虽然这些算法在尝试逼近真实情况,但肯定还是有差距的。
不过有的行情软件就没那么讲究了,会进一步偷懒。
什么意思呢?我们之前讲的算法是用逐笔数据近似的,数据量非常大。
有的行情软件为了偷懒,把一整天的交易数据合并成一笔交易数据,即当日的均价和总成交量。然后仅仅用这一笔数据,来计算筹码分布。
这样算出来的数据,是近似的近似,失真程度大家可以自己想象。
合并成一笔
根据之前讲的原理,其实我们已经可以自己用python画出筹码分布了。
下图是我用python实现计算筹码分布的代码,代码就不逐行讲解了,如果有看不懂的地方欢迎和我沟通。
我用浦发银行的数据作为案例计算其筹码分布的结果:
第一行数据代表,以126的价格(已经复权)成交的股票,占到所有股份的0.38%。
依据这张表画出来的图,能直观地表现出浦发银行的筹码分布:
上图中可以非常清楚地看到在116元附近分布了很多筹码,这个价格可能是一个重要的支撑或者阻力位。
上面的代码和数据,都可以跟我询问。
如果很多人感兴趣,之后也会讲一下基于筹码分布数据开发的量化策略,感兴趣的朋友可以直接留言。