互联网大数据下的量化投资

大数据是指信息量规模巨大到在撷取、管理、处理、整理等方面大大超出了传统数据库软件工具能力范围的数据集合。伴随着全球经济一体化和全球信息化的快速发展,以及互联网技术带来的信息变革,“大数据”已经成为互联网领域最炙手可热的方向。此外,大数据的影响不仅仅局限于信息技术方面,它还在“吞噬”、重建一些传统行业,如何利用大数据,开发其中的潜在价值,已经受到各行各业的广泛关注。 互联网的发展也极大地改变了人们的生活方式和习惯,人们越来越习惯于通过网络搜索、了解和关注自己感兴趣的新闻、热点事件等。同时互联网技术的发展也深刻影响着人们的投资习惯以及决策。首先,互联网技术的发展,使得数据的积累呈现指数型速度发展,用户在网上产生海量数据,记录着他们的思想、行为乃至情感,这是信息时代现实社会与网络空间深度融合的产物,蕴含着丰富的内涵和很多规律性信息。通过分析相关数据,可以了解大众投资需求和意愿。其次,互联网每天源源不断产生大量数据,倘若能够更有效地组织和使用大数据进行挖掘分析,获取投资信息进行分析,将给传统的投资决策等带来新的机遇。 纵观海内外,对大数据相关的量化投资策略的研究近几年刚刚兴起,但对互联网大数据相关量化策略的研究已然成为量化投资新的研究方向和热门研究领域。2011年5月,英国对冲基金Derwent Capital Markets建立了规模为4000万美金的对冲基金,该基金是首家基于社交网络的对冲基金,通过分析Twitter的数据内容来感知市场情绪,从而指导进行投资。在2012年,CAYMAN ATLANTIC公司新成立了一 只基于网络社交媒体Twitter、搜索引擎Google及其他新闻媒体数据的进行交易的对冲基金。根据其官网披露的基金历史收益数据,截止2015年12月,该基金累计收益率高达63.21%,年化收益率为15.02%,在基金运行的42月中有32个月获得了正收益,亏损的10个月当中,平均月亏损为-0.45%,而获得正收益的月份中,平均月收益率为2.12%。国内各大公募基金等机构相继与互联网公司合作,推出了一些大数据基金产品,如广发基金与百度的中证百度百发策略100指数型基金、南方基金与新浪合作的大数据100指数型基金等。目前国内大数据量化产品包括了指数型、股票型和混合型基金以及集合资产管理计划等类型。

基于概念指数和对应舆情数据的相关性分析,发现概念指数和对应舆情数据两者之间有较强的相关性而且舆情信息的变化要先于对应概念指数的变化。当某个概念指数的舆情指数涨幅较大时,说明该热点可能是近期的投资热点,受到了投资者的广泛关注。如果该概念指数还未出现明显上涨,那么它有较大可能在未来几天出现上涨。本专题策略以周为统计区间,每个时间区间内分别统计概念指数和对应舆情数据的涨跌,为了更好地度量概念指数是否出现上涨以及涨幅,本专题策略对涨幅设臵阈值。当概念指数和它对应的概念板块指数涨幅同时满足高于或低于某个阈值时发出看多信号。为了能够更好地使资金分配于未来存在较大上涨可能的概念板块,如果有数目较多(多于n个)的概念指数同时发出看多信号,作进一步筛选。将初步选择出的概念指数按涨幅排序分成三挡,同时按舆情涨幅分成三挡,选择同时满足舆情涨幅处于最大的一档,对应概念指数行情涨幅处于最小的一档。如果筛选不出概念热点,放宽对指数涨幅的限制,直至筛选出概念热点停止筛选过程。选择出概念热点后固定持仓3个交易日后平仓。等待下一买入信号发出前,持有资产。

基于舆情数据概念板块轮动策略,根据舆情变化和行情变化有较强的正相关关系,且舆情变化会领先于行情变化构建了量化择时策略。实证结果表明利用概念板块舆情信息作为买入信号源在历史区间内具有良好表现。基于概念舆情数据的概念板块轮动策略的要点包括: 1、概念舆情能够很好地代表了舆情信息。利用网络爬虫程序抓取了概念热点相关的历史舆情数据,wind的概念指数的历史行情数据用于策略构建。

2、本专题策略中对概念热点的舆情和历史数据涨幅设臵阈值,当舆情涨幅和概念指数幅突破阈值时,发出买入信号买入概念指数,固定持有3个交易日后平仓,资金等权分配于概念指数。对阈值参数组合进行敏感性测试选择出了最优参数组合,

4.2 研究不足与未来方向

1、本专题策略假设概念指数是可以买卖的,在实际操作中需要买卖指数对应的ETF产品或者在概念指数下选择它的成分股构建投资组合。 2、以一周为时间区间判断舆情和指数行情是否出现上涨,选择概念热点后持仓3个交易日,导致策略中每周可能会有1-2个交易日处于空仓日期。未来可以改进策略,在空仓日期再做相同判断,选择性买入指数,减少空仓日期,在控制住策略的回撤的同时,增强策略的收益。

米筐量化交易平台:http://www.ricequant.com

量化炒股QQ群:484490463  群内大神每日在线讲解代码,用Python自动赚钱!

你可能感兴趣的:(互联网大数据下的量化投资)