IBM SPSS Modeler通过数据挖掘我们能从股市数据得到什么

原本链接:http://tecdat.cn/?p=4838

众所周知,在证券投资领域将涉及很多数据,因此,通过简单的处理难以有效地分析各种公司股票之间的关系,而关联规则挖掘可以很好的解决这个问题,它允许投资在大量数据中,发现企业股票的相关性,以进一步研究和分析。是股民的得力助手!

我们从2015年1月至2016年1月收集了香港部分上市公司的股票交易数据,作为分析主体,探讨其间的潜在影响。

IBM SPSS Modeler通过数据挖掘我们能从股市数据得到什么_第1张图片

现在通过关联规则分析挖掘出,当股价上涨的时候,另一股票的价格会随着情况而上涨的情况。

首先,股票交易数据可视化,观察股价之间的关系。 在IBM SPSS Modeler软件中,我们使用网络图节点来分析上市公司股价上涨的潜在联系,并找出其间的强关联规则。

IBM SPSS Modeler通过数据挖掘我们能从股市数据得到什么_第2张图片

线段的粗细程度由线段两端点的股票的价格同时上涨的天数决定,如果线段两端的股票的价格同时上涨的实际情况的频数越大,那么链接两只股票间的线段就越粗。如果线段两端的股票的价格同时上涨的实际情况的频数越小,那么链接两只股票间的线段就越细。从这一图中很明显的可以看出复兴医药和白云山之间有着很强的关联。

提高阈值的网络图

IBM SPSS Modeler通过数据挖掘我们能从股市数据得到什么_第3张图片

得到基于 Apriori 算法的关联规则的结果 :

关联规则结果

IBM SPSS Modeler通过数据挖掘我们能从股市数据得到什么_第4张图片

第一行规则表明, 当该白云山价格出现上涨的趋势时,股票复星医药的股价很可能也会随之上涨。原因是在股票的历史交易数据中发现股票白云山和股票复星医药 同时上涨的情况发生了 130 次,占总事件的 35%,在这些时候有 100%的时候股票白云山的价格也发生了上涨

但是预测对了就能挣钱吗? 这个就不一定。 建立的是一种数学或者统计模型,它能表现出已有数据的一些规律,但是未来的数据是否遵循这种规律,是不一定的。尤其是外在环境变量太多,甚至有人为因素。风险的控制,资金管理,自我情绪的管理这些都也很重要。技术大牛们都说系统交易到最后都是对人性的考验。

你可能感兴趣的:(spss)