[原创][R语言]股票分析实战[3]:周级别涨幅趋势的相关性

[简介]
常用网名: 猪头三
出生日期: 1981.XX.XX
QQ联系: 643439947
个人网站: 80x86汇编小站 https://www.x86asm.org
编程生涯: 2001年~至今[共22年]
职业生涯: 20年
开发语言: C/C++、80x86ASM、PHP、Perl、Objective-C、Object Pascal、C#、Python
开发工具: Visual Studio、Delphi、XCode、Eclipse、C++ Builder
技能种类: 逆向 驱动 磁盘 文件
研发领域: Windows应用软件安全/Windows系统内核安全/Windows系统磁盘数据安全/macOS应用软件安全
项目经历: 磁盘性能优化/文件系统数据恢复/文件信息采集/敏感文件监测跟踪/网络安全检测

[序言]
经过上一篇文章:[原创][R语言]股票分析实战[2]:周级别涨幅趋势的相关性-CSDN博客, 我们发现了"频率(Freq)"与"涨幅(RC)"关系最密切, 看到这里, 如果是喜欢刨根问底的人, 就会去思考, 既然是最密切的, 那到底有多密切呢? 密切的程度是多少? 那么这篇文章是相当的重要也是非常关键的, 如果这个内容不理解, 那么对后期更深入的内容, 就会越看越糊涂.

[道歉]
本来预计本篇文章内容是写"如何通过图形进一步观察数据的相关性", 但是上一篇文章我竟然漏到了关键的内容, 也就是本章的内容: 最密切的两组数据, 那到底有多密切呢? 密切的程度是多少?

[学习这个概念, 我们不需要高深的数学理论, 我通篇用普通人能看懂的语言来描述]
要了解两组不同数据的密切程度, 需要通过一个叫"p-value"的东西, 中文翻译过来叫"P值". 那么这个所谓的"P值"能反应出什么结果呢?
1> 它的数值范围是 -1~1 之间, 如果数值接近于0, 那么就说明当前的两组数据密切程度越高.
2> 分析两组数据的密切程度(即P值), 首先计算公式会预先假设这两组数据是没有任何关系的, 也就是0密切度. 其实真正的数学术语是"零假设".
3> 当计算公式完成计算后,给出一个p-value=0.3(即P值=0.3),那么说明什么? 这里是重点, 大家睁大眼睛看如下描述:
    3.1> p-value=0.3 说明 两组数据没有相互关系, 没有密切关系 的 出现概率为0.3. 那么在参考标准:0.05 是一个常用标准分界线.  
    3.2> 由此可以得出, 两组数据的密切度很低, 也就说他们之间的关系不是很强.

如果看懂上面的描述了, 那么可以参考[原创][R语言]股票分析实战[2]:周级别涨幅趋势的相关性-CSDN博客这篇文章, 我们预判出来的结果是:  "频率(Freq)"与"涨幅(RC)"的密切关系度 比 "频率(Freq)"与"周1~周5(DW)" 高. 大家可能还不会相信这样的预判结果, 那么下面通过R语言一个简单的函数就能分析出来.

[通过R语言的psych包的corr.test()函数分析两组数据的相关性, 以及相关性的显著性(即p-value, 也就是P值)]

library(psych)
corr.test(stock_demo_rc_table_Freq, use="complete")

Call:corr.test(x = stock_demo_rc_table_Freq, use = "complete")
Correlation matrix 
        RC   DW  Freq
RC    1.00 0.00 -0.19
DW    0.00 1.00  0.05
Freq -0.19 0.05  1.00
Sample Size 
[1] 30
Probability values (Entries above the diagonal are adjusted for multiple tests.) 
      RC   DW Freq
RC   0.0 1.00 0.91
DW   1.0 0.00 1.00
Freq 0.3 0.79 0.00

 To see confidence intervals of the correlations, print with the short=FALSE option

上通过上面的红色数据部分, 可以很清晰的看出: "频率(Freq)"与"涨幅(RC)"的p-vaule值为0.3,  "频率(Freq)"与"周1~周5(DW)"为0.79, 虽然这2个数值都偏离的标准, 但是一个0.3,一个0.79, 按照前面的说法"如果数值无限接近于0, 那么就说明当前的两组数据密切程度越高.", 这个数据已经证明了: "频率(Freq)"与"涨幅(RC)"关系最密切, 那么今后也就是需要重点研究的对象.

[结尾]
这篇文章的内容是十分的重要的, 如果大家没看懂, 可以多看几遍, 最好能装上R语言, 进行验证和感受一下数据的奥秘. 只要你习惯去深究数据的细微变化, 那么炒股是不会亏钱的. 这点我是100%保证.
 

你可能感兴趣的:(#,R语言大数据分析,r语言,开发语言,大数据,股票)