numpy:python数据领域的功臣丨数据工匠简报(9.26)

numpy:python数据领域的功臣

numpy:python数据领域的功臣丨数据工匠简报(9.26)_第1张图片

数据分析面向的数据大多数是二维表。一门好的数据分析语言,首先需要能够直接有个数据结构存下这个二维表,然后要配上一套成熟的类SQL的数据操作接口,最后要有一套好用的可视化工具。R语言就是一个极好的典范:用内置的data.frame结构做数据的存储;data.frame本身提供足够强大的数据操作能力,另有dplyr、tidyr、data.table、plyr、reshape2等库提供更好用更高效的数据操作能力;在绘图上,除了基本的plot功能外,还提供了ggplot2这样一套优雅的绘图语言,还通过htmlwidget库与javascript各种绘图库建立了紧密的联系,让可视化的动态展示效果更进一步。Excel也是一个极好的例子,有单元格这种灵活的结构为数据存储做支撑,有大量的函数实现灵活的操作,也有强大的绘图系统。

python目前在数据分析领域也已经具备了相当可观的能力,包括pandas库实现的DataFrame结构,pandas本身提供的数据操作能力,matplotlib提供的数据可视化能力,而这一切都离不开numpy库。


numpy:python数据领域的功臣丨数据工匠简报(9.26)_第2张图片

瞎扯“量化组合投资” | 【第一期】收益与模型

numpy:python数据领域的功臣丨数据工匠简报(9.26)_第3张图片

股票投资的收益来自哪里?
大概每个人都能说出一些见解,谁对谁错这个事基本也说不清。但基本上,有一个大家都能接受的影响因素——市场(这里说的市场指股票市场的整体情况,可以通过市场指数进行反映,譬如A股市场的上证指数)。

每只股票在一段时间内的收益情况或多或少地都跟这段时间内的市场指数收益情况有相关性,这种相关性的强弱我们一般用一个量化的数值表示,就是“市场贝塔(market beta)”,记为βM。

假如,一只股票的βM =1.1,那么当市场指数的收益率是rM=5%的时候,在这只股票的收益里面市场贡献的部分就是1.1*5% = 5.5%。但实际上,这支股票的真实收益率不一定就正好是5.5%,假设它的实际收益率是r=6%,那么多出来的部分6% - 5.5% = 0.5% 就是市场之外因素贡献的部分,一般称之为“阿尔法(alpha)”,记为α。整体上写作公式的话,就是···

numpy:python数据领域的功臣丨数据工匠简报(9.26)_第4张图片

瞎扯“量化组合投资” | 【第二期】风险的控制

numpy:python数据领域的功臣丨数据工匠简报(9.26)_第5张图片

首先,我得声明一下,我真不是不想讨论赚钱的问题,但有一句至理名言需要给大家分享:做投资请永远先考虑风险!

不计后果地下注是赌博,不是投资。我们不能只盯着预期收益率,还必须考虑它可能的波动情况(一般用波动率表示,也就是收益率的标准差)。


numpy:python数据领域的功臣丨数据工匠简报(9.26)_第6张图片

如果一个组合的预期收益率是15%,但是波动率却是20%,那么这个15%的收益是非常不稳定的,组合很有可能在投资期间的某个(或者多个)时点上是-10%这样的负收益。在这种时候,如果你是个人投资,那多半是吃嘛嘛不香,咋睡睡不好。如果你是资产管理人,那投资人如果还没撤资也是在撤资边缘了。所以,我们为了能吃好睡好,在投资前最好能够充分地估计组合的风险情况。

继续上面的例子,投资一篮子股票,约莫大几十至几百只吧,这一篮子股票构成的组合的波动率到底如何估计呢?


numpy:python数据领域的功臣丨数据工匠简报(9.26)_第7张图片

以上简讯由数据工匠提供,感兴趣的小伙伴可以通过扫描简报后的二维码链接原文,更多数据科学资讯尽在数据工匠,扫码关注Datartisan数据工匠公众号!如果你看到什么与“数据科学”有关的好文或者信息科技优质的文章,可以随手转发给我们,让更多热爱数据科学的小伙伴一起成长!


numpy:python数据领域的功臣丨数据工匠简报(9.26)_第8张图片

你可能感兴趣的:(numpy:python数据领域的功臣丨数据工匠简报(9.26))