python爬取股票平均成本怎么算_Python-多个股票的投资组合分析,对,进行

一、 股票数据

1 股票选择

一共有十只股票,投资者购买目标指数中的资产,如果购买全部,从理论上讲能够完 美跟踪指数,但是当指数成分股较多时,购买所有资产的成本过于高昂,同时也 需要很高的管理成本,在实际中一般不可行,投资者购买成分股时,过多过少都不太合理。所以对十只股票数据选择。分别考虑风险最小和收益与风险平衡两种选择。此处不详细讨论股票的选择问题。

根据各股票所占投资权重选择股票。

1-1 风险最小时

十只股票所占权重:

[0.1753033 0.00369514 0.15429923 0.05403638 0.05760288 0.08978148 0.0404732 0.24393783 0.11091322 0.24791015]

权重大小代表在风险最小的情况下选择各支股票的概率,筛选出前五的股票:abc001,abc003,abc008,abc009,abc010作为成分股。

1-2 投资最优组合

收益和风险平衡时,各支股票的占比为:

[0.13995881 0.04174609 0.0744733 0.19486535 0.06728951 0.03574238 0.04879157 0.17721958 0.04126201 0.22572025]

根据模拟的结果,我们选取股票:abc001,abc004,abc007,abc008,abc010五支股票

首先导入将要用的Python包。

import pandas as pd

import matplotlib.pyplot as plt

from pandas import read_excel

import numpy as np

下面只展示1-1选择的股票组合(1-2选择的组合类似,只需要改变股票名)

2 获取每支股票的收盘价

将股票的每日的收盘价存入数据框 StockPrices 变量中。

# 创建空的DataFrame变量,用于存储股票数据

StockPrices = pd.DataFrame()

market_value_list=[] #存储每支股票的平均市值

# 创建股票代码的列表

ticker_list = ['abc001','abc003','abc008','abc009','abc010']

# 使用循环,挨个获取每只股票的数据,并存储每日收盘价

for ticker in ticker_list:

stock_data = pd.read_excel('C:/Users/asus/Desktop/zqb/data/'+ticker+ '.xlsx', parse_dates=['时间'], index_col='时间',encoding='utf-8')

stock_data=stock_data.loc['2019-01-29':'2020-03-25']

market_value_list.append(stock_data['成交量'].mean())

StockPrices.index.name = 'date' # 日期为索引列

# 输出数据的前5行

print(StockPrices.head())

3 计算股票的日收益率

计算股票每天的收益率,将数据存储在数据框 StockReturns 变量中。

# 计算每日收益率,并丢弃缺失值

StockReturns = StockPrices.pct_change().dropna()

# 打印前5行数据

print(StockReturns.head())

至此,我们已经准备好了用于分析的数据 StockReturns, 它记录了5支股票2019-01-29到2020-03-26每天的收益率。

二、投资组合的收益计算

我们选了5支股票,可资金怎么分配呢?这就需要对它们设置相应的权重,下面我们采用两种权重分配的方案,来计算不同组合下的投资收益。

1 给定权重的投资组合

第一种方案是预先设置一组权重(所有股票权重的和为1)。这5支股票:对应的权重如下:[0.35,0.25,0.17,0.1,0.13]。

我们将每支股票的收益,乘上其对应的权重,得到加权后的股票收益;再对所有股票加权后的收益求和,得到该组合投资的收益。

stock_return = StockReturns.copy()

# 绘制直方图

#给定权重的投资组合

# 设置组合权重,存储为numpy数组类型

portfolio_weights = np.array([0.35,0.25,0.17,0.1,0.13])

# 计算加权的股票收益

WeightedReturns = stock_return.mul(portfolio_weights, axis=1)

# 计算投资组合的收益

StockReturns['Portfolio'] = WeightedReturns.sum(axis=1)

# 打印前5行数据

print(StockReturns.head())

# 绘制组合收益随时间变化的图

StockReturns.Portfolio.plot()

plt.show()

最后一列为组合投资的收益。

回执该组合投资收益随时间变化的图如下:

定义累积收益曲线绘制函数cumulative_returns_plot(),并绘制给定权重投资组合的累积收益曲线

# 定义累积收益曲线绘制函数

def cumulative_returns_plot(name_list):

for name in name_list:

CumulativeReturns = ((1+StockReturns[name]).cumprod()-1)

CumulativeReturns.plot(label=name)

plt.legend()

plt.show()

2 等权重的投资组合

第二种方案是平均分配每支股票的权重,使它们都相等。这是最简单的投资方法,可作为其他投资组合的参考基准。计算方法和上面一致,只需更改存储权重的数组。

##平均分配每支股票的权重

# 设置投资组合中股票的数目

numstocks = 5

# 平均分配每一项的权重

portfolio_weights_ew = np.repeat(1/numstocks, numstocks)

# 计算等权重组合的收益

StockReturns['Portfolio_EW'] = stock_return.mul(portfolio_weights_ew, axis=1).sum(axis=1)

# 打印前5行数据

print(StockReturns.head())

# 绘制累积收益曲线

cumulative_returns_plot(['Portfolio', 'Portfolio_EW'])

三、投资组合的相关性分析

1 投资组合的相关矩阵

相关矩阵用于估算多支股票收益之间的线性关系,可使用pandas数据框内建的 .corr()方法来计算。

#投资组合的相关性分析

# 计算相关矩阵

correlation_matrix = stock_return.corr()

# 输出相关矩阵

print(correlation_matrix)

矩阵中每一个元素都是其对应股票的相关系数,取值从-1到1,正数代表正相关,负数代表负相关。我们观察到矩阵的对角线永远是1,因为自己和自己当然是完全相关的。另外相关矩阵也是对称的,即上三角和下三角呈镜像对称。

为了便于观察,可以将数值的相关矩阵用热图的形式展现出来。以下采用了 seaborn 包来绘制热图。

import seaborn as sns

#创建热图

sns.heatmap(correlation_matrix,annot=True,cmap='rainbow',linewidths=1.0,annot_kws={'size':8})

plt.xticks(rotation=0)

plt.yticks(rotation=75)

plt.show()

2 投资组合的协方差矩阵

相关系数只反应了股票之间的线性关系,但并不能告诉我们股票的波动情况,而协方差矩阵则包含这一信息。可使用pandas数据框内建的 .cov() 方法来计算协方差矩阵。

#投资组合的协方差矩阵

# 计算协方差矩阵

cov_mat = stock_return.cov()

# 年化协方差矩阵

cov_mat_annual = cov_mat * 252

# 输出协方差矩阵

print(cov_mat_annual)

3 投资组合的标准差

投资组合的风险可以用标准差来衡量,只要知道组合权重和协方差矩阵,就可以通过以下公式进行计算。

在NumPy中,使用.T属性对数组进行转置,np.dot()函数用于计算两个数组的点积。

#投资组合的标准差

# 计算投资组合的标准差

portfolio_volatility = np.sqrt(np.dot(portfolio_weights.T, np.dot(cov_mat_annual, portfolio_weights)))

print(portfolio_volatility)

计算的标准差为:0.2735217278102413

四、探索股票的最优投资组合

应该选择怎样的组合权重才是最好的呢?我们需要综合权衡风险和收益这两个因素。

诺贝尔经济学奖得主马科维茨(Markowitz)提出的投资组合理论被广泛用于组合选择和资产配置中。该理论中的均值-方差分析法和有效边界模型可用于寻找最优的投资组合。

1 使用蒙特卡洛模拟Markowitz模型

采用蒙特卡洛模拟来进行分析,也就是随机生成一组权重,计算该组合下的收益和标准差,重复这一过程许多次(比如1万次),将每一种组合的收益和标准差绘制成散点图。

#使用蒙特卡洛模拟Markowitz模型

# 设置模拟的次数

number = 10000

# 设置空的numpy数组,用于存储每次模拟得到的权重、收益率和标准差

random_p = np.empty((number, 7))

# 设置随机数种子,这里是为了结果可重复

np.random.seed(7)

#循环模拟10000次随机的投资组合

for i in range(number):

#生成10个随机数,并归一化,得到一组随机的权重数据

random5=np.random.random(5)

random_weight=random5/np.sum(random5)

#计算年平均收益率

mean_return=stock_return.mul(random_weight,axis=1).sum(axis=1).mean()

annual_return=(1+mean_return)**252-1

#计算年化标准差,也成为波动率

random_volatility=np.sqrt(np.dot(random_weight.T,np.dot(cov_mat_annual,random_weight)))

#将上面生成的权重,和计算得到的收益率、标准差存入数组random_p中

random_p[i][:5]=random_weight

random_p[i][6]=annual_return

random_p[i][6]=random_volatility

#将Numpy数组转化为DataF数据框

RandomPortfolios=pd.DataFrame(random_p)

#设置数据框RandomPortfolios每一列的名称

RandomPortfolios.columns=[ticker +'_weight' for ticker in ticker_list]+['Returns','Volatility']

#绘制散点图

RandomPortfolios.plot('Volatility','Returns',kind='scatter',alpha=0.3)

plt.show()

投资的本质是在风险和收益之间做出选择,上图正是刻画了这两个要素。其中每一个点都代表着一种投资组合的情况,横坐标是代表风险的标准差,纵坐标是收益率。

Markowitz投资组合理论认为,理性的投资者总是在给定风险水平下对期望收益进行最大化,或者是在给定收益水平下对期望风险做最小化。反映在图中所示的有效边界,只有在有效边界上的点才是最有效的投资组合。

现在我们知道,理性的投资者都会选择有效边界上的投资组合。可具体选择哪个点呢?

2 投资风险最小组合

一种策略是选择最低的风险,且在该风险水平下收益最高的组合,称为最小风险组合(GMV portfolio)。

让我们找到风险最小的组合,并绘制在代表收益-风险的散点图中。

# 找到标准差最小数据的索引值

min_index = RandomPortfolios.Volatility.idxmin()

# 在收益-风险散点图中突出风险最小的点

RandomPortfolios.plot('Volatility', 'Returns', kind='scatter', alpha=0.3)

x = RandomPortfolios.loc[min_index,'Volatility']

y = RandomPortfolios.loc[min_index,'Returns']

plt.scatter(x, y, color='red')

#将该点坐标显示在图中并保留四位小数

plt.text(np.round(x,4),np.round(y,4),(np.round(x,4),np.round(y,4)),ha='left',va='bottom',fontsize=10)

plt.show()

# 提取最小波动组合对应的权重, 并转换成Numpy数组

GMV_weights = np.array(RandomPortfolios.iloc[min_index, 0:numstocks])

# 计算GMV投资组合收益

StockReturns['Portfolio_GMV'] = stock_return.mul(GMV_weights, axis=1).sum(axis=1)

#输出风险最小投资组合的权重

print(GMV_weights)

收益-风险的散点图以及获取风险最小组合权重如下:

3 投资最优组合

1)夏普比率

理性的投资者一般都是固定所能承受的风险,追求最大的回报;或者在固定预期回报,追去最小的风险。夏普比率计算的是每承受一单位的总风险所产生的超额回报。计算公式如下:

分子计算了差值,说的是将某项投资与代表整个投资类别的基准进行比较,得到超额回报。分母标准差代表收益的波动率,对应着风险,因为波动越大预示着风险越高。

将超额回报的均值除以其标准差,即可得到衡量回报和风险的夏普比率。另外需再乘上sqrt(252) (一年有252个交易日),得到年化的夏普比率。

2)夏普最优组合的选择

在收益和风险之间找到平衡点,首先计算上述蒙特卡洛模拟的组合所对应的夏普比率,并将之作为第三个变量绘制在收益-风险的散点图中。

#投资最优组合

# 设置无风险回报率为0

risk_free = 0

# 计算每项资产的夏普比率

RandomPortfolios['Sharpe'] = (RandomPortfolios.Returns - risk_free) / RandomPortfolios.Volatility

# 绘制收益-标准差的散点图,并用颜色描绘夏普比率

plt.scatter(RandomPortfolios.Volatility, RandomPortfolios.Returns, c=RandomPortfolios.Sharpe)

plt.colorbar(label='Sharpe Ratio')

plt.show()

我们发现散点图上沿的组合具有较高的夏普比率。接着再找到夏普比率最大的组合,将其绘制在收益-风险的散点图中。

# 找到夏普比率最大数据对应的索引值

max_index = RandomPortfolios.Sharpe.idxmax()

# 在收益-风险散点图中突出夏普比率最大的点

RandomPortfolios.plot('Volatility', 'Returns', kind='scatter', alpha=0.3)

x = RandomPortfolios.loc[max_index,'Volatility']

y = RandomPortfolios.loc[max_index,'Returns']

plt.scatter(x, y, color='red')

#将该点坐标显示在图中并保留四位小数

plt.text(np.round(x,4),np.round(y,4),(np.round(x,4),np.round(y,4)),ha='left',va='bottom',fontsize=10)

plt.show()

# 提取最大夏普比率组合对应的权重,并转化为numpy数组

MSR_weights = np.array(RandomPortfolios.iloc[max_index, 0:numstocks])

# 计算MSR组合的收益

StockReturns['Portfolio_MSR'] = stock_return.mul(MSR_weights, axis=1).sum(axis=1)

#输出夏普比率最大的投资组合的权重

print(MSR_weights)

收益-风险的散点图以及夏普比率最大组合权重如下:

参考文章

Python3-对多股票的投资组合进行分析

(需要数据的话私信我)

你可能感兴趣的:(python爬取股票平均成本怎么算_Python-多个股票的投资组合分析,对,进行)