rokia_xmu

Fama-French 三因子模型在A股市场的实证研究

https://uqer.io/community/share/5784b3d1228e5b8a09932d9e

 Fama-French 三因子在A股市场的实证研究 Fama-French三因子模型无疑是量化领域最经典的模型之一，该模型的提出是在论文《commom risk factors in returns on bonds and stocks>里，本帖本着学习的精神对其进行了学习，并使用论文中的方法在中国A股市场上进行了实证。\begin{align}E(R(t))=R_f(t)+bE(R_M(t)-R_f(t))+sE(SMB(t))+hE(HML(t))\end{align}
  RM−Rf 表示的是市场因子， SMB 表示的是规模(市值)因子， HML 表示账面市值比因子

 一.背景 资本资产定价模型（CAPM）问世以后，许多学者对其进行了实证研究，如Black和Scholes（1972）及Fama(1973)的检验证明，对1969年以前的数据而言，资本资产定价模型是有效的，而对之后的数据，却缺乏说服力。在横截面数据里，股票的平均收益和市场 β 相关性很低，因而更多影响股票收益的因素亟待发掘。
 Fama和French(1992)研究了市场 β , 市值(size), 账面市值比(book-to-market equity),财务杠杆(leverage) 和市盈率(E/P)对平均收益的影响。横截面回归后发现，在独立检验四者对平均收益的影响时，四者都表现出了很强的解释能力，而 β 很弱；在进行多变量回归时，市值和账面市值比这两个因子吸收了另两个因子的解释能力，成为了解释平均收益的决定性变量
 1993年，Fama和French的论文《commom risk factors in returns on bonds and stocks〉正式标志着三因子模型的建立。在该论文里，他们不仅研究了影响股票收益的因子模型，还研究了对债券收益的因子模型；更重要的是，不同于以往的横截面回归，该论文使用了Black,Jensen和Scholes的时间序列回归方法，对影响股票收益的市场超额收益，规模和账面市值比三个因子进行了实证研究。
 下面，本帖就论文里对股票三因子模型的研究思路，在优矿平台上对中证800成分股从2007.6到2016.5的数据进行了实证研究，以验证三因子模型的有效性。

 二.研究思路 1.Black-Jensen-Scholes时间序列回归 横截面回归大家都非常熟悉，无论是单变量还是多变量回归，都是在研究解释变量对响应变量的解释能力。Black-Jensen-Scholes时间序列回归的方法是Black,Jensen和Scholes所提出来验证CAPM的。早期的验证方法是先使用一个单只股票的时间序列回归估计贝塔，再用横截面回归验证CAPM推出的假设。但是这样回归会有误差项存在相关性，贝塔非平稳等问题，时间序列回归则避免了这些问题。即根据前一期估计的贝塔值对股票排序再进行分组，分别估计各投资组合的阿尔法和贝塔，每五年重新估计贝塔，然后检验各个投资组合的阿尔法是否显著为0,从而验证CAPM\begin{align}E(R(t))=R_f(t) +\beta(E(R_M(t))-R_f(t))\end{align}
 2.解释变量 解释变量就是我们需要验证的三个因子，市场超额收益，规模和账面市值比。我们要按照论文里的思路对其进行处理。
 1）分组 把股票按每年5月末时的市值（size）大小进行排序，按照50%分位值把股票分为S(small)和B(big)两组；
 再依据5月末时的账面市值比（我们取1/PB）大小对800只股票进行排序，分为L（low，30%）,M(medium,40%),H(high,30%)三组;
 再分别对S,B和L,M,H取交集，股票即被分为了SL,SM,SH,BL,BM,BH六组。
 也就是说，分组每年5月末进行一次，800只股票每次被重新分为了SL,SM,SH,BL,BM,BH六组，前一年6月到第二年5月重新分组时的投资组合都是一样的
 这里为什么要按市值分为两组，按账面市值比分为三组呢？是因为账面市值比有更强的作用，我们要把它分得更细。
 (PS:论文里是6月末按照市值大小分组，账面市值比依据的是前一年末时的数据，个人以为5月末也没事)

 
       
#定义了一个进行分组的函数get_6groups，方便对每年的数据进行分组
#这里的账面市值比用的是1/PB
import numpy as np
import pandas as pd 
def get_6groups(breakpoint):   #breakpoint是每年进行分组的时间点，这里是每年5月末
    C=DataAPI.MktEqudGet(ticker='000028',beginDate=str(int(breakpoint)-20),endDate=breakpoint,field=u"ticker,tradedate")
    breakpoint=filter(lambda x:x.isdigit(),C.iat[len(C)-1,1])                         #取breakpoint前最近一个交易日日期
    universe = set_universe('000906.ZICN',date=breakpoint)                           #取当时的中证800股指成分股
    ME=DataAPI.MktEqudGet(tradeDate=breakpoint,secID=universe,field=u"ticker,marketValue").dropna()   #取当时的市值
    ME50=np.percentile(ME['marketValue'],50)                                     #算出市值大小的50%分位值
    S=ME[ME['marketValue']<=ME50]['ticker'].tolist()                                #按市值大小分为两组，存为列表
    B=ME[ME['marketValue']>ME50]['ticker'].tolist()
    BP=DataAPI.MktStockFactorsOneDayGet(tradeDate=breakpoint,secID=universe,field=u"ticker,PB").dropna() 
    BP=BP[BP>0].dropna()                                                  #去掉PB值为负的股票
    BP[['PB']]=1/BP[['PB']]                                                #取1/PB，为账面市值比
    BP30=np.percentile(BP['PB'],30)
    BP70=np.percentile(BP['PB'],70)
    L=BP[BP['PB']<=BP30]['ticker'].tolist()                                      #按1/PB大小分为三组
    H=BP[BP['PB']>BP70]['ticker'].tolist()
    M=list(set(BP['ticker'].tolist()).difference(set(L+H)))
    SL=list(set(S).intersection(set(L)))                                       #对S组和L组的股票取交集，作为SL组的股票组合
    SM=list(set(S).intersection(set(M)))
    SH=list(set(S).intersection(set(H)))
    BL=list(set(B).intersection(set(L)))
    BM=list(set(B).intersection(set(M)))
    BH=list(set(B).intersection(set(H)))
    return SL,SM,SH,BL,BM,BH
 查看全部 
  

下面我们要计算每个投资组合的月收益率，计算投资组合的月收益率时，要算市值加权的收益率，这是为了最小化方差（风险）

 
       
 
            
 
             
#得到投资组合x从Year的6月到Year+1的5月的月收益率序列
def get_returnMonthly(x,Year):
    #先用交易日日历得到Year的5月到Year+1的5月的月末交易日日期
    from CAL.PyCAL import *
    data=DataAPI.TradeCalGet(exchangeCD=u"XSHG",beginDate=str(Year*10000+501),endDate=str((Year+1)*10000+601),field=['calendarDate','isMonthEnd'])
    data = data[data['isMonthEnd'] == 1]
    date= map(lambda x: x[0:4]+x[5:7]+x[8:10], data['calendarDate'].values.tolist())
    #调用投资组合x每只股票每个月末的市值，收盘价用来计算收盘价
    returnMonthly=np.zeros(12)
    for i in range(12):
        inf1=DataAPI.MktEqudAdjGet(tradeDate=date[i],ticker=x,field=u"ticker,closePrice").set_index('ticker')  #前一个月的收盘价
        inf2=DataAPI.MktEqudAdjGet(tradeDate=date[i+1],ticker=x,field=u"ticker,marketValue,closePrice").set_index('ticker')   #当月的收盘价和市值
        Return=pd.concat([inf2,inf1],axis=1)
        Return.columns=['Weight','Return','WReturn']                   #计算每只股票收益率和市值加权的权重以及两者的乘积
        Return['Weight']=Return['Weight']/Return['Weight'].sum()
        Return['Return']=Return['Return']/Return['WReturn']-1
        Return['WReturn']=Return['Weight']*Return['Return']
        returnMonthly[i]=Return['WReturn'].sum()
    return returnMonthly
 
        
 查看全部 
  

 2）因子 市值因子：\begin{align}SMB = 1/3(SL+SM+SH)-1/3(BL+BM+BH)\end{align}表示的是由于公司规模不同造成的风险溢价
 账面市值比因子:\begin{align}HML = (SH+BH)/2-(SL+BL)/2\end{align}表示由于账面市值比不同造成的风险溢价
 可以看出因子的值是一个市值加权月收益率序列,我们研究了九年的数据，所以因子的长度是9*12=108

 
       
#计算每年的SMB和HML因子，合在一起
SMB=[]
HML=[]
r_groups=pd.DataFrame()  #用于存储每个组合的月收益率序列，方便我们之后查看
r_groups['SL']=np.zeros(108)
r_groups['SM']=np.zeros(108)
r_groups['SH']=np.zeros(108)
r_groups['BL']=np.zeros(108)
r_groups['BM']=np.zeros(108)
r_groups['BH']=np.zeros(108)
for Year in [2007,2008,2009,2010,2011,2012,2013,2014,2015]:
    SL,SM,SH,BL,BM,BH=get_6groups(str(Year*10000+531))  #依据当年5月末的市值和账面市值比分组
    r_SL=get_returnMonthly(SL,Year)       #得到当年5月末到次年的市值加权月收益率序列
    r_SM=get_returnMonthly(SM,Year)
    r_SH=get_returnMonthly(SH,Year)
    r_BL=get_returnMonthly(BL,Year)
    r_BM=get_returnMonthly(BM,Year)
    r_BH=get_returnMonthly(BH,Year)
    
    r_groups.iloc[(Year-2007)*12:(Year-2006)*12,[0]]=r_SL.reshape(12,1)   #把组合SL当年5月末到次年的市值加权月收益率序列
    r_groups.iloc[(Year-2007)*12:(Year-2006)*12,[1]]=r_SM.reshape(12,1)
    r_groups.iloc[(Year-2007)*12:(Year-2006)*12,[2]]=r_SH.reshape(12,1)
    r_groups.iloc[(Year-2007)*12:(Year-2006)*12,[3]]=r_BL.reshape(12,1)
    r_groups.iloc[(Year-2007)*12:(Year-2006)*12,[4]]=r_BM.reshape(12,1)
    r_groups.iloc[(Year-2007)*12:(Year-2006)*12,[5]]=r_BH.reshape(12,1)
    
    SMBr=(r_SL+r_SM+r_SH)/3-(r_BL+r_BM+r_BH)/3                         #当年的SMB和HML因子，存为list
    HMLr=(r_SH+r_BH)/2-(r_SL+r_BL)/2   
    SMB += SMBr.tolist()
    HML += HMLr.tolist()
SMB=np.array(SMB)
HML=np.array(HML)
 查看全部 
  

 
#加载画图需要用的包
import matplotlib as mpl
import matplotlib.pyplot as plt
mpl.style.use('ggplot')
import seaborn as sns
 
 查看全部

 下面我们先看一看我们得到的六个组合的市值加权月收益率的情况，直观上符合常理

 
from CAL.PyCAL import *
data=DataAPI.TradeCalGet(exchangeCD=u"XSHG",beginDate=str(2007*10000+501),endDate=str((2015+1)*10000+601),field=['calendarDate','isMonthEnd'])
data = data[data['isMonthEnd'] == 1]
date= map(lambda x: x[0:4]+x[5:7]+x[8:10], data['calendarDate'].values.tolist())
r_groups.index=date[1:]
r_groups.plot(figsize=[12,7])
 查看全部

市场因子：\begin{align}R_M-R_f\end{align}RM取的就是中证800指数的收益，Rf取的是银行间质押式回购利率_同业拆借中心R007

 
       
 
            
 
             
#先用交易日日历得到Year的5月到Year+1的5月的月末交易日日期
from CAL.PyCAL import *
data=DataAPI.TradeCalGet(exchangeCD=u"XSHG",beginDate='20070501',endDate='20160601',field=['calendarDate','isMonthEnd'])
data = data[data['isMonthEnd'] == 1]
date = map(lambda x: x[0:4]+x[5:7]+x[8:10], data['calendarDate'].values.tolist())
RmMonthly=np.zeros(108)
RfMonthly=np.zeros(108)
for i in range(108):
    index1=DataAPI.MktIdxdGet(tradeDate=date[i],indexID=u"000906.ZICN",field=u"closeIndex") #上月指数收盘
    index2=DataAPI.MktIdxdGet(tradeDate=date[i+1],indexID=u"000906.ZICN",field=u"closeIndex")  #当月指数收盘
    RmMonthly[i]=index2['closeIndex'][0]/index1['closeIndex'][0]-1
    rf=DataAPI.ChinaDataInterestRateInterbankRepoGet(indicID=u"M120000068",beginDate=date[i+1],endDate=date[i+1],field=u"dataValue")  #当月无风险收益
    RfMonthly[i]=rf['dataValue'][0]/100/12    #给出的是年化无风险收益，这里需要转化成月的
MF=RmMonthly-RfMonthly  #市场因子
 
        
 查看全部 
  

 三个因子我们都得到了，再来看看三个因子的状况：

 
       
factor=pd.DataFrame()
factor['MF']=MF
factor['SMB']=SMB
factor['HML']=HML
factor.index=date[1:]
factor.plot(figsize=[12,7])
factor.describe()
 查看全部 
    
        
         
            
          MF 
          SMB 
          HML 
         
 
         
          count 
          108.000000 
          108.000000 
          108.000000 
         
 
          mean 
          0.001237 
          0.014489 
          -0.001268 
         
 
          std 
          0.096189 
          0.058929 
          0.049805 
         
 
          min 
          -0.262845 
          -0.209948 
          -0.157205 
         
 
          25% 
          -0.063134 
          -0.014343 
          -0.025673 
         
 
          50% 
          0.005296 
          0.014957 
          -0.004887 
         
 
          75% 
          0.058838 
          0.051484 
          0.022718 
         
 
          max 
          0.192618 
          0.214916 
          0.248741 
         
 
        
      
  
     

	MF	SMB	HML
count	108.000000	108.000000	108.000000
mean	0.001237	0.014489	-0.001268
std	0.096189	0.058929	0.049805
min	-0.262845	-0.209948	-0.157205
25%	-0.063134	-0.014343	-0.025673
50%	0.005296	0.014957	-0.004887
75%	0.058838	0.051484	0.022718
max	0.192618	0.214916	0.248741

到这里，我们的三个因子就处理完了，三个解释变量都做成了数组，下面可以分析一下各个因子之间的相关系数

 
x=np.zeros((3,108))
x[0]=MF
x[1]=SMB
x[2]=HML
Correlations=pd.DataFrame(np.corrcoef(x))
Correlations.columns=['MF','SMB','HML']
Correlations.index=['MF','SMB','HML']
Correlations
 
 查看全部 
    
          MF 
          SMB 
          HML 
         
          MF 
          1.000000 
          0.212499 
          -0.031912 
         
          SMB 
          0.212499 
          1.000000 
          -0.424261 
         
          HML 
          -0.031912 
          -0.424261 
          1.000000

	MF	SMB	HML
MF	1.000000	0.212499	-0.031912
SMB	0.212499	1.000000	-0.424261
HML	-0.031912	-0.424261	1.000000

 3. 响应变量 首先我们将股票按之前的方法分为25个组合，即：
 在每年5月末，按照市值大小将股票排序并分为5组，然后按照账面市值比大小把股票分为5组，交叉取交集，得到5*5=25个股票组合
 也就是说，我们将作25个回归，每次回归时的解释变量都一样，响应变量不同

 
       
#每年5月末，按照市值大小将股票排序分为5组
def get_25groups(breakpoint):
    universe = set_universe('000906.ZICN',date=breakpoint)
    C=DataAPI.MktEqudGet(ticker='000028',beginDate=str(int(breakpoint)-20),endDate=breakpoint,field=u"ticker,tradedate")
    breakpoint=filter(lambda x:x.isdigit(),C.iat[len(C)-1,1])                             #取breakpoint前最近一个交易日日期
    ME=DataAPI.MktEqudGet(tradeDate=breakpoint,secID=universe,field=u"ticker,marketValue").dropna()
    MEq=np.zeros(6) #用于存储ME的分位值
    ME_5=pd.Series([]) #用于存储依据市值分好的5个组
    BP=DataAPI.MktStockFactorsOneDayGet(tradeDate=breakpoint,secID=universe,field=u"ticker,PB").dropna() 
    BP=BP[BP>0].dropna()                                                  #去掉PB值为负的股票
    BP[['PB']]=1/BP[['PB']]                                               #取1/PB，为账面市值比
    BPq=np.zeros(6)  #用于存储1/PB的分位值
    BP_5=pd.Series([]) #用于存储依据账面市值比分好的5个组
    for i in range(5):
        MEq[i+1]=np.percentile(ME['marketValue'],(i+1)*20)                           #算出市值大小的20%,40%,60%,80%分位值
        BPq[i+1]=np.percentile(BP['PB'],(i+1)*20)
        D=ME[(ME['marketValue']>MEq[i]) & (ME['marketValue']<=MEq[i+1])]['ticker'].tolist()     #取市值处于相应分位值区间的股票
        ME_5=pd.concat([ME_5,pd.Series(D)],axis=1)                                 #存于dataframe里
        E=BP[(BP['PB']>BPq[i]) & (BP['PB']<=BPq[i+1])]['ticker'].tolist()
        BP_5=pd.concat([BP_5,pd.Series(E)],axis=1)
    ME_5.columns=range(5) #重命名列名
    BP_5.columns=range(5)
    Group25=pd.Series([]) #用于存著交叉取交集后的25个股票组合
    for i in range(5):
        for j in range(5):
            s1=ME_5[i].dropna().tolist()
            s2=BP_5[j].dropna().tolist() 
            stocks=pd.Series(list(set(s1).intersection(set(s2)))) #取交集
            Group25=pd.concat([Group25,stocks],axis=1)
    Group25.columns=range(25)
    return Group25
 查看全部 
  

计算25个股票组合，每个组合的市值加权月收益率序列

 
EReturn=np.zeros((25,12*9)) #用于存储25个组合的超额收益序列
for i in range(25):
    a=[]
    for Year in [2007,2008,2009,2010,2011,2012,2013,2014,2015]:
        Group25=get_25groups(str(Year*10000+531))   #每年进行分组
        a=a+(get_returnMonthly(Group25[i].dropna().tolist(),Year)).tolist()   #收益率转化为list，方便每年相加
    EReturn[i]=np.array(a)-RfMonthly
 
 查看全部

 我们看一下25个组合平均每年的公司数：

 
       
number=np.zeros((25,9)) 
for i in range(25):
    for j in range(9):
        Group25=get_25groups(str((j+2007)*10000+531))   #每年进行分组
        number[i][j]=len(Group25[i].dropna().tolist())
number_mean=np.zeros(25)
for i in range(25):
    number_mean[i]=number[i].mean()
numbers=pd.DataFrame(number_mean.reshape(5,5))
numbers.columns=['small_BE/ME','1','2','3','big_BE/ME']
numbers.index=['small_size','1','2','3','big_size']
numbers
 查看全部 
    
        
         
            
          small_BE/ME 
          1 
          2 
          3 
          big_BE/ME 
         
 
         
          small_size 
          12.888889 
          27.888889 
          35.777778 
          41.333333 
          41.888889 
         
 
          1 
          25.333333 
          34.666667 
          36.777778 
          34.555556 
          28.666667 
         
 
          2 
          39.555556 
          34.222222 
          34.444444 
          25.555556 
          25.555556 
         
 
          3 
          44.111111 
          36.666667 
          27.333333 
          28.000000 
          23.888889 
         
 
          big_size 
          38.111111 
          26.222222 
          25.111111 
          30.222222 
          40.000000 
         
 
        
      

	small_BE/ME	1	2	3	big_BE/ME
small_size	12.888889	27.888889	35.777778	41.333333	41.888889
1	25.333333	34.666667	36.777778	34.555556	28.666667
2	39.555556	34.222222	34.444444	25.555556	25.555556
3	44.111111	36.666667	27.333333	28.000000	23.888889
big_size	38.111111	26.222222	25.111111	30.222222	40.000000

还可以看一下25个组合平均每年的总市值大小，验证一下分组的正确性：

 
       
 
            
 
             
MarketValue=np.zeros((25,9)) 
for i in range(25):
    for j in range(9):
        breakpoint=str((j+2007)*10000+531)
        Group25=get_25groups(breakpoint)  #每年进行分组
        C=DataAPI.MktEqudGet(ticker='000028',beginDate=str(int(breakpoint)-20),endDate=breakpoint,field=u"ticker,tradedate")
        breakpoint=filter(lambda x:x.isdigit(),C.iat[len(C)-1,1])                             #取breakpoint前最近一个交易日日期
        data=DataAPI.MktEqudGet(tradeDate=breakpoint,ticker=Group25[i].dropna().tolist(),field=u"ticker,marketValue").dropna()
        MarketValue[i][j]=data['marketValue'].sum()
MarketValue_mean=np.zeros(25)
for i in range(25):
    MarketValue_mean[i]=MarketValue[i].mean()
MV=pd.DataFrame(MarketValue_mean.reshape(5,5))
MV.columns=['small_BE/ME','1','2','3','big_BE/ME']
MV.index=['small_size','1','2','3','big_size']
MV
 
        
 查看全部 
    
        
         
            
          small_BE/ME 
          1 
          2 
          3 
          big_BE/ME 
         
 
         
          small_size 
          6.007957e+10 
          1.175193e+11 
          1.455794e+11 
          1.798913e+11 
          1.646767e+11 
         
 
          1 
          1.745471e+11 
          2.368089e+11 
          2.355071e+11 
          2.167016e+11 
          1.717474e+11 
         
 
          2 
          3.920921e+11 
          3.309705e+11 
          3.278397e+11 
          2.391956e+11 
          2.118269e+11 
         
 
          3 
          7.007655e+11 
          5.851388e+11 
          4.300714e+11 
          4.208436e+11 
          4.202868e+11 
         
 
          big_size 
          2.054059e+12 
          2.041996e+12 
          2.416426e+12 
          3.877098e+12 
          7.510095e+12 
         
 
        
      

	small_BE/ME	1	2	3	big_BE/ME
small_size	6.007957e+10	1.175193e+11	1.455794e+11	1.798913e+11	1.646767e+11
1	1.745471e+11	2.368089e+11	2.355071e+11	2.167016e+11	1.717474e+11
2	3.920921e+11	3.309705e+11	3.278397e+11	2.391956e+11	2.118269e+11
3	7.007655e+11	5.851388e+11	4.300714e+11	4.208436e+11	4.202868e+11
big_size	2.054059e+12	2.041996e+12	2.416426e+12	3.877098e+12	7.510095e+12

 上面的股票组合从左到右，账面市值比越来越大；从上往下，市值越来越大，说明我们的分组是正确的
 看一下25个组合超额收益的均值和方差：

 
       
EReturn_mean=np.zeros(25)
for i in range(25):
    EReturn_mean[i]=EReturn[i].mean()
mean=pd.DataFrame(EReturn_mean.reshape(5,5))
mean.columns=['small_BE/ME','1','2','3','big_BE/ME']
mean.index=['small_size','1','2','3','big_size']
mean
 查看全部 
    
        
         
            
          small_BE/ME 
          1 
          2 
          3 
          big_BE/ME 
         
 
         
          small_size 
          0.025433 
          0.022799 
          0.043428 
          0.022999 
          0.019819 
         
 
          1 
          0.019233 
          0.022419 
          0.023366 
          0.022356 
          0.016953 
         
 
          2 
          0.016595 
          0.015579 
          0.017392 
          0.017074 
          0.020958 
         
 
          3 
          0.019433 
          0.012199 
          0.014942 
          0.013659 
          0.009995 
         
 
          big_size 
          0.006133 
          0.000801 
          0.006065 
          0.007580 
          0.005248 
         
 
        
      

	small_BE/ME	1	2	3	big_BE/ME
small_size	0.025433	0.022799	0.043428	0.022999	0.019819
1	0.019233	0.022419	0.023366	0.022356	0.016953
2	0.016595	0.015579	0.017392	0.017074	0.020958
3	0.019433	0.012199	0.014942	0.013659	0.009995
big_size	0.006133	0.000801	0.006065	0.007580	0.005248

 
       
 
            
 
             
EReturn_std=np.zeros(25)
for i in range(25):
    EReturn_std[i]=EReturn[i].std()
std=pd.DataFrame(EReturn_std.reshape(5,5))
std.columns=['small_BE/ME','1','2','3','big_BE/ME']
std.index=['small_size','1','2','3','big_size']
std
 
        
 查看全部 
    
        
         
            
          small_BE/ME 
          1 
          2 
          3 
          big_BE/ME 
         
 
         
          small_size 
          0.125990 
          0.111912 
          0.216930 
          0.111223 
          0.109084 
         
 
          1 
          0.110347 
          0.113726 
          0.110196 
          0.116036 
          0.111958 
         
 
          2 
          0.104115 
          0.105876 
          0.110242 
          0.112561 
          0.110588 
         
 
          3 
          0.106525 
          0.106846 
          0.107491 
          0.102590 
          0.110776 
         
 
          big_size 
          0.097351 
          0.097236 
          0.100561 
          0.102553 
          0.092128 
         
 
        
      

	small_BE/ME	1	2	3	big_BE/ME
small_size	0.125990	0.111912	0.216930	0.111223	0.109084
1	0.110347	0.113726	0.110196	0.116036	0.111958
2	0.104115	0.105876	0.110242	0.112561	0.110588
3	0.106525	0.106846	0.107491	0.102590	0.110776
big_size	0.097351	0.097236	0.100561	0.102553	0.092128

 三.回归和结果 1.回归一 CAPM回归模型：\begin{align}R(t)-R_f(t) = a+b(R_M(t)-R_f(t))+e(t)\end{align}这就是经典的CAPM模型，我们可以检验一下它在中国A股市场的有效性：

 
       
#作25次回归
import numpy as np
from sklearn import linear_model
a1=np.zeros(25)   #a项
b1=np.zeros(25)   #市场因子项系数
e1=np.zeros((25,108))   #残差项
R2_1=np.zeros(25)   #R2相关系数平方
tb1=np.zeros(25)
ta1=np.zeros(25)
import statsmodels.api as sm
from statsmodels.sandbox.regression.predstd import wls_prediction_std
ap1=np.zeros(25)  #a显著性检验的P值，下面类同
bp1=np.zeros(25)
for i in range(25):
    X=np.zeros((1,108))
    X[0]=MF
    X=X.T
    X = sm.add_constant(X,has_constant='skip')
    y=EReturn[i]
    model = sm.OLS(y, X)
    results = model.fit()
    a1[i] = results.params[0]
    b1[i] = results.params[1]
    ap1[i]=results.pvalues[0]
    bp1[i]=results.pvalues[1]
    R2_1[i] = results.rsquared
    e1[i] = results.resid
    tb1[i] = results.tvalues[1]
    ta1[i] = results.tvalues[0]
 查看全部 
  

先看一下这25个回归的判定系数R2，它度量了拟合程度的好坏。

 
       
 
            
 
             
R2inf1=pd.DataFrame(R2_1.reshape(5,5))
R2inf1.columns=['small_BE/ME','1','2','3','big_BE/ME']
R2inf1.index=['small_size','1','2','3','big_size']
R2inf1
 
        
 查看全部 
    
        
         
            
          small_BE/ME 
          1 
          2 
          3 
          big_BE/ME 
         
 
         
          small_size 
          0.594353 
          0.714150 
          0.350486 
          0.824708 
          0.825360 
         
 
          1 
          0.716048 
          0.731942 
          0.791529 
          0.828343 
          0.859161 
         
 
          2 
          0.718364 
          0.745072 
          0.884344 
          0.860049 
          0.804825 
         
 
          3 
          0.745227 
          0.870885 
          0.906794 
          0.895085 
          0.878805 
         
 
          big_size 
          0.795297 
          0.894826 
          0.834521 
          0.783604 
          0.786575 
         
 
        
      

	small_BE/ME	1	2	3	big_BE/ME
small_size	0.594353	0.714150	0.350486	0.824708	0.825360
1	0.716048	0.731942	0.791529	0.828343	0.859161
2	0.718364	0.745072	0.884344	0.860049	0.804825
3	0.745227	0.870885	0.906794	0.895085	0.878805
big_size	0.795297	0.894826	0.834521	0.783604	0.786575

 25个回归的R2大多处于0.7~0.9之间，已经是比较好的结果了，这点可以和其它的回归模型对比。
 下面看一下市场因子的系数 β ：

 
       
binf1=pd.DataFrame(b1.reshape(5,5))
binf1.columns=['small_BE/ME','1','2','3','big_BE/ME']
binf1.index=['small_size','1','2','3','big_size']
binf1
 查看全部 
    
        
         
            
          small_BE/ME 
          1 
          2 
          3 
          big_BE/ME 
         
 
         
          small_size 
          1.014500 
          0.987796 
          1.341376 
          1.054965 
          1.035088 
         
 
          1 
          0.975273 
          1.016236 
          1.023992 
          1.103041 
          1.083893 
         
 
          2 
          0.921680 
          0.954528 
          1.082809 
          1.090298 
          1.036224 
         
 
          3 
          0.960486 
          1.041443 
          1.069108 
          1.013754 
          1.084644 
         
 
          big_size 
          0.906779 
          0.960705 
          0.959496 
          0.948184 
          0.853405 
         
 
        
      

	small_BE/ME	1	2	3	big_BE/ME
small_size	1.014500	0.987796	1.341376	1.054965	1.035088
1	0.975273	1.016236	1.023992	1.103041	1.083893
2	0.921680	0.954528	1.082809	1.090298	1.036224
3	0.960486	1.041443	1.069108	1.013754	1.084644
big_size	0.906779	0.960705	0.959496	0.948184	0.853405

我们可以看到 β 大多处于1左右。下面我们来检验其显著性，回归系数的显著性检验用的是t检验：原假设为t=0,若t统计量的值大于给定显著水平下的t分位值，则拒绝原假设，说明该系数显著大于0

 
import scipy.stats as stats
t107=stats.t.isf(0.025,106)  #自由度为n-p，显著水平5%下的t分位值
t107
 
 查看全部 
   
       1.9825972617102912

 
       
tbinf1=pd.DataFrame(tb1.reshape(5,5))
tbinf1.columns=['small_BE/ME','1','2','3','big_BE/ME']
tbinf1.index=['small_size','1','2','3','big_size']
tbinf1
 查看全部 
    
        
         
            
          small_BE/ME 
          1 
          2 
          3 
          big_BE/ME 
         
 
         
          small_size 
          12.462385 
          16.273421 
          7.562993 
          22.331745 
          22.382173 
         
 
          1 
          16.349394 
          17.012826 
          20.061476 
          22.616582 
          25.428921 
         
 
          2 
          16.443012 
          17.601218 
          28.469459 
          25.522643 
          20.906988 
         
 
          3 
          17.608419 
          26.738941 
          32.113328 
          30.072274 
          27.724048 
         
 
          big_size 
          20.293403 
          30.030898 
          23.120656 
          19.591878 
          19.765164 
         
 
        
      

	small_BE/ME	1	2	3	big_BE/ME
small_size	12.462385	16.273421	7.562993	22.331745	22.382173
1	16.349394	17.012826	20.061476	22.616582	25.428921
2	16.443012	17.601218	28.469459	25.522643	20.906988
3	17.608419	26.738941	32.113328	30.072274	27.724048
big_size	20.293403	30.030898	23.120656	19.591878	19.765164

我们可以看到所有回归里 β 的t统计量的值都大于临界值，我们应该拒绝原假设，即表明 β 系数显著
以上，说明资本资产定价模型是有效的，市场因子的影响是显著的

2.回归二如上，我们检验了CAPM模型的有效性，现在我们不妨检验一下另外两个因子对股票超额收益的解释作用。\begin{align}R(t)-R_f(t) = a+sSMB(t)+hHML(t)+e(t)\end{align}SMB和HML分别代表规模(市值)因子和账面市值比因子。

 
       
 
            
 
             
#作25次回归
import numpy as np
from sklearn import linear_model
a2=np.zeros(25)   #a项
s2=np.zeros(25)   #规模因子项系数
h2=np.zeros(25)   #账面价值比项系数
e2=np.zeros((25,108))   #残差项
R2_2=np.zeros(25)   #R2相关系数平方
ta2=np.zeros(25)
tb2=np.zeros(25)
import statsmodels.api as sm
from statsmodels.sandbox.regression.predstd import wls_prediction_std
ap2=np.zeros(25)  #a显著性检验的P值，下面类同
sp2=np.zeros(25)
hp2=np.zeros(25)
for i in range(25):
    X=np.zeros((2,108))
    X[0]=SMB
    X[1]=HML
    X=X.T
    X = sm.add_constant(X,has_constant='skip')
    y=EReturn[i]
    model = sm.OLS(y, X)
    results = model.fit()
    ap2[i]=results.pvalues[0]
    sp2[i]=results.pvalues[1]
    hp2[i]=results.pvalues[2]
    a2[i] = results.params[0]
    s2[i] = results.params[1]
    h2[i] = results.params[2]
    R2_2[i] = results.rsquared
    e[i] = results.resid
    tb2[i] = results.tvalues[1]
    ta2[i] = results.tvalues[0]
 
        
 查看全部 
  

 同样，我们看一下25个回归的判定系数R2的情况：

 
       
R2inf2=pd.DataFrame(R2_2.reshape(5,5))
R2inf2.columns=['small_BE/ME','1','2','3','big_BE/ME']
R2inf2.index=['small_size','1','2','3','big_size']
R2inf2
 查看全部 
    
        
         
            
          small_BE/ME 
          1 
          2 
          3 
          big_BE/ME 
         
 
         
          small_size 
          0.429206 
          0.393804 
          0.121499 
          0.298528 
          0.280941 
         
 
          1 
          0.373788 
          0.387774 
          0.291721 
          0.291967 
          0.232686 
         
 
          2 
          0.398290 
          0.319392 
          0.222978 
          0.207927 
          0.249022 
         
 
          3 
          0.242946 
          0.190158 
          0.152270 
          0.161753 
          0.129395 
         
 
          big_size 
          0.116128 
          0.005802 
          0.004471 
          0.062431 
          0.124630 
         
 
        
      

	small_BE/ME	1	2	3	big_BE/ME
small_size	0.429206	0.393804	0.121499	0.298528	0.280941
1	0.373788	0.387774	0.291721	0.291967	0.232686
2	0.398290	0.319392	0.222978	0.207927	0.249022
3	0.242946	0.190158	0.152270	0.161753	0.129395
big_size	0.116128	0.005802	0.004471	0.062431	0.124630

从R2可以看到，基本都在0.5以下，这个回归的结果比回归一差了很多，这个模型并不好,也就是说只用市值因子和账面市值比因子来解释股票超额收益是不合适的

3.回归三这里的回归模型就是我们经典的三因子模型
\begin{align}R(t)-R_f(t) = a+b(R_M(t)-R_f(t))+sSMB(t)+hHML(t)+e(t)\end{align}
 R(t)−Rf(t) ：市场因子
 SMB(t) ：规模(市值)因子
 HML(t)  ：账面市值比因子

 
       
 
            
 
             
#作25次回归
import numpy as np
from sklearn import linear_model
a=np.zeros(25)   #a项
b=np.zeros(25)   #市场因子项系数
s=np.zeros(25)   #规模因子项系数
h=np.zeros(25)   #账面价值比项系数
e=np.zeros(25)   #残差项
R2=np.zeros(25)   #R2相关系数平方
for i in range(25):
    x=np.zeros((3,108))
    x[0]=MF
    x[1]=SMB
    x[2]=HML
    y=EReturn[i]
    x=np.mat(x).T
    y=np.mat(y).T
    regr = linear_model.LinearRegression()
    regr.fit(x,y)
    b[i]=regr.coef_[0][0]
    s[i]=regr.coef_[0][1]
    h[i]=regr.coef_[0][2]
    a[i]=regr.intercept_[0]
    e[i]=regr.residues_
    R2[i]=regr.score(x,y)
 
        
 查看全部 
  

 
       
import statsmodels.api as sm
from statsmodels.sandbox.regression.predstd import wls_prediction_std
ap=np.zeros(25)  #a显著性检验的P值
ta=np.zeros(25)
tb=np.zeros(25)
ts=np.zeros(25)
th=np.zeros(25)
for i in range(25):
    X=np.zeros((3,108))
    X[0]=MF
    X[1]=SMB
    X[2]=HML
    X=X.T
    X = sm.add_constant(X,has_constant='skip')
    y=EReturn[i]
    model = sm.OLS(y, X)
    results = model.fit()
    ap[i]=results.pvalues[0]
    ta[i] = results.tvalues[0]
    tb[i] = results.tvalues[1]
    ts[i] = results.tvalues[2]
    th[i] = results.tvalues[3]    
 查看全部 
  

我们先看一下回归的R2：

 
       
 
            
 
             
R2inf3=pd.DataFrame(R2.reshape(5,5))
R2inf3.columns=['small_BE/ME','1','2','3','big_BE/ME']
R2inf3.index=['small_size','1','2','3','big_size']
R2inf3
 
        
 查看全部 
    
        
         
            
          small_BE/ME 
          1 
          2 
          3 
          big_BE/ME 
         
 
         
          small_size 
          0.850504 
          0.932359 
          0.401501 
          0.952128 
          0.942172 
         
 
          1 
          0.928505 
          0.947654 
          0.928649 
          0.949936 
          0.943393 
         
 
          2 
          0.960149 
          0.924252 
          0.962277 
          0.926240 
          0.903547 
         
 
          3 
          0.916107 
          0.945470 
          0.944791 
          0.933945 
          0.924949 
         
 
          big_size 
          0.932492 
          0.929273 
          0.901979 
          0.933192 
          0.942885 
         
 
        
      

	small_BE/ME	1	2	3	big_BE/ME
small_size	0.850504	0.932359	0.401501	0.952128	0.942172
1	0.928505	0.947654	0.928649	0.949936	0.943393
2	0.960149	0.924252	0.962277	0.926240	0.903547
3	0.916107	0.945470	0.944791	0.933945	0.924949
big_size	0.932492	0.929273	0.901979	0.933192	0.942885

 我们可以看到R2基本上都在0.9以上，三因子模型的拟合程度非常好，说明三因子模型是比CAPM更有效的模型

 4.回归结果分析 如上三因子模型的有效性已经得到验证，确实能够解释股票收益来源，那么A股市场对这些因子有什么偏好呢？比如：长期来看，小盘股跑赢大盘股，还是大盘股能跑赢小盘股呢？
 我们可以从第一个回归(CAPM)的截距项找到答案：

 
       
 
            
 
             
ainf1=pd.DataFrame(a1.reshape(5,5))
ainf1.columns=['small_BE/ME','1','2','3','big_BE/ME']
ainf1.index=['small_size','1','2','3','big_size']
tainf1=pd.DataFrame(ta1.reshape(5,5))
tainf1.columns=['small_BE/ME','1','2','3','big_BE/ME']
tainf1.index=['small_size','1','2','3','big_size']
print '第一个回归的a值：'
print ainf1.to_html()
print '自由度为n-p，显著水平5%下的t分位值:'+str(stats.t.isf(0.025,106))
print '第一个回归的a的t检验统计量：'
print tainf1.to_html()
 
        
 查看全部 
   
       第一个回归的a值： 
     
 
       
        
           
         small_BE/ME 
         1 
         2 
         3 
         big_BE/ME 
        
 
        
         small_size 
         0.024177 
         0.021577 
         0.041768 
         0.021694 
         0.018538 
        
 
         1 
         0.018026 
         0.021162 
         0.022099 
         0.020991 
         0.015612 
        
 
         2 
         0.015455 
         0.014398 
         0.016052 
         0.015725 
         0.019676 
        
 
         3 
         0.018244 
         0.010911 
         0.013619 
         0.012405 
         0.008653 
        
 
         big_size 
         0.005011 
         -0.000388 
         0.004878 
         0.006406 
         0.004192 
        
 
       自由度为n-p，显著水平5%下的t分位值:1.98259726171第一个回归的a的t检验统计量： 
       
        
           
         small_BE/ME 
         1 
         2 
         3 
         big_BE/ME 
        
 
        
         small_size 
         3.101816 
         3.712481 
         2.459500 
         4.795915 
         4.186454 
        
 
         1 
         3.156042 
         3.699929 
         4.521662 
         4.495019 
         3.825185 
        
 
         2 
         2.879519 
         2.772733 
         4.407769 
         3.844395 
         4.145978 
        
 
         3 
         3.493139 
         2.925629 
         4.272353 
         3.843262 
         2.309965 
        
 
         big_size 
         1.171278 
         -0.126530 
         1.227596 
         1.382485 
         1.013901 
        
 
       
     

	small_BE/ME	1	2	3	big_BE/ME
small_size	0.024177	0.021577	0.041768	0.021694	0.018538
1	0.018026	0.021162	0.022099	0.020991	0.015612
2	0.015455	0.014398	0.016052	0.015725	0.019676
3	0.018244	0.010911	0.013619	0.012405	0.008653
big_size	0.005011	-0.000388	0.004878	0.006406	0.004192

	small_BE/ME	1	2	3	big_BE/ME
small_size	3.101816	3.712481	2.459500	4.795915	4.186454
1	3.156042	3.699929	4.521662	4.495019	3.825185
2	2.879519	2.772733	4.407769	3.844395	4.145978
3	3.493139	2.925629	4.272353	3.843262	2.309965
big_size	1.171278	-0.126530	1.227596	1.382485	1.013901

 可以看到25个回归里只有最后5个回归的a值是显著为0的，其余a值我们可以认为是不显著为0的，也就是说超额收益没有被完全解释，这也是三因子模型存在的必要。
 我们从市值的角度来分析一下，以上结果，从上到下组合的市值越来越大，a值越来越小，a代表的是超额收益，也就是说市值越小的股票越容易获得超额收益，这点和我们的认知相同
 从左到右，组合的账面市值比越来越大，a值从趋势上是越来越大，但也有很多反转，也就是说账面市值比越高的组合越容易获得超额收益这个结论并不准确。

 四.总结 通过对三个模型的回归进行对比，我们可以看到，从R2来看，拟合结果最差的是第二个模型（只用市值因子和账面市值比），拟合结果最好的是第三个模型，也就是fama三因子模型。
 综上，我们验证了Fama三因子模型在中国A股市场是有效的，也印证了市值小的股票更容易获得超额收益这一点。
 本帖重在过程，学习交流。

你可能感兴趣的:(量化投资,fama)

一键获取每日股票数据，自动更新，尽在掌握舔狼 A股股票数据 python 金融
用Python和Tushare库获取股票日线数据在金融市场分析中，获取股票的历史数据是进行技术分析和量化投资的基础。Tusharetushare官网是一个提供中国股市数据的API接口，它支持获取股票的日线数据、基本面数据等。本文将介绍如何使用Python语言和Tushare库来获取股票的日线数据，并结合多线程技术提高数据获取的效率。1.环境准备首先，确保你的Python环境中安装了以下库：tush
基于Python的开源量化交易框架：构建你的量化投资策略 ShAutoit python 开发语言
量化投资是一种利用数学和统计模型来进行投资决策的方法，它将大量的金融数据与算法相结合，以识别交易机会并执行交易。Python作为一种功能强大且易于使用的编程语言，为开发和实施量化交易策略提供了很好的支持。本文将介绍基于Python的开源量化交易框架，帮助你构建自己的量化投资策略。数据获取和处理在量化投资中，数据是至关重要的。你需要获取和处理市场数据，包括股票价格、指数数据、财务数据等。在Pytho
4. 马科维茨资产组合模型+Fama-French五因子优化方案（理论+Python实战）金融OG 金融资产组合模型进化论 python java 前端金融数据库机器学习大数据
目录0.承前1.Fama-French五因子优化的现代投资组合理论1.1WhatisFama-French五因子优化的现代投资组合理论1.2WhyisFama-French五因子优化的现代投资组合理论1.3HowtoFama-French五因子优化的现代投资组合理论2.数据要素&计算流程2.1参数集设置2.2数据获取&预处理2.3收益率计算2.4因子构建与预期收益率计算2.5协方差矩阵计算2.6投
高频量化交之李庆：在华尔街狼共舞的岁顺其自然�非之歌� Cla_Mysql Cla_众筹图书
转“高频量化交易之王”李庆：在华尔街与狼共舞的岁月在华尔街打拼16年，成为最顶尖的量化投资基金经理，李庆并没有忘记初心，依然几十年如一日的努力、勤奋。他相信一个人无论做什么，要成功只有一句话，“非常踏实，严谨地去做这件事情”，“只要是努力工作，努力去研究，努力去严谨地做一件事情，最后成功的可能性才会很大。”李庆有自己的独门秘籍。他原本应该是数学家，最终却在16年间成为华尔街的顶级资本玩家。他和很多
通达信Python语言接口：如何轻松获取并高效利用？ cda2024 python 开发语言
在量化投资和股票分析领域，Python已经成为不可或缺的工具。然而，如何将Python与国内最流行的股票交易软件之一——通达信相结合，成为许多投资者和开发者关心的问题。本文将详细介绍如何获取通达信的Python语言接口，并提供一些实用的技巧和示例代码，帮助你在量化交易中更上一层楼。什么是通达信Python接口？通达信Python接口是通达信官方提供的一个API，允许用户通过Python脚本调用通达
数据分析--07：金融量化十束多多良^_^ 区块链概率论
데이터분석--07:재무수량화一、金融介绍1、金融2、金融工具1.期货2.黄金3.外汇4.投资基金5.股票股票的作用3、股票分类1.收益分类2.上市地区分类3.股票市场的构成4.影响股票的因素5.A股买卖4、金融分析1.基本面分析2.技术面分析5、金融量化投资1.为什么需要量化交易？2.量化交易3.量化交易的价值一、金融介绍1、金融金融就是对现有资源进行重新整合之后，实现价值和利润的等效流通。2、
【机器学习】————在金融市场分析方面的应用爱吃蔬菜不挑食人工智能
目录1.高频交易1.1概述1.2应用1.3实例2.风险管理2.1概述2.2应用2.3实例3.量化投资3.1概述3.2应用3.3实例4.情感分析4.1概述4.2应用4.3实例5.欺诈检测5.1概述5.2应用5.3实例结论金融市场分析是一项复杂且关键的任务，涉及大量的数据处理和分析。传统方法在面对海量数据和复杂模型时往往力不从心，随着技术的进步，机器学习在金融市场分析中的应用越来越广泛。本文将深入探讨
基于人工智能的期权量化交易阿岛格人工智能.量化投资人工智能机器学习大数据强化学习
基于人工智能的期权量化交易基于人工智能的期权量化交易基于人工智能的期权量化交易该文基于人工智能AI的深度强化学习,进行股票期权的量化投资策略研究及回测评估。作者建立了人工智能学习及交易系统。基于实时/历史期权行情大数据挖掘,通过自行开发的人工智能多agent强化学习模型及评估系统(基于Python/Linux),对接实时交易接口进行了实盘环境的交易回测和评估。专题：人工智能.量化投资纲要：一、前言
打开量化投资黑箱-v2-黑箱结构 zhaohui24 Reading 量化金融其他
文章目录1.量化交易原则1.1研究宽客原因1.2何为宽客1.3量化交易系统的典型结构2.阿尔法模型2.1阿尔法模型：宽客如何盈利2.2理论驱动型阿尔法模型2.2.1基于价格数据的交易策略2.2.1.1趋势跟随策略2.2.1.2均值回复策略2.2.1.3技术情绪型策略2.2.2依托基本面数据的策略2.2.2.1价值型/收益型策略2.2.2.2成长型策略2.2.2.3品质型策略2.3数据驱动型阿尔法模
量化投资--量化干货分享小丁丁_ddxdd 应用层-算法应用
来源链接：http://blog.csdn.net/dipolar/article/details/50752839/http://www.newsmth.net/nForum/#!article/Python/128763最近程序化交易很热，量化也是我很感兴趣的一块。国内量化交易的平台有几家，我个人比较喜欢用的是JoinQuant，里面有篇干货贴分享给大家，希望对各位有帮助。==========
刺猬教你量化投资(十五):自行计算复权价刺猬偷腥
以天齐锂业为例子下面我们尝试运用此前介绍的各个知识点，尝试自行计算天齐锂业的后复权及前复权价格。编写代码importpandasaspd#pd.set_option('expand_frame_repr',False)#导入行情数据df=DataAPI.MktEqudGet(secID=u"",ticker=u"002466",tradeDate=u"",beginDate=u"",endDate
投机和投资到底有什么区别？ hmisty
考虑量化投资这个business和开家粥店这个business，前者通常意义上叫做投机生意（speculationbusiness），后者则是投资生意（investmentbusiness）。但是，两者都是建立一个system，把钱输入到这个系统里，然后期待输出更多的钱。只是因为前者的预期回报时间更短、倍数更大吗？好像并不是。是因为前者风险高，后者风险低吗？好像也不是。本质区别是，你获取回报是导致
基于第一性原理投资曹博士
图片发自App张教授打造丹华资本，致力于用第一性原理来指导风险投资。所谓第一性原理，就是基于最基本的自然法则，而且通常是可以用数学来表达并且在物理上首先验证。比如熵法则，量子原理，概率统计框架，等。不过从实际效果来看，2013起步的丹华资本，业绩很差。基本上成了反面案例。这个类似由诺贝尔经济学获奖者组建的量化投资公司长期资本，本来希望用量化的方式做套利投资，结果一个俄罗斯的黑天鹅事件，就让其折戟沉
指数量化投资 #36 - 指数样本股调整 JingDC
1指数样本股调整每年6月和12月，是指数定期调整样本股的时间。日前，上海证券交易所和中证指数有限公司陆续宣布2018年第一次定期调整样本股公告，大家熟知的上证50、沪深300、中证500样本股都会发生调整。其中上证50更换5只股票，沪深300更换27只，中证500更换50只，更换股票数占总样本股数比例分别为10%，9%，10%。指数样本股调整，对估值有什么影响呢？从历史上来看，在上证50的43次样
基于python开发的股市行情看板 weixin_34273479 python
近期股市又骚动起来，回忆起昔日炒股经历，历历在目，悲惨经历让人黯然神伤，去年共投入4000元入市，最后仅剩1000多，无奈闭关修炼，忘记股市，全身心投入代码世界，享受代码带来的乐趣。近日，当看到别人用python进行量化投资暴富的消息，顿时振奋，立刻学习起python数据分析之道，开发了一个股市行情看板，希望借python之力，早日实现财务自由，达到人生巅峰，演示地址：https://stock.
如何利用python在股市赚钱？我用python开发了股市行情看板 weixin_33973600 python
个人博客：mypython.me近期股市又骚动起来，回忆起昔日炒股经历，历历在目，悲惨经历让人黯然神伤，去年共投入4000元入市，最后仅剩1000多，无奈闭关修炼，忘记股市，全身心投入代码世界，享受代码带来的乐趣。近日，当看到别人用python进行量化投资暴富的消息，顿时振奋，立刻学习起python数据分析之道，开发了一个股市行情看板，希望借python之力，早日实现财务自由，达到人生巅峰，演示地
R语言量化投资（1） Liam_ml
R是一门非常适合做数据的工具。不用关注时间复杂度多少，怎么把程序写漂亮。而是关注如何收集数据，提高数据质量，来解决实际的业务问题。跨界是一个很难的问题，因为不同背景的人进行沟通是一个非常困难的问题，尤其是金融行业和IT行业：一个封闭不愿意分享，一个开放崇尚开源；一种所有人都要为我服务，一种只专注自己感兴趣的事情。做跨学科的事情，你要了解项目管理的方法，产品设计的逻辑，数知识，机器学习知识，结合业务
量化投资华华hunter
价格扭曲是量化投资及套利的基础。先介绍几种强关联性品种，以及对应的关系。如果A是一只股票，则其对应的强关联品种B包括：A对应的可转换债券、A对应的权证、A对应的B股、A对应的H股、持有大量A股票的基金、持有大量A股票的股票。如果A是一只债券，则其对应的强关联品种B包括：持有大量A的基金；和A债券存续时间接近，信用等级接近的债券。价格扭曲通常是指强关联性的A和B之间出现了价格扭曲。强关联性的A和B之
持续积累分享金融知识最笨的羊羊日常分享专栏金融
持续积累分享金融知识一、什么是两融余额？二、什么是量化？三、散户可以进行量化投资么？一、什么是两融余额？两融余额是指投资者在融资买入和融券卖出交易中，通过向券商借入资金或证券进行交易，并且在交易结算后未归还的资金或证券的余额。融资买入是指投资者以自己的资金和借来的资金合并进行证券买入的交易方式，而融券卖出是指投资者借入证券并卖出，待价格下跌后再回购还给券商的交易方式。两融余额是一个反映投资者融资交
股票量化因子学习 zmjames2000 stock 股票因子 stock 股票
看到一篇博客文章，里面阐述了很多股票的量化因子，学习了一番，但是解释的不是很细，我之后又详细查询了很多，形成了这篇文章，特此记录一下，为自己和后来人查询使用。最近在看《量化投资数据挖掘技术与实践（MATLAB版）》。学习了其中的常见的股票衍生变量，并且利用WIND金融数据终端的matlab借口windmatlab导出一些数据进行了一个简单的学习。特此记录。移动平均线移动平均线，MovingAver
碾压华尔街，GPT-4 选股收益超 40% 夕小瑶人工智能
你是否想过，有朝一日利用GPT-4的决策在股市中进行量化投资？GPT-4具有先进的自然语言理解能力，可以分析大量的金融数据、市场新闻和公司信息。当它与传统的量化投资方式相结合，这意味着投资者可以借助GPT-4强大的NLP能力，深入挖掘股票市场，全面了解公司业绩、市场动态和宏观经济因素。当AI与量化投资技术组合起来，将会创造出怎样的投资决策呢？近期有篇文章研究了这个问题，他们提出了MarketSen
whale-quant【01_投资与量化投资】(学习与笔记) 王多头发区块链人工智能大数据
本文整体来自datawhale_whale-quant内容的学习，在基础上加了自己的总结与补充。后续将会补充笔记。内容质量很高，喜欢的盆友请给github项目点一个strar以鼓励！datawhalechina/whale-quant:本项目为量化开源课程，可以帮助人们快速掌握量化金融知识以及使用Python进行量化开发的能力。(github.com)前言：01_投资与量化投资目录1.1什么是投资
202401 whale-quant组队学习task01 chloe_tu 学习
Notebook环境配置试了一通还是有报错==目前requirements：tushare==1.3.7pandas==2.1.4numpy==1.26.3matplotlib==3.8.2明天尝试pandas==1.1.3numpy==1.19.5Chapter01投资与量化投资量化交易是指通过数量化的方式并使用计算机程序发出买卖指令，以获取稳定收益为目的的交易方式。通过客观的数学模型替代人为的
短线股票的特点介绍及短线股票买入指标短线交易秘诀
短线股票的炒作，需要掌握很多基本的东西，并不仅仅是买入卖出那么简单。下面为你介绍一下短线股票的特点介绍以及短线股票买入指标，如果想要了解更多短线股票方面的知识，敬请关注QR量化投资社区，下面让我们了解一下短线股票方面的知识吧！短线股票的特点介绍？短炒的对象一定是有主力介入的，而主力有两种类型，一种是中期运作的主力。短线股票的特点介绍：这类主力运作的背景是公司有成长性的期望而且估值有优势，不过这种类
股票程序化交易-QMT入门系列（1）-QMT前期安装准备秋天的落雨股票程序化交易-QMT入门系列 python mysql
目录一、QMT简介二、QMT安装包获取及下载三、python安装及配置四、QMT安装及注意事项一、QMT简介极速策略交易系统QMT是专门为机构、活跃投资者、高净值客户等专业投资者研发的智能量化交易终端，拥有高速行情、极速交易、策略交易、多维度风控等专业功能，满足专业投资者的特殊交易需求。适用人群：投资标的多，交易活跃；资金量大，换手率高，；有量化基础或者专业量化投资者。QMT系统与其他普通股票软件
一日一语之意语2 萝卜牛肉
元音的发音:意大利语发音时,发音器官肌肉紧张度较大。元音发音时唇形变化很明显,在练习发音时要严格按照发音部位和要求,做好唇部动作,不能随便改变唇形。意大利语元音发音清晰,不含糊,在发音过程中始终保持同一音质,即使在非重读时也不能弱化,每一个章节中的元音都须很清楚准确地发出来。1.Aa[a]:发音方法:嘴唇自然张开,舌平伸,双唇呈椭圆形,舌尖抵下齿龈,双唇略后缩。一级训练:fama声誉lana羊毛b
GPT-4 的决策在股市中进行量化投资 AI知识图谱大本营大模型人工智能
论文题目:CanLargeLanguageModelsBeatWallStreet?UnveilingthePotentialofAIinStockSelection论文链接:https://arxiv.org/abs/2401.03737博客地址:https://www.marketsense-ai.com/从本质上来说，股票选择是个价格发现机制，在股票投资中，市场参与者通过理解和使用各种信息做
whale-quant 学习 part1：投资与量化投资朔漠君 -----量化投资-----学习人工智能自动化 python 量化投资
投资与量化投资什么是投资投资的分类金融投资个人投资者投资品种投资-投机常见的股票投资分析流派什么是量化投资量化投资的优势量化投资的主要风险量化投资的历史发展**量化投资的一般流程常见量化投资平台参考什么是投资从经济学的广泛意义上讲，投资是为了获得一定的预期社会经济效益而进行的资金或资本物的投入及其活动过程。投资的分类实物投资或实物资产投资实物资产，又称实质资产或者有形资产，是以实物体形态存在的资产
基于Python的指数基金量化投资 - 指数的市盈率和市净率计算小将前行
上一篇《基于Python的指数基金量化投资-通过市盈率和市净率对指数估值》介绍了通过市盈率和市净率对指数进行估值，然后结合具体的估值百分位来进行投资。所以指数的市盈率和市净率是两个非常重要的指标。这里就会有个问题，指数的市盈率和市净率怎么进行计算，指数不像个股，个股的市盈率计算起来比较简单：同样个股的市净率计算也比较简单：而指数是一篮子股票，例如沪深300就包含了300家上市公司，中证500包含了
指数量化投资 #58 - 11.11看消费指数 JingDC
1又是一年双十一，今天买买买的人只多不少，某宝某东继续捷报频传。各位大买家除了给某宝某东贡献业绩之外，也为我国的消费行业发展做出不少贡献，也不知道今天的捷报能否让明天的消费指数高开高走。今天找点时间查了消费指数的一些数据，供有兴趣的同学参考。按照国证行业分类，一级行业中有两个消费行业：主要消费和可选消费。主要消费行业是指日常生活中最基本、最必要的消费，基本上不受经济周期波动影响。可选消费行业是除了
LeetCode[位运算] - #137 Single Number II Cwind java Algorithm LeetCode 题解位运算
原题链接：#137 Single Number II 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现三次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：与#136类似，都是考察位运算。不过出现两次的可以使用异或运算的特性 n XOR n = 0, n XOR 0 = n，即某一
《JavaScript语言精粹》笔记 aijuans JavaScript
0、JavaScript的简单数据类型包括数字、字符创、布尔值（true/false）、null和undefined值，其它值都是对象。 1、JavaScript只有一个数字类型，它在内部被表示为64位的浮点数。没有分离出整数，所以1和1.0的值相同。 2、NaN是一个数值，表示一个不能产生正常结果的运算结果。NaN不等于任何值，包括它本身。可以用函数isNaN(number)检测NaN,但是
你应该更新的Java知识之常用程序库 Kai_Ge java
在很多人眼中，Java 已经是一门垂垂老矣的语言，但并不妨碍 Java 世界依然在前进。如果你曾离开 Java，云游于其它世界，或是每日只在遗留代码中挣扎，或许是时候抬起头，看看老 Java 中的新东西。 Guava Guava[gwɑ:və]，一句话，只要你做Java项目，就应该用Guava（Github）。 guava 是 Google 出品的一套 Java 核心库，在我看来，它甚至应该
HttpClient 120153216 httpclient
/** * 可以传对象的请求转发，对象已流形式放入HTTP中 */ public static Object doPost(Map<String,Object> parmMap,String url) { Object object = null; HttpClient hc = new HttpClient(); String fullURL
Django model字段类型清单 2002wmj django
Django 通过 models 实现数据库的创建、修改、删除等操作，本文为模型中一般常用的类型的清单，便于查询和使用： AutoField：一个自动递增的整型字段，添加记录时它会自动增长。你通常不需要直接使用这个字段；如果你不指定主键的话，系统会自动添加一个主键字段到你的model。(参阅自动主键字段) BooleanField：布尔字段,管理工具里会自动将其描述为checkbox。 Cha
在SQLSERVER中查找消耗CPU最多的SQL 357029540 SQL Server
返回消耗CPU数目最多的10条语句 SELECT TOP 10 total_worker_time/execution_count AS avg_cpu_cost, plan_handle, execution_count, (SELECT SUBSTRING(text, statement_start_of
Myeclipse项目无法部署，Undefined exploded archive location 7454103 eclipse MyEclipse
做个备忘！错误信息为： Undefined exploded archive location 原因：在工程转移过程中，导致工程的配置文件出错；解决方法：
GMT时间格式转换 adminjun GMT 时间转换
普通的时间转换问题我这里就不再罗嗦了，我想大家应该都会那种低级的转换问题吧，现在我向大家总结一下如何转换GMT时间格式，这种格式的转换方法网上还不是很多，所以有必要总结一下，也算给有需要的朋友一个小小的帮助啦。 1、可以使用 SimpleDateFormat SimpleDateFormat EEE-三位星期 d-天 MMM-月 yyyy-四位年
Oracle数据库新装连接串问题 aijuans oracle数据库
割接新装了数据库，客户端登陆无问题，apache/cgi-bin程序有问题，sqlnet.log日志如下： Fatal NI connect error 12170. VERSION INFORMATION: TNS for Linux: Version 10.2.0.4.0 - Product
回顾java数组复制 ayaoxinchao java 数组
在写这篇文章之前，也看了一些别人写的，基本上都是大同小异。文章是对java数组复制基础知识的回顾，算是作为学习笔记，供以后自己翻阅。首先，简单想一下这个问题：为什么要复制数组？我的个人理解：在我们在利用一个数组时，在每一次使用，我们都希望它的值是初始值。这时我们就要对数组进行复制，以达到原始数组值的安全性。java数组复制大致分为3种方式：①for循环方式 ②clone方式 ③arrayCopy方
java web会话监听并使用spring注入 bewithme Java Web
在java web应用中，当你想在建立会话或移除会话时，让系统做某些事情，比如说，统计在线用户，每当有用户登录时，或退出时，那么可以用下面这个监听器来监听。 import java.util.ArrayList; import java.ut
NoSQL数据库之Redis数据库管理(Redis的常用命令及高级应用) bijian1013 redis 数据库 NoSQL
一 .Redis常用命令 Redis提供了丰富的命令对数据库和各种数据库类型进行操作，这些命令可以在Linux终端使用。 a.键值相关命令 b.服务器相关命令 1.键值相关命令 &
java枚举序列化问题 bingyingao java 枚举序列化
对象在网络中传输离不开序列化和反序列化。而如果序列化的对象中有枚举值就要特别注意一些发布兼容问题: 1.加一个枚举值新机器代码读分布式缓存中老对象，没有问题，不会抛异常。老机器代码读分布式缓存中新对像，反序列化会中断，所以在所有机器发布完成之前要避免出现新对象，或者提前让老机器拥有新增枚举的jar。 2.删一个枚举值新机器代码读分布式缓存中老对象，反序列
【Spark七十八】Spark Kyro序列化 bit1129 spark
当使用SparkContext的saveAsObjectFile方法将对象序列化到文件，以及通过objectFile方法将对象从文件反序列出来的时候，Spark默认使用Java的序列化以及反序列化机制，通常情况下，这种序列化机制是很低效的，Spark支持使用Kyro作为对象的序列化和反序列化机制，序列化的速度比java更快，但是使用Kyro时要注意，Kyro目前还是有些bug。 Spark
Hybridizing OO and Functional Design bookjovi erlang haskell
推荐博文： Tell Above, and Ask Below - Hybridizing OO and Functional Design 文章中把OO和FP讲的深入透彻，里面把smalltalk和haskell作为典型的两种编程范式代表语言，此点本人极为同意，smalltalk可以说是最能体现OO设计的面向对象语言，smalltalk的作者Alan kay也是OO的最早先驱，
Java-Collections Framework学习与总结-HashMap BrokenDreams Collections
开发中常常会用到这样一种数据结构，根据一个关键字，找到所需的信息。这个过程有点像查字典，拿到一个key，去字典表中查找对应的value。Java1.0版本提供了这样的类java.util.Dictionary(抽象类)，基本上支持字典表的操作。后来引入了Map接口，更好的描述的这种数据结构。 &nb
读《研磨设计模式》-代码笔记-职责链模式-Chain Of Responsibility bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 业务逻辑：项目经理只能处理500以下的费用申请，部门经理是1000，总经理不设限。简单起见，只同意“Tom”的申请 * bylijinnan */ abstract class Handler { /*
Android中启动外部程序 cherishLC android
1、启动外部程序引用自： http://blog.csdn.net/linxcool/article/details/7692374 //方法一 Intent intent=new Intent(); //包名包名+类名（全路径） intent.setClassName("com.linxcool", "com.linxcool.PlaneActi
summary_keep_rate coollyj SUM
BEGIN /*DECLARE minDate varchar(20) ; DECLARE maxDate varchar(20) ;*/ DECLARE stkDate varchar(20) ; DECLARE done int default -1; /* 游标中注册服务器地址 */ DE
hadoop hdfs 添加数据目录出错 daizj hadoop hdfs 扩容
由于原来配置的hadoop data目录快要用满了，故准备修改配置文件增加数据目录，以便扩容，但由于疏忽，把core-site.xml, hdfs-site.xml配置文件dfs.datanode.data.dir 配置项增加了配置目录，但未创建实际目录，重启datanode服务时，报如下错误： 2014-11-18 08:51:39,128 WARN org.apache.hadoop.h
grep 目录级联查找 dongwei_6688 grep
在Mac或者Linux下使用grep进行文件内容查找时，如果给定的目标搜索路径是当前目录，那么它默认只搜索当前目录下的文件，而不会搜索其下面子目录中的文件内容，如果想级联搜索下级目录，需要使用一个“-r”参数： grep -n -r "GET" . 上面的命令将会找出当前目录“.”及当前目录中所有下级目录
yii 修改模块使用的布局文件 dcj3sjt126com yii layouts
方法一：yii模块默认使用系统当前的主题布局文件，如果在主配置文件中配置了主题比如: 'theme'=>'mythm', 那么yii的模块就使用 protected/themes/mythm/views/layouts 下的布局文件；如果未配置主题，那么 yii的模块就使用 protected/views/layouts 下的布局文件，总之默认不是使用自身目录 pr
设计模式之单例模式 come_for_dream 设计模式单例模式懒汉式饿汉式双重检验锁失败无序写入
今天该来的面试还没来，这个店估计不会来电话了，安静下来写写博客也不错，没事翻了翻小易哥的博客甚至与大牛们之间的差距，基础知识不扎实建起来的楼再高也只能是危楼罢了，陈下心回归基础把以前学过的东西总结一下。 *********************************
8、数组豆豆咖啡二维数组数组一维数组
一、概念数组是同一种类型数据的集合。其实数组就是一个容器。二、好处可以自动给数组中的元素从0开始编号，方便操作这些元素三、格式 //一维数组 1,元素类型[] 变量名 = new 元素类型[元素的个数] int[] arr =
Decode Ways hcx2013 decode
A message containing letters from A-Z is being encoded to numbers using the following mapping: 'A' -> 1 'B' -> 2 ... 'Z' -> 26 Given an encoded message containing digits, det
Spring4.1新特性——异步调度和事件机制的异常处理 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
squid3(高命中率)缓存服务器配置 liyonghui160com
系统:centos 5.x 需要的软件:squid-3.0.STABLE25.tar.gz 1.下载squid wget http://www.squid-cache.org/Versions/v3/3.0/squid-3.0.STABLE25.tar.gz tar zxf squid-3.0.STABLE25.tar.gz &&
避免Java应用中NullPointerException的技巧和最佳实践 pda158 java
1) 从已知的String对象中调用equals()和equalsIgnoreCase()方法，而非未知对象。　　总是从已知的非空String对象中调用equals()方法。因为equals()方法是对称的，调用a.equals(b)和调用b.equals(a)是完全相同的，这也是为什么程序员对于对象a和b这么不上心。如果调用者是空指针，这种调用可能导致一个空指针异常 Object unk
如何在Swift语言中创建http请求 shoothao http swift
概述：本文通过实例从同步和异步两种方式上回答了”如何在Swift语言中创建http请求“的问题。如果你对Objective-C比较了解的话，对于如何创建http请求你一定驾轻就熟了，而新语言Swift与其相比只有语法上的区别。但是，对才接触到这个崭新平台的初学者来说，他们仍然想知道“如何在Swift语言中创建http请求？”。在这里,我将作出一些建议来回答上述问题。常见的
Spring事务的传播方式 uule spring事务
传播方式：新建事务 required required_new - 挂起当前非事务方式运行 supports &nbs