布林带 & 日收益率

全局统计值

stat = df1.mean() # 返回每一列的平均值为一行ndarray

mean()平均值, median()中位数, std标准差, sum累加, prod累乘, mode众数
标准差是方差的平方根, 代表数据偏离平均值的程度, 越大股票曲线波动越大

滚动统计值

取20天内的平均值, 然后将这些点绘制成曲线(simple moving average), 整体趋势和原曲线相同, 但会滞后一点点(且前19天没有值), 二者相交的部分内曲线会发生巨大波动, 最低点是买入的好时机, 最高点是卖出的好时机, 使用滚动标准差衡量偏离程度
滚动统计值是Pandas的方法, dataframe自身不含

pd.rolling_mean(df['SPY'], window=20)  # 滚动平均值
pd.rolling_std(df['SPY'], window=20)  # 滚动标准差

布林带

布林带是距离滚动平均值上下各两个标准差(2σ)距离的条带, 若低于2σ(出布林带)后又进入布林带, 代表是买入的好时机, 卖出同理

"""Bollinger Bands' code."""

import os
import pandas as pd
import matplotlib.pyplot as plt

def symbol_to_path(symbol, base_dir="data"):
    """Return CSV file path given ticker symbol."""
    return os.path.join(base_dir, "{}.csv".format(str(symbol)))


def get_data(symbols, dates):
    """Read stock data (adjusted close) for given symbols from CSV files."""
    df = pd.DataFrame(index=dates)
    if 'SPY' not in symbols:  # add SPY for reference, if absent
        symbols.insert(0, 'SPY')

    for symbol in symbols:
        df_temp = pd.read_csv(symbol_to_path(symbol), index_col='Date',
                parse_dates=True, usecols=['Date', 'Adj Close'], na_values=['nan'])
        df_temp = df_temp.rename(columns={'Adj Close': symbol})
        df = df.join(df_temp)
        if symbol == 'SPY':  # drop dates SPY did not trade
            df = df.dropna(subset=["SPY"])

    return df


def plot_data(df, title="Stock prices"):
    """Plot stock prices with a custom title and meaningful axis labels."""
    ax = df.plot(title=title, fontsize=12)
    ax.set_xlabel("Date")
    ax.set_ylabel("Price")
    plt.show()


def get_rolling_mean(values, window):
    """Return rolling mean of given values, using specified window size."""
    return pd.rolling_mean(values, window=window)


def get_rolling_std(values, window):
    """Return rolling standard deviation of given values, using specified window size."""
    # TODO: Compute and return rolling standard deviation
    return pd.rolling_std(values, window=window)


def get_bollinger_bands(rm, rstd):
    """Return upper and lower Bollinger Bands."""
    # TODO: Compute upper_band and lower_band
    upper_band = rm + rstd * 2
    lower_band = rm - rstd * 2
    return upper_band, lower_band


def test_run():
    # Read data
    dates = pd.date_range('2012-01-01', '2012-12-31')
    symbols = ['SPY']
    df = get_data(symbols, dates)

    # Compute Bollinger Bands
    # 1. Compute rolling mean
    rm_SPY = get_rolling_mean(df['SPY'], window=20)

    # 2. Compute rolling standard deviation
    rstd_SPY = get_rolling_std(df['SPY'], window=20)

    # 3. Compute upper and lower bands
    upper_band, lower_band = get_bollinger_bands(rm_SPY, rstd_SPY)
    
    # Plot raw SPY values, rolling mean and Bollinger Bands, 绘图使用df.plot()方法
    ax = df['SPY'].plot(title="Bollinger Bands", label='SPY')  # 保留ax对象是为了后续添加曲线
    rm_SPY.plot(label='Rolling mean', ax=ax)
    upper_band.plot(label='upper band', ax=ax)
    lower_band.plot(label='lower band', ax=ax)

    # Add axis labels and legend
    ax.set_xlabel("Date")
    ax.set_ylabel("Price")
    ax.legend(loc='upper left')  # 图例
    plt.show()  # 不要忘记show


if __name__ == "__main__":
    test_run()

每日回报(日收益率)

# t为日期
即上升值除以前一天价格, 一般在-10%到10%中波动.若两个股票的日收益率曲线走势十分贴近, 说明二者受对方影响很大

def compute_daily_returns(df):
    """Compute and return the daily return values."""
    daily_returns = df.copy()  # copy一份来声明变量, 同时匹配size和列名称
    # 从第一行往后开始计算daily_returns
    daily_returns[1:] = (daily_returns[1:] / daily_returns[:-1].values) - 1
    daily_returns.ix[0, :] = 0  # 第0行没有前一天的数据, 所以置为0
    return daily_returns

其中一个dataframe加.values是因为pandas要访问隐含的numpy array内容. 当给定两个dataframe进行逐元素的算术运算(如除法)时, pandas会尽量根据索引对每一行进行匹配, 所以不加.values两个dataframe就会对齐, 则平移一行的操作就会无效, daily_returns图像会为两条为0的重叠直线

更为简洁的办法是使用df.shift(), 参数为正数则为向上平移:

def compute_daily_returns(df):
    """Compute and return the daily return values."""
    daily_returns[1:] = (df / df.shift(1)) - 1
    daily_returns.ix[0, :] = 0  # 该方法也需把第一行置为0, 因为默认会记为NaN
    return daily_returns

累计收益(Cumulative Returns)

# t为日期
一段时间后和最开始的比, 一般为整年的
累计收益曲线和价格曲线完全相同, 只是经过归一化, 事实上上式就是归一化方程

def compute_cumulative_returns(df):
    """Compute and return the cumulative return values."""
    cum_ret = df.copy()
    cum_ret[1:] = (cum_ret[1:] / cum_ret.ix[0, :].values) - 1
    cum_ret.ix[0, :] = 0 
    return cum_ret

你可能感兴趣的:(布林带 & 日收益率)