numpy数据分析

1.#读入数据集的文件

#注意文件的路径问题,在wi ndows2种路径表达都是可以的:

#"C:\\Users\\lun\\Documents\\教学\\程序设计与数据分析python\\数据集\\stock.csvn 或者 #”C:/users/lun/Documents/教学/程序设计与数据分析 python/数据集/stock, csv”

c,v = np.loadtxt(” C:/users/un/Documents/教学/程序设计与数据分析 python/数据

/stock . csv",delimiter=',',usecols=(3,6),skiprows=l,unpack=True,comments='#')

#参数usecols=(3,6)表示取数据集的第3和第6列。索引从0开始;

#skiprows=l«示跳过第1行,因为第一行是列名;

#unpack=True表示会把每一列当成一个向量输出,而不是合并在一起

# comments=,#'表示,如果数据的某一行的开头是#,就跳过这行,不读取这行数据;

2.#算术平均值函数 np. mean (c)==np. ave rage (c)

mean = np.mean(c)

3.#VWAP :成交量加权平均价格。

#被统计的数据就是CV;

vwap = np.average(c,weights=v)

4.最大值和最小值统计

#high取第4列,是某只股票的最高价low取第5列是最低价;每行代表1天的数据;

high, low = np.loadtxt("C: /Users/ un/Documents/教学/程序设计与数据分析 python/数据 集/stock. csv" ,delimiter=',', usecol s=(4,5) ,ski prows=l, unpack=True, comments=' #')

#统计最高价的最大值和最低价的最小值

highest = np.max(h)

lowest = np.min(l)

#ptp函数可以计算数组的取值范围,返回数组元素的最大值和最小值之间的差值

spread_high_price = np.ptp(high)

spread_low_price = np.ptp(low)

5.

#计算中位数

median = np.median(c)

#计算方差

variance = np.var(c)

6.

#标准差

np.std()

#对数

np.log()

你可能感兴趣的:(笔记,python,机器学习,numpy)