np.loadtxt()
用于从文本加载数据。
Hint:文本文件中的每一行必须含有相同的数据。
loadtxt(fname, dtype=
fname
要读取的文件、文件名、或生成器。
dtype
数据类型,默认float。
comments
注释。
delimiter
分隔符,默认是空格。
skiprows
跳过前几行读取,默认是0,必须是int整型。
usecols
要读取哪些列,0是第一列。例如,usecols = (1,4,5)将提取第2,第5和第6列。默认读取所有列。
unpack
如果为True,将分列读取。
import numpy as np
path = r"C:\Users\pandas\Desktop\task\Factors_Monthly.csv"
# data = pd.read_csv(path)
data = np.loadtxt(path)
ValueError: could not convert string to float: 'yyyymm,year,rf,mktrf,smb,hml'
出现的原因是第一行数据类型与下文的数据数据类型不同。通常跳过第一行,再进行导入。
data = np.loadtxt(path,delimiter = ",", skiprows = 1)
data
array([[ 1.92607e+05, 1.92600e+03, 2.20000e-01, 2.96000e+00,
-2.30000e+00, -2.87000e+00],
[ 1.92608e+05, 1.92600e+03, 2.50000e-01, 2.64000e+00,
-1.40000e+00, 4.19000e+00],
[ 1.92609e+05, 1.92600e+03, 2.30000e-01, 3.60000e-01,
-1.32000e+00, 1.00000e-02],
...,
[ 2.01907e+05, 2.01900e+03, 1.90000e-01, 1.19000e+00,
-2.07000e+00, 1.40000e-01],
[ 2.01908e+05, 2.01900e+03, 1.60000e-01, -2.58000e+00,
-2.41000e+00, -4.99000e+00],
[ 2.01909e+05, 2.01900e+03, 1.80000e-01, 1.44000e+00,
-8.90000e-01, 6.73000e+00]])