numpy 导入数据 ——np.loadtxt()

np.loadtxt()

np.loadtxt()用于从文本加载数据。

Hint:文本文件中的每一行必须含有相同的数据。

loadtxt(fname, dtype=, comments='#', delimiter=None, converters=None, skiprows=0, usecols=None, unpack=False, ndmin=0)

  • fname要读取的文件、文件名、或生成器。

  • dtype数据类型,默认float。

  • comments注释。

  • delimiter分隔符,默认是空格。

  • skiprows跳过前几行读取,默认是0,必须是int整型。

  • usecols要读取哪些列,0是第一列。例如,usecols = (1,4,5)将提取第2,第5和第6列。默认读取所有列。

  • unpack如果为True,将分列读取。

例子

import numpy as np
path = r"C:\Users\pandas\Desktop\task\Factors_Monthly.csv"
# data = pd.read_csv(path)
data = np.loadtxt(path)
ValueError: could not convert string to float: 'yyyymm,year,rf,mktrf,smb,hml' 

出现的原因是第一行数据类型与下文的数据数据类型不同。通常跳过第一行,再进行导入。

data = np.loadtxt(path,delimiter = ",", skiprows = 1)
data
array([[ 1.92607e+05,  1.92600e+03,  2.20000e-01,  2.96000e+00,
        -2.30000e+00, -2.87000e+00],
       [ 1.92608e+05,  1.92600e+03,  2.50000e-01,  2.64000e+00,
        -1.40000e+00,  4.19000e+00],
       [ 1.92609e+05,  1.92600e+03,  2.30000e-01,  3.60000e-01,
        -1.32000e+00,  1.00000e-02],
       ...,
       [ 2.01907e+05,  2.01900e+03,  1.90000e-01,  1.19000e+00,
        -2.07000e+00,  1.40000e-01],
       [ 2.01908e+05,  2.01900e+03,  1.60000e-01, -2.58000e+00,
        -2.41000e+00, -4.99000e+00],
       [ 2.01909e+05,  2.01900e+03,  1.80000e-01,  1.44000e+00,
        -8.90000e-01,  6.73000e+00]])

你可能感兴趣的:(python,数据分析小计,pandas,numpy,matplotlib,python,机器学习,开发语言,数据挖掘,数据分析)