在使用numpy进行excel表的数据加载中,经常会遇到如下问题
Traceback (most recent call last):
File "D:/ProgramData/GAN_NIRs/Preprocessing/Data_Load.py", line 45, in <module>
data4 = np.loadtxt(open(data_path4, 'rb'), dtype=np.float64, delimiter=',', skiprows=0)
File "D:\Anaconda\envs\Pytorch16\lib\site-packages\numpy\lib\npyio.py", line 1139, in loadtxt
for x in read_data(_loadtxt_chunksize):
File "D:\Anaconda\envs\Pytorch16\lib\site-packages\numpy\lib\npyio.py", line 1067, in read_data
items = [conv(val) for (conv, val) in zip(converters, vals)]
File "D:\Anaconda\envs\Pytorch16\lib\site-packages\numpy\lib\npyio.py", line 1067, in <listcomp>
items = [conv(val) for (conv, val) in zip(converters, vals)]
File "D:\Anaconda\envs\Pytorch16\lib\site-packages\numpy\lib\npyio.py", line 763, in floatconv
return float(x)
ValueError: could not convert string to float: ''
这里都可能由两种原因引起的,第一种,是因为excel中保存的格式存在问题,第二种是因为excel表中的含有string,无法将字符转换成float的类型
第一种解决办法,如果,代码直接加载且excel表中没有字符
data = np.loadtxt(open(path, 'rb')
可以考虑改成如下
data = np.loadtxt(open(path, 'rb'), dtype=np.float64, delimiter=',', skiprows=0)
第二种,由于excel表中存在字符而读取错误,建议使用pandas进行读取
代码如下(示例):
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
warnings.filterwarnings('ignore')
import ssl
ssl._create_default_https_context = ssl._create_unverified_context
代码如下(示例):
data = pd.read_csv(
'https://labfile.oss.aliyuncs.com/courses/1283/adult.data.csv')
print(data.head())
该处使用的url网络请求的数据。
提示:这里对文章进行总结:
例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。