Pandas 是 Python 语言的一个扩展程序库,用于数据分析。
Pandas 可以从各种文件格式比如 CSV、JSON、SQL、Microsoft Excel 导入数据。
Pandas 的主要数据结构是 Series (一维数据)与 DataFrame(二维数据),这两种数据结构足以处理金融、统计、社会科学、工程等领域里的大多数典型用例。
python操作excel主要用到xlrd和xlwt这两个库,即xlrd是读excel,xlwt是写excel的库。这里需要用到的是"xlrd"。
(一)Python读取excel中的一列并转为数组
只需要修改一个文件路径即可读取,usecols后面的数字表示第几列
import pandas as pd
def excel_one_line_to_list():
df = pd.read_excel("F:/Personal resources6/xx/xx/xx/xx/测试.xls", usecols=[4],
names=None) # 读取项目名称列,不要列名
df_li = df.values.tolist()
result = []
for s_li in df_li:
result.append(s_li[0])
print(result)
if __name__ == '__main__':
excel_one_line_to_list()
(二)Python读取excel中的多列并转为数组
只需要修改一个文件路径即可读取,usecols后面的第一个数字表示第一列,第二个表示第二列
import pandas as pd
def excel_one_line_to_list():
df = pd.read_excel("F:/Personal resources6/xx/xx/xx/xx/测试.xls", usecols=[1, 2],
names=None) # 读取项目名称和行业领域两列,并不要列名
df_li = df.values.tolist()
print(df_li)
if __name__ == '__main__':
excel_one_line_to_list()