python基础-Datafrom数据创建和读入

linux+pycharm+anaconda

#创建datafrom数据类型
import pandas as pd
data=pd.DataFrame([[20,99999,6],[30,999999,6]],columns=["年龄","收入","家属数"])
print(data)


import pandas as pd
data=pd.read_excel(r'/home/liu/project/Art_int/art_day1_1223/合并数据.xls',index_col=1,header=1)
print(data)

#取出指定列,可以列表推导式
import pandas as pd
data1=pd.read_excel(r"/home/liu/project/Art_int/art_day1_1223/合并数据.xls", usecols=[i for i in range(10)])
print(data1)
print(data.size)

#读取excel文件
import pandas as pd
data=pd.read_excel(r"合并数据.xls")
print(data)
"""
参数说明
pandas.read_excel(io, sheet_name=0, header=0, skiprows=None, skip_footer=0,
index_col=None, names=None, usecols=None, parse_dates=False, date_parser=None,
na_values=None, thousands=None, convert_float=True, converters=None, dtype=None, 
true_values=None, false_values=None, engine=None, squeeze=False, **kwds)

1.io :excel 路径;
data3 = pd.read_excel(io=filname)

2.sheetname:默认是sheetname为0,返回多表使用sheetname=[0,1],
若sheetname=None是返回全表 。注意:int/string返回的是dataframe,
而none和list返回的是dict of dataframe。

3.header :指定作为列名的行,默认0,即取第一行,数据为列名行以下的数据;若数据不含列名,则设定 header = None;

4.skiprows:省略指定行数的数据
data3 = pd.read_excel(filname, sheet_name=0, skiprows=1)

5.skipfooter:省略从尾部数的行数据
data3 = pd.read_excel(filname, sheet_name=0, skipfooter=1)

6.index_col :指定列为索引列,也可以使用 u’string’
data3 = pd.read_excel(filname, sheet_name=0, index_col=1)

7.names:指定列的名字,传入一个list数据
data3 = pd.read_excel(filname, sheet_name=0,names=['a', 'b', 'c', 'd', 'e'])
"""
#读取csv,分隔符文件.文件路径尽量不含中文
data2=pd.read_csv(r"/home/liu/project/Art_int/art_day1_1223/test.csv",sep="@",nrows=5,encoding="gbk",engine="python")
print(data2)

#读txt文本
data3=pd.read_table(r"/home/liu/project/Art_int/art_day1_1223/南京科技有限公司.txt")
print(data3)

你可能感兴趣的:(python基础-Datafrom数据创建和读入)