利用Python进行数据分析训练

1.pd.read_csv()和pd.read_table()区别

read_csv是以逗号为分隔,read_table()是以分行符(\t)为分隔

# cc = pd.read_csv('trin.csv.csv')
# print(cc.shape)
# ca = pd.read_table('trin.csv.csv')
# print(ca.shape)
# print('将分隔符改为逗号,效果与方法read_csv()相同')
# print(pd.read_table('ex1.csv',sep=','))

2.逐块读取

在使用pands读取大型的文件时,我们只想读取一部分数据或想对文件进行逐块读取

下面代码就是把数据以1000行分段

cs = pd.read_csv('trin.csv.csv',chunksize=1000)

3.更改列表表头

#直接替换表头
# bb.columns = ['a','b','c','d']
##另一种改表头方法,增加一行覆盖
#ds = pd.pd.read_csv('train.csv.csv',names = ['a','b','c','d'])

你可能感兴趣的:(python,数据分析)