pandas 常用函数总结(待更新)

目录

1. 将时间字符串转化为时间戳

2. 设置索引列

3. 读取文件columns细节处理

3.1 csv默认将第一行设置为columns

3.2 想要换一个别的列名(原来有)

3.3 想加列名,原来没有

3.4 不想加列名,原来也没有


1. 将时间字符串转化为时间戳

原始数据: 

                    观测时间        经度       纬度     强度     陡度
0  2012-02-22 12:14:52.0  118.6845  31.6724  55.66   5.02
1  2012-02-22 12:21:55.0  118.6875  31.7405  72.99  62.28
2  2012-02-22 12:27:46.0  118.6998  31.7565  77.46   8.93
3  2012-02-22 12:35:34.0  118.9438  31.4310 -29.47 -17.97
4  2012-02-22 12:35:34.0  118.9416  31.4422 -13.43  -6.88

代码: 

data['观测时间']=data['观测时间'].apply(lambda x:time.mktime(time.strptime(x,'%Y-%m-%d %H:%M:%S.0')))

 效果:

            观测时间        经度       纬度      强度      陡度
0   1.329884e+09  118.6845  31.6724   55.66    5.02
1   1.329885e+09  118.6875  31.7405   72.99   62.28
2   1.329885e+09  118.6998  31.7565   77.46    8.93
3   1.329885e+09  118.9438  31.4310  -29.47  -17.97
4   1.329885e+09  118.9416  31.4422  -13.43   -6.88 

 解释:

strptime函数是将字符串按照后面的格式转换成时间元组类型;mktime函数则是将时间元组转换成时间戳。


2. 设置索引列

代码: 

data.set_index("观测时间", inplace=True)	

解释:

将 data["观测时间"] 作为新的索引。


3. 读取文件columns细节处理

以 read_csv() 为例

3.1 csv默认将第一行设置为columns

import pandas as pd 

df_example = pd.read_csv('xxx.csv')
# 等同于:
df_example = pd.read_csv('xxx.csv', header=0)

3.2 想要换一个别的列名(原来有)

df_example = pd.read_csv('xxx.csv', names=['A', 'B','C']) 

# 即
df_example = pd.read_csv('xxx.csv', header=0, names=['A', 'B','C']) 

# header=0 来说明文件里原来有列名

3.3 想加列名,原来没有

df_example = pd.read_csv('xxx.csv', header=None, names=['A', 'B','C']) 
# header=None 来说明原来是没有columns的

3.4 不想加列名,原来也没有

df_example = pd.read_csv('xxx.csv', header=None) 
# header=None 来说明原来是没有columns的

感谢(不断增加 =,=):

pandas将日期转换成timestamp

Pandas在读取csv时如何设置列名--常用方法集锦

你可能感兴趣的:(numpy,python,pandas)