python 大数据入门之pandas

作为一名全栈程序员,广种薄收,我也很苦恼,但是又没有办法,自己是块砖,哪里需要哪里搬。

常用的pandas命令和技巧:

1、读取CSV文件:

data = pd.read_csv("{路径.csv}")

2、读取部分CSV文件:

data = pd.read_csv("E:/豪总导出数据/hw_register_user_20220317.csv",nrows=500)

3、查看某一列数据:

data['首次充值时间']

4、更改某一列数据:

data['首次充值时间'] = data['首次充值时间'].replace("-", "1970-01-01 08:00:00")
#此处是将“-”替换为日期再赋值给‘首次充值时间’

5、查询指定值数据:

data.loc[data["phone"]=='00004E34633A22C355506CE983BC30D5',:]

6、查看数据结构

data.info()

7、查看N条数据

data.head(10)

8、保存数据到CSV文件

df.to_csv('save_path', header=None, index=None)#header第一行,index第一列(默认数字)
#mode = 'a'为追加数据
df.to_csv('save_path', mode='a', header=None, index=None)

9、python列表转dataframe:

#phone_decode = ["a","b","c","d"]
df1 = pd.Series(phone_decode)

10、python列表转numpy

lst = [["a","b"],["c","d"]]
nlst = np.array(lst)

输出:
[['a' 'b']
 ['c' 'd']]

11、numpy转pandas.DataFrame:

df = pd.DataFrame(nlst,index=["xx","yy"],columns=["xxx","yyy"])

12、解决pandas保存中文乱码:

df.to_csv('changed.csv', header=None, index=None, encoding='utf_8_sig')

你可能感兴趣的:(Python,pandas)