数据科学家之路 chapter2 --- pandas(part2)

最近刚考完研,终于有学习专业知识的时间了,决定先把pandas的技能捡起来,这里就记录一些我觉得很有用的方法。

1.unique:查看某列不重复的数量

数据科学家之路 chapter2 --- pandas(part2)_第1张图片

2.str(对于字符串的处理):为字符串类型的变量加上str就带来了很多处理字符串的方法,这里的startswith就是找到姓李的人

数据科学家之路 chapter2 --- pandas(part2)_第2张图片

3.resample:这个方法是用来完成日期的聚合工作,包括按周(W),日期,月(M),年(A),季度(Q)等等,如不加限制,这些都会以一年中最后一天来分割,如果你想要用第一天,即可加上S,所以下面代码中的10AS不难理解,是将数据划分为了每10年一个组,且以1月1日为开始。

数据科学家之路 chapter2 --- pandas(part2)_第3张图片

4.apply:可以对DataFrame对象进行操作,可以作用于一行,一列或者单个元素。再提一句,下面这段代码有没有给人一种很简洁的感觉~

数据科学家之路 chapter2 --- pandas(part2)_第4张图片

5.axis:对于DataFrame来说,直接应用各种函数(mean,count...)是直接把所有值拿来算,而加上axis=1之后,是对于每一行来计算。需注意的是,axis=0指的是逐行,axis=1指的是逐列。

数据科学家之路 chapter2 --- pandas(part2)_第5张图片

6.query:其实就是个查询函数

数据科学家之路 chapter2 --- pandas(part2)_第6张图片

7.del:删除,这样感觉比较方便

 

 

 

你可能感兴趣的:(数据科学)