Python—padas(DataFrame)的常用操作

分享日常学习中总结的学习笔记,欢迎大家一起学习交流并指正,寻找学习路上的搭档!!!

我们先说一下DataFrame是什么:

1、DataFrame是一种数据框结构,相当于是一个矩阵形式,单元格可以存放数值、字符串等,这和excel表很像;

2、DataFrame是有 行(index)和 列(columns)可以设置的;

我们先看下本章关于DataFrame我们会接触到的知识点

猫看见偶像说

一、创建(pd.DataFrame)

猫看见偶像说

有了示例,我们就能明白创建时需要传入数据,指定index(行索引名)和columns(列名);

在我们需要将单个元素的字典直接转为DataFrame时,程序会报错,需要适当做些转换,指定行索引或者列索引才行;

二、怎么查看数据属性以及一些常用的方法

猫看见偶像说

三、axis(轴使用的说明)、增加删除数据列的操作

猫看见偶像说

在增加列的时候我们用到了一个索引loc,后面我们再详细对loc进行说明,此处先知道可以这样使用。

四、缺失值和文本字符串的处理

猫看见偶像说

文本字符串数据处理之前,一定要先转为字符(.str)再进行处理

五、索引设置和索引提取数据(loc / iloc)

猫看见偶像说

loc 和 iloc如果容易记混,你就取巧记忆,index是索引

所以iloc则是依据位置索引进行取数,没有i的则是按照名称进行提取数据

六、数据的查询、修改和分组计算

猫看见偶像说

最后:我们来看表连接和数据透视表的操作

猫看见偶像说

原谅我很懒,比较喜欢这样框架式的笔记,所以文字就会比较少(#^.^#)!!!

你可能感兴趣的:(Python—padas(DataFrame)的常用操作)