pandas的series创建和pandans的dataFrame创建

一:series和读取外部数据

        1.1pandas的series的了解

               1.1.1 为什么要学习pandas

                        numpy能够帮我们处理处理数值型数据,但是这还不够。很多时候,我们的数据除了数值之外,还有字符串,还有时间序列

                        比如:我们通过爬虫获取到了存储在数据库中的数据

                        比如:之前youtube的例子中除了数值之外还有国家的信息,视频的分类(tag)信息,标题信息等。所以,numpy能够帮助我们处理数值,但是pandas除了处理数值之外(基于numpy),还能够帮助我们处理其他类型的数据   

                1.1.2什么是pandas

                         pandas is an open source, BSD-licensed library providing high-performance, easy-to-use data structures and data analysis tools for the Python programming language.                            1.1.3pandas的常用数据类型

                        1.Series一维,带标签数组   2.DataFrame二维,Series容器

                1.1.4pandas之创建Series创建

                        通过列表创建(不指定索引,索引值默认从0开始,往后递增)

                        pandas的series创建和pandans的dataFrame创建_第1张图片

                         指定索引

                        pandas的series创建和pandans的dataFrame创建_第2张图片

                        通过字典类型创建pandas之Series创建(字典的键变成了索引,字典的值就是对应的值)

                        pandas的series创建和pandans的dataFrame创建_第3张图片 

                1.1.5pandas之Series切片和索引

                        切片:直接传入start end 或者步长即可

                        索引:一个的时候传入序号或者index,多个的时候传入序号或者index的列表

                           通过索引取值

                            pandas的series创建和pandans的dataFrame创建_第4张图片      

                            通过位置取值(数字0,1就是要取第几行的数据)

                             pandas的series创建和pandans的dataFrame创建_第5张图片

                            取连续或者不连续的多行

                            pandas的series创建和pandans的dataFrame创建_第6张图片

                             pandas的series创建和pandans的dataFrame创建_第7张图片

                1.1.5pandas之Series切片和索引

                        pandas的series创建和pandans的dataFrame创建_第8张图片

                         pandas的series创建和pandans的dataFrame创建_第9张图片

                         pandas的series创建和pandans的dataFrame创建_第10张图片

        1.2pandas读取外部数据

                读取csv文件

                我们的这组数据存在csv中,我们直接使用pd. read_csv即可

                pandas的series创建和pandans的dataFrame创建_第11张图片

二:dataframe

        2.1pandas的dataFrame的创建

                pandas的series创建和pandans的dataFrame创建_第12张图片

                 pandas的series创建和pandans的dataFrame创建_第13张图片

                 指定行,列索引(index行,columns列)

                pandas的series创建和pandans的dataFrame创建_第14张图片

                通过字典的形式创建DataFrame

                 pandas的series创建和pandans的dataFrame创建_第15张图片

                 通过列表的形式创建DataFrame(缺失的数据会用NaN代替)

                   pandas的series创建和pandans的dataFrame创建_第16张图片

        2.2Dataframe的描述信息

                pandas的series创建和pandans的dataFrame创建_第17张图片

                 pandas的series创建和pandans的dataFrame创建_第18张图片

        2.3Dataframe的索引

                pandas之取行或者列

                

                取前20行数据

                pandas的series创建和pandans的dataFrame创建_第19张图片 

                 pandas的series创建和pandans的dataFrame创建_第20张图片

                 pandas之loc(获取行的时候,列的那一行不需要管,获取列的时候,行的那一行需要打上冒号)

                 pandas的series创建和pandans的dataFrame创建_第21张图片

                 pandas的series创建和pandans的dataFrame创建_第22张图片

                 取具体某个值

                  pandas的series创建和pandans的dataFrame创建_第23张图片

                 取一整行

                pandas的series创建和pandans的dataFrame创建_第24张图片

                 取一整列

                pandas的series创建和pandans的dataFrame创建_第25张图片

                 取多行

                pandas的series创建和pandans的dataFrame创建_第26张图片

                 pandas之iloc

                  pandas的series创建和pandans的dataFrame创建_第27张图片

                 取某一行

                pandas的series创建和pandans的dataFrame创建_第28张图片

                 取某一列

                  pandas的series创建和pandans的dataFrame创建_第29张图片

                 取不连续的多列

                pandas的series创建和pandans的dataFrame创建_第30张图片

                  pandas的series创建和pandans的dataFrame创建_第31张图片 

                 pandas的series创建和pandans的dataFrame创建_第32张图片

 

        2.4bool索引和缺失数据的处理

                pandas之布尔索引

                pandas的series创建和pandans的dataFrame创建_第33张图片

                 pandas的series创建和pandans的dataFrame创建_第34张图片

                pandas之字符串方法

                pandas的series创建和pandans的dataFrame创建_第35张图片 

                 缺失数据的处理

                pandas的series创建和pandans的dataFrame创建_第36张图片

                     pandas的series创建和pandans的dataFrame创建_第37张图片 

                         pandas的series创建和pandans的dataFrame创建_第38张图片

 

三:统计方法和字符串离散化

        3.1pandas的常用统计方法

                pandas的series创建和pandans的dataFrame创建_第39张图片

 

        3.1电影书直方图

                pandas的series创建和pandans的dataFrame创建_第40张图片

 

你可能感兴趣的:(pandas,python,数据分析)