比较系统的学习 pandas(1)

入门

1、pandas  的安装

pip install pandas matplotlib -i https://pypi.tuna.tsinghua.edu.cn/simple 

2、pandas 模块导入

可以起别名,一般公认上起别名为  pd 

import pandas as pd

3、pandas的数据结构

Series    :   一个带有标签的一维数组

DataFrame  : 二维表结构,有 行、列、索引、表头等。

4、python 数据类型

可变数据: 列表、元组、字典

不可变数据: 数字、元组、字符串

基础薄弱的话可以查看     字符串 , 列表、字典、字符串常用操作 两篇文章

5、常用Series 的创建方式

import pandas as pd
import numpy as np


# 方法1通过数组创建series
s1 = pd.Series(np.random.rand(5))
print(s1)


# 通过列表
s2 = pd.Series([1,2,3,4,5])
print(s2)

# 方法2通过dict创建series
dic = {'a':1,'b':2,"c":3,"d":4}
s3 = pd.Series(dic)
print(s3)


# 方法3 通过标量
s4 = pd.Series(10,index=['a','c','d'])
print(s4)

6、常用的DataFrame的创建方式

# muchenfeng
import pandas as pd
import numpy as np

#通过双层列表创建
d1 = pd.DataFrame([[1,2,3],[4,5,6],[7,8,9]])

#设置行索引
d2 =pd.DataFrame([[1,2,3],[4,5,6],[7,8,9]],index=["a","b","c"])

#同时设置行索引和列索引
d3 = pd.DataFrame([[1,2,3],[4,5,6],[7,8,9]],index=["a","b","c"],columns=["col1","col2","col3"])

#按字典方式创建
d4 = pd.DataFrame({"姓名":["慕晨风","小慕","苏浅陌"],
                   "性别": ["男", "男", "女"],
                   "age": [23, 24, 21],
                   "学号":["02","78","101"],
                   "班级":["1班","2班","3班"]
                   })

#通过数组
d5 = pd.DataFrame(pd.DataFrame(np.arange(8).reshape(4, 2), columns=list('ab')))

#通过标量
index=["a","b","c"]
clumns=["A","B"]
d6=pd.DataFrame(10,index=index,columns=clumns)

#由Series 构成
s = pd.Series(['a', 'b', 'c', 'd', 'e'])
d7 = pd.DataFrame(s)

if __name__=="__main__":
    print(d1)
    print(d2)
    print(d3)
    print(d4)
    print(d5)
    print(d6)
    print(d7)

7、查看数据类型

#查看所有列的数据类型
print(d4.dtypes) # 各字段的数据类型


#查看某一列数据类型

print(d4["姓名"].dtype)

你可能感兴趣的:(Python,数据分析,pandas,python)