python之panda模块2

上一节中说了Python的基础数据结构,这一节我来总结一下我所学到的pandas的部分知识点:

Pandas 是 Python 的核心数据分析支持库,提供了快速、灵活、明确的数据结构,旨在简单、直观地处理关系型、标记型数据

1:pandas读取数据:

data = pd.read_csv( my_file.csv )
data = pd.read_csv( my_file.csv , sep= ; , encoding= latin-1 , nrows=1000, skiprows=[2,5])

sep 代表的是分隔符。如果你在使用法语数据,excel 中 csv 分隔符是「;」,因此你需要显式地指定它。
编码设置为 latin-1 来读取法语字符。
nrows=1000 表示读取前 1000 行数据。
skiprows=[2,5] 表示你在读取文件的时候会移除第 2 行和第 5 行。

最常用的功能:read_csv, read_excel
其他一些很棒的功能:read_clipboard, read_sql

2:pandas查看数据

  • 计算基本的统计数据
data.describe()
  • 打印出数据的前 3 行。
data.head(5)
  • .tail() 对应的是数据的最后5行。
data.tail(5)
  • 打印出第3行,索引为3 的所有数据
 data.loc[3]
  • 第四到第六行(左闭右开)的数据子集
data.loc[range(4,6)]

今天先学到这里,后续接着补充
一步一步提升,稳赢!!!
无论什么事情,只要投入足够有效的时间才能把它做好。

你可能感兴趣的:(数据可视化,python,数据分析,数据可视化)