python-pandas安装-读入数据-添加索引-美国小孩英文名

1910~2019年间美国小孩英文名使用情况

  • 数据引用
  • 一、pandas是什么?
  • 二、使用步骤
    • 1.安装pandas插件
    • 2.引入库
    • 3.读入数据
    • 4.添加索引
  • 总结

数据引用


继上个博客,得到了1910~2019年间美国小孩英文名的csv文件,这个博客学习如何引用csv,以下引入pandas库。该方法博主用的是jupyter来写的(对于jupyter该博客就不说了,想要了解的可自行上网查看)。

一、pandas是什么?

Pandas 是python的一个数据分析包,最初由AQR Capital Management于2008年4月开发,并于2009年底开源出来,目前由专注于Python数据包开发的PyData开发team继续开发和维护,属于PyData项目的一部分。Pandas最初被作为金融数据分析工具而开发出来,因此,pandas为时间序列分析提供了很好的支持。 Pandas的名称来自于面板数据(panel data)和python数据分析(data analysis)。panel data是经济学中关于多维数据集的一个术语,在Pandas中也提供了panel的数据类型。

二、使用步骤

1.安装pandas插件

1.安装pandas
确保电脑上已经安装了python之后,打开命令指示符(cmd),找到python安装路径,并输入pip install pandas
最后显示
2.安装matplotlib(可视化后面会使用)
类似pandas安装,输入pip install matplotlib

2.引入库

代码如下(示例):

import numpy as np
import pandas as pd

3.读入数据

代码如下(示例):

import pandas as pd
from pandas import Series,DataFrame

data=pd.read_csv("res.csv",encoding="utf-8")
data

该处使用pandas中read_csv方法读入csv文件。
在wps中的csv文件如下所示:
python-pandas安装-读入数据-添加索引-美国小孩英文名_第1张图片

读出数据如下:
python-pandas安装-读入数据-添加索引-美国小孩英文名_第2张图片
观察wps中打开的数据,和读入的数据,在wps中打开csv文件,没有索引,而读入的csv文件中自动添加了行索引和列索引,行索引是自动添加的数,而列索引是以文件的第一行作为列索引。

4.添加索引

博主在网上搜了添加方法:
代码如下(示例):

import pandas as pd
from pandas import Series,DataFrame

data=pd.read_csv("res.csv",encoding="utf-8")

data=data.reindex(columns=['county','sex','year','name','number'])
data

这个方法可以添加行索引和列索引,结果如下:
python-pandas安装-读入数据-添加索引-美国小孩英文名_第3张图片
可以发现,行索引和列索引都添加了,但是里面的数据为空(该方法不适用)
于是有了以下方法(直接在读取数据的时候就增加索引):
代码如下(示例):

import pandas as pd
from pandas import Series,DataFrame

data=pd.read_csv("res.csv",encoding="utf-8",header=None,names=['county','sex','year','name','number'])
data

结果如下:
python-pandas安装-读入数据-添加索引-美国小孩英文名_第4张图片
成功的添加了索引。


总结

以上就是今天的内容,本文仅仅简单介绍了pandas的使用和如何读csv文件和修改索引,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。 后面博客将继续对传入数据进行分析。

对以上内容有问题或有疑问的,欢迎在评论区评论,博主会看,并会回答疑问,有不懂或者觉得有更好的方法,欢迎评论,可以和博主一起讨论!!!

你可能感兴趣的:(python,数据分析,pandas,python,数据分析,pandas)