Python是进行数据分析的一种很不错的语言,主要是因为以数据为中心的#python#库非常适合。 Pandas是其中的一种,使导入和分析数据更加容易。 在本文中,我使用了来分析斯坦福网站的公共数据集中的Country Data.csv文件中的数据。
安装Pandas:
pip install pandas
在Pandas中创建DataFrame通过使用pd.Series方法将多个Series传递到DataFrame类中来完成数据帧的创建。 在这里,它在两个Series对象中传递,s1作为第一行,s2作为第二行。
例子:
s1 = pd.Series([1,2])
s2 = pd.Series(["Ashish", "Sid"])
df = pd.DataFrame([s1,s2])
df
dframe = pd.DataFrame([[1,2],["Ashish", "Sid"]],
index=["r1", "r2"],
columns=["c1", "c2"])
dframe
dframe = pd.DataFrame({
"c1": [1, "Ashish"],
"c2": [2, "Sid"]})
dframe
输出:
第一步是读取数据。数据存储为逗号分隔值或csv文件,其中每行用换行分隔,每列用逗号(,)分隔。为了能够使用Python中的数据,需要将csv文件读取到Pandas DataFrame中。DataFrame是表示和处理表格数据的一种方式。
例子:
import pandas as pd
df = pd.read_csv("IND_data.csv")
df.head()
df.shape
输出:
29,10
可以使用pandas.DataFrame.iloc方法建立索引。iloc方法允许按位置检索多达行和列。
例子:
df.iloc[0:5,:]
df.iloc[:,:]
df.iloc[5:,:5]
可以使用pandas.DataFrame.loc方法对标签进行索引,该方法允许使用标签而不是位置进行索引。
例子:
df.loc[0:5,:]
df = df.loc[5:,:]
上面的内容实际上与df.iloc [0:5 ,:]并没有太大区别。这是因为尽管行标签可以采用任何值,但我们的行标签与位置完全匹配。但是,列标签可以使处理数据时变得更加容易。例子:
df.loc[:5,"Time period"]
数据帧的计算可以通过使用pandas工具的统计功能来完成。
例子:
df.describe()
df.corr()
df.rank()
这些示例中的图是使用用于引用matplotlib API的标准约定制作的,该API提供了Pandas的基础知识,可轻松创建美观地图。
例子:
import the required module
import matplotlib.pyplot as plt
df['Observation Value'].hist(bins=10)
df.boxplot(column='Observation Value', by = 'Time period')
x = df["Observation Value"]
y = df["Time period"]
plt.scatter(x, y, label= "stars", color= "m",
marker= "*", s=30)
plt.xlabel('Observation Value')
plt.ylabel('Time period')
plt.show()
学好 Python 不论是就业还是做副业赚钱都不错,但要学会 Python 还是要有一个学习规划。最后大家分享一份全套的 Python 学习资料,给那些想学习 Python 的小伙伴们一点帮助!
Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
检查学习结果。
我们学习Python必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。
保证100%免费
】