Excel是一个无处不在的数据处理、分析工具,大多数人或多或少都使用过Excel,而且一旦你掌握了它的使用技巧,你会打开另外一扇窗!
此外,也有人认为,具有无限潜力的Python也非常有挑战性。在这篇文章中,我们将探讨在Excel中能够完成,但是在Python中能够更轻松实现的三件事!
从导入panda开始,并基于工作簿中需要用的工作表加载两个数据帧。两个列的定义为 sales 和 states 。
import pandas as pd
sales = pd.read_excel('https://github.com/datagy/mediumdata/raw/master/pythonexcel.xlsx', sheet_name = 'sales')
states = pd.read_excel('https://github.com/datagy/mediumdata/raw/master/pythonexcel.xlsx', sheet_name = 'states')
将我们的数据集导入Pandas数据帧。
让我们想象一下,我们对数据帧运行了.head()方法,如下所示:
print(sales.head())
我们可以将其与Excel中的数据进行比较:
我们可以看到显示的数据与Excel显示数据的方式相对类似,但有一些关键的区别:
让我们开始深入探讨如何运用 Pandas 完成Excel任务。
在Excel中使用IF函数非常方便,允许我们根据另一个单元格中的条件应用某个标签。假设我们想创建一个新列,让我们知道B列中单元格的值是否大于500。在Excel中,我们将列E标记为大于500,然后进入单元格E2并写入:
=IF([@Sales]>500, "Yes", "No")
如果我们想在Pandas中这样做,我们可以使用列表理解来轻松应用相同的 If 语句:
df['MoreThan500'] = ['Yes' if x > 500 else 'No' for x in df['Sales']
列表理解是这类工作的好工具,它减少了编写复杂 if/else 语句的需要。使用 if/else 语句也可以完成相同的任务,但这样可以节省时间并使代码更简洁。通过阅读本文,你可以详细了解列表理解。
在我们的数据集中,城市在一张纸上,州/省在另一张纸上。这并不理想,但我们可以使用Excel中的VLOOKUP链接数据。VLOOKUP的工作方式与左连接类似,左数据集中的每个记录都被保留。我们告诉Excel在查找表中垂直上下查找列中的特定值,然后返回一个值,该值位于列右侧的特定列数中。
让我们添加一个名为“State”的列,并使用VLOOKUP从 States 表返回相应的状态。
在Python中,我们可以使用Pandas merge函数完成相同的任务。Merge获取两个数据帧并合并它们。为此,我们将编写以下代码:
sales = pd.merge(sales, states, how='left', on='City')
让我们把这个论点一个一个地分解开来:
数据透视表是Excel最强大的功能之一,它允许我们以惊人的速度提取关于大型数据集的有意义的数据。让我们根据每个城市的销售额总和创建一个数据透视表。
为此,我们只需将City字段拖到Rows部分,将Sales字段拖到Values部分。Excel自动汇总数据集中每个城市的销售额。
要在Pandas中生成相同的数据透视表,我们将编写以下代码:
sales.pivot_table(index = 'City', values = 'Sales', aggfunc = 'sum'))
我们再把这个分解一下:
sales.pivot_
表让Pandas知道我们要基于sales dataframe创建一个pivot表在本文中,我们学习了如何将Excel数据导入Pandas,如何完成IF和VLOOKUP函数,以及如何生成数据透视表。
但你可能会问自己,如果你能在Excel中完成这里列出的所有工作,为什么要使用Pandas?
这里没有一个明确的答案。Python允许我们生成可重用的、可跟踪的代码,使我们能够轻松地复制分析设计,Excel可能只够进行更小的分析。
原文链接:
https://towardsdatascience.com/learn-how-to-easily-do-3-advanced-excel-tasks-in-python-925a6b7dd081
文源网络,仅供学习之用,如有侵权请联系删除。
在学习Python的道路上肯定会遇见困难,别慌,我这里有一套学习资料,包含40+本电子书,800+个教学视频,涉及Python基础、爬虫、框架、数据分析、机器学习等,不怕你学不会! https://shimo.im/docs/JWCghr8prjCVCxxK/ 《Python学习资料》
关注公众号【Python圈子】,优质文章每日送达。