Conda系列:
在本教程中,我们将介绍如何使用一个 environment.yml
文件在 conda 中设置一个新的 Python 项目。这个文件将帮助您跟踪您的依赖关系并与他人共享您的项目。我们将介绍如何创建您的项目,添加一个简单的 Python 程序并更新它以使用新的依赖项。
首先,我们需要一个包含项目文件的目录。这可以 使用以下命令创建:
mkdir my-project
在这个目录中,我们现在将创建一个新的environment.yml
文件,其中将保存我们Python项目的依赖关系。在您的文本编辑器中(例如VSCode,PyCharm,vim等),创建此文件并添加以下内容:
name: my-project
channels:
- defaults
dependencies:
- python
让我们简要回顾一下此文件的每个部分的含义。
conda
搜索软件包的位置。我们选择了defaults
默认通道,但也可以列出其他通道,例如conda-forge
或bioconda
。Python
,因为我们知道它将是一个Python项目。稍后我们会添加更多。现在我们已经编写了一个基本的 environment.yml
文件,我们可以从中创建并激活一个环境。要做到这一点,请运行以下命令:
conda env create --file environment.yml
conda activate my-project
使用我们新安装了Python的环境,我们可以创建一个简单的Python程序。在你的项目文件夹中,创建一个main.py
文件并添加以下内容:
def main():
print("Hello, conda!")
if __name__ == "__main__":
main()
我们可以通过运行以下命令来运行简单的 Python 程序:
python main.py
Hello, conda!
如果你希望你的项目不仅仅像上面的简单示例那样,你可以使用conda渠道上的数千个可用包之一。为了演示这一点,我们将添加一个新的依赖项,以便我们可以从互联网上拉取一些数据并进行基本的分析。
为了进行数据分析,我们将依赖于Pandas包。为了将其添加到我们的项目中,我们需要更新我们的environment.yml
文件:
name: my-project
channels:
- defaults
dependencies:
- python
- pandas # <-- This is our new dependency
一旦我们完成了这个步骤,我们就可以运行conda env update命令来安装新的包:
conda env update --file environment.yml
现在我们的依赖项已安装,我们将下载一些数据用于我们的分析。为此,我们将使用美国环境保护署在data.gov上提供的步行指数数据集。您可以使用以下命令下载这个数据:
curl -O https://edg.epa.gov/EPADataCommons/public/OA/EPA_SmartLocationDatabase_V3_Jan_2021_Final.csv
根据我们的分析,我们对知道多少美国居民生活在高度适合步行的地区很感兴趣。这是一个我们可以轻松使用pandas
库来回答的问题。以下是您可能如何去做的一个示例:
import pandas as pd
def main():
"""
Answers the question:
What percentage of U.S. residents live highly walkable neighborhoods?
"15.26" is the threshold on the index for a highly walkable area.
"""
csv_file = "./EPA_SmartLocationDatabase_V3_Jan_2021_Final.csv"
highly_walkable = 15.26
df = pd.read_csv(csv_file)
total_population = df["TotPop"].sum()
highly_walkable_pop = df[df["NatWalkInd"] >= highly_walkable]["TotPop"].sum()
percentage = (highly_walkable_pop / total_population) * 100.0
print(
f"{percentage:.2f}% of U.S. residents live in highly" "walkable neighborhoods."
)
if __name__ == "__main__":
main()
请将您的main.py
文件更新为上面的代码并运行它。您应该会得到以下答案:
python main.py
10.69% of Americans live in highly walkable neighborhoods
您刚刚通过使用conda中的environment.yml
文件来创建自己的数据分析项目。随着项目的发展,您可能希望添加更多的依赖项,以及更好地将Python代码组织成单独的文件和模块。
https://conda.io/projects/conda/en/latest/user-guide/tasks/creating-projects.html