Conda 使用environment.yml创建一个新的Python项目

Conda系列:

  1. 翻译: Anaconda 与 miniconda的区别
  2. Miniconda介绍以及安装
  3. Conda python运行的包和环境管理 入门
  4. Conda python管理环境environments 一 从入门到精通
  5. Conda python管理环境environments 二 从入门到精通
  6. Conda python管理环境environments 三 从入门到精通
  7. Conda python管理环境environments 四 从入门到精通
  8. Conda python管理packages一 从入门到精通
  9. Conda python管理packages二 从入门到精通
    10.Conda python管理packages三 从入门到精通
    在这里插入图片描述

1. 创建项目

在本教程中,我们将介绍如何使用一个 environment.yml 文件在 conda 中设置一个新的 Python 项目。这个文件将帮助您跟踪您的依赖关系并与他人共享您的项目。我们将介绍如何创建您的项目,添加一个简单的 Python 程序并更新它以使用新的依赖项。

2. 创建项目文件

首先,我们需要一个包含项目文件的目录。这可以 使用以下命令创建:

mkdir my-project

在这个目录中,我们现在将创建一个新的environment.yml文件,其中将保存我们Python项目的依赖关系。在您的文本编辑器中(例如VSCode,PyCharm,vim等),创建此文件并添加以下内容:

name: my-project
channels:
  - defaults
dependencies:
  - python

让我们简要回顾一下此文件的每个部分的含义。

  • Name名字: 环境的名称。在这里,我们选择了名称“my-project”。
  • Channels渠道: 通道指定conda搜索软件包的位置。我们选择了defaults默认通道,但也可以列出其他通道,例如conda-forgebioconda
  • Dependencies依赖: 所有你项目需要的依赖。目前为止,我们只添加了Python,因为我们知道它将是一个Python项目。稍后我们会添加更多。

3. Creating our environment创造我们的环境

现在我们已经编写了一个基本的 environment.yml 文件,我们可以从中创建并激活一个环境。要做到这一点,请运行以下命令:

conda env create --file environment.yml
conda activate my-project

4. 创建我们的 Python 应用程序

使用我们新安装了Python的环境,我们可以创建一个简单的Python程序。在你的项目文件夹中,创建一个main.py文件并添加以下内容:

def main():
    print("Hello, conda!")


if __name__ == "__main__":
    main()

我们可以通过运行以下命令来运行简单的 Python 程序:

python main.py
Hello, conda!

5. Updating our project with new dependencies使用新的依赖项更新我们的项目

如果你希望你的项目不仅仅像上面的简单示例那样,你可以使用conda渠道上的数千个可用包之一。为了演示这一点,我们将添加一个新的依赖项,以便我们可以从互联网上拉取一些数据并进行基本的分析。

为了进行数据分析,我们将依赖于Pandas包。为了将其添加到我们的项目中,我们需要更新我们的environment.yml文件:

name: my-project
channels:
  - defaults
dependencies:
  - python
  - pandas  # <-- This is our new dependency

一旦我们完成了这个步骤,我们就可以运行conda env update命令来安装新的包:

conda env update --file environment.yml

现在我们的依赖项已安装,我们将下载一些数据用于我们的分析。为此,我们将使用美国环境保护署在data.gov上提供的步行指数数据集。您可以使用以下命令下载这个数据:

curl -O https://edg.epa.gov/EPADataCommons/public/OA/EPA_SmartLocationDatabase_V3_Jan_2021_Final.csv

根据我们的分析,我们对知道多少美国居民生活在高度适合步行的地区很感兴趣。这是一个我们可以轻松使用pandas库来回答的问题。以下是您可能如何去做的一个示例:

import pandas as pd


def main():
    """
    Answers the question:

    What percentage of U.S. residents live highly walkable neighborhoods?

    "15.26" is the threshold on the index for a highly walkable area.
    """
    csv_file = "./EPA_SmartLocationDatabase_V3_Jan_2021_Final.csv"
    highly_walkable = 15.26

    df = pd.read_csv(csv_file)

    total_population = df["TotPop"].sum()
    highly_walkable_pop = df[df["NatWalkInd"] >= highly_walkable]["TotPop"].sum()

    percentage = (highly_walkable_pop / total_population) * 100.0

    print(
        f"{percentage:.2f}% of U.S. residents live in highly" "walkable neighborhoods."
    )


if __name__ == "__main__":
    main()

请将您的main.py文件更新为上面的代码并运行它。您应该会得到以下答案:

python main.py
10.69% of Americans live in highly walkable neighborhoods

6. Conclusion结论

您刚刚通过使用conda中的environment.yml文件来创建自己的数据分析项目。随着项目的发展,您可能希望添加更多的依赖项,以及更好地将Python代码组织成单独的文件和模块。

参考

https://conda.io/projects/conda/en/latest/user-guide/tasks/creating-projects.html

你可能感兴趣的:(LLM-Large,Language,Models,conda,python,langchain,prompt,开发语言)