Python环境指南2023版

前言

Python在数据科学、机器学习领域也是重要利器(yyds)。这是一篇Python环境指南,告诉你如何配置Python环境,并安装相关的库,进行数据科学和机器学习研究。

在数据科学和机器学习领域,我们可以使用Python的标准环境,也可以使用Anaconda。因为Anaconda不仅仅支持Python语言,还支持其它的数据科学工具,比如Matlab,R语言,Fortran语言。Anaconda同时也是一个工具库的分发平台,可以从中下载和安装库。在Anaconda环境中,我们可以使用 conda 命令进行库的安装。如果我们不需要其它语言,我们可以使用其简洁版本Miniconda。另外数据科学家更习惯使用Jupyter进行研究,Jupyter是一个Web化的开发工具,可以单步交互式的执行称为Notebook的代码。JupyterLab则是下一代的Jupter。以上是我们在开始之前,需要了解的基础概念, 总结下来就是下面一张表:

Python环境指南2023版_第1张图片

jupter的界面大概是这样:

Python环境指南2023版_第2张图片
大家也可以直接体验jupyter.org/try-jupyter…

环境安装
可以使用下面命令安装miniconda:

curl https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh | sh

安装完成miniconda后可以这样创建和使用虚拟环境:

# Best practice, use an environment rather than install in the base env
conda create -n my-env
conda activate my-env
# If you want to install from conda-forge
conda config --env --add channels conda-forge
# The actual install command
conda install numpy

这使用起来和Python的虚拟环境类似:

python3 -m venv .venv
source .venv/bin/activate
pip install numpy

当然,你可以在conda环境中直接使用pip:

(my-env) [game404@y ~]$ pip list
Package    Version
---------- -------
numpy      1.24.1
pip        22.3.1
setuptools 65.6.3
wheel      0.38.4

我们可以使用下面两个命令之一安装jupyterlab:

conda install jupyterlab
或者
pip install jupyterlab

conda命令是从anaconda源安装;pip是用PyPi源安装,两个命令异曲同工,就看谁网速快

启动jupyter-lab
安装完jupyter-lab后,可以使用下面命令打开它:

(my-env) [game404@y ~]$jupyter-lab
[I 2023-01-08 21:26:50.250 ServerApp] jupyter_server_terminals | extension was successfully linked.
[I 2023-01-08 21:26:50.257 ServerApp] jupyterlab | extension was successfully linked.
[I 2023-01-08 21:26:50.262 ServerApp] nbclassic | extension was successfully linked.
...
[I 2023-01-08 21:26:50.842 ServerApp] Use Control-C to stop this server and shut down all kernels (twice to skip confirmation).
[W 2023-01-08 21:26:50.847 ServerApp] No web browser found: could not locate runnable browser.
[C 2023-01-08 21:26:50.848 ServerApp]

    To access the server, open this file in a browser:
        file:///home/yuanzuxiang/.local/share/jupyter/runtime/jpserver-3540-open.html
    Or copy and paste one of these URLs:
        http://localhost:8889/lab?token=f5028b1978baa74512cec56cff7c4f9e2dbbc4592cdf5b69
     or http://127.0.0.1:8889/lab?token=f5028b1978baa74512cec56cff7c4f9e2dbbc4592cdf5b69

注意这里的token,是权限访问的token, 初次访问首页需要使用

然后我们通过浏览器访问jupyter-lab,创建Notebook,直接测试python环境:

Python环境指南2023版_第3张图片

红色的Notebook Icon和引导界面一致
使用顶部工具栏【->】执行代码
notebook主要是可以按照cell执行代码

安装常用库
安装好Python环境和Jupyter-lab工具后,接下来我们开始安装常用库,主要涉及下面7个库:

numpy The fundamental package for scientific computing with Python
pandas is a fast, powerful, flexible and easy to use open source data analysis and manipulation tool,
built on top of the Python programming language.
matplotlib Matplotlib is a comprehensive library for creating static, animated, and interactive visualizations in Python. Matplotlib makes easy things easy and hard things possible.
seaborn is a Python data visualization library based on matplotlib.
scipy Fundamental algorithms for scientific computing in Python
statsmodels statistical models, hypothesis tests, and data exploration
sklearn Machine Learning in Python

这些库互相也有依赖关系,numpy是最基础的矩阵实现,pandas是最核心的数据表操作,seaborn又基于matplotlib,它们负责数据可视化,scipy和statsmodels提供一些统计方法,sklearn进行机器学习和线性回归。我们可以按照这样的顺序去安装:

conda install numpy
conda install pandas
conda install matplotlib
conda install seaborn
conda install scipy
conda install statsmodels
conda install scikit-learn

也可以直接使用pip命令安装:

pip install numpy
pip install pandas
pip install matplotlib
pip install seaborn
pip install scipy
pip install statsmodels
pip install scikit-learn

一般我们这样导入它们:

import numpy as np
import pandas as pd

import matplotlib as mpl
import matplotlib.pyplot as plt
import seaborn as sns
import seaborn.objects as so

from scipy import stats
from sklearn import linear_model
import statsmodels.api as sm

jupyter-lab中也可以使用pip命令安装库:

Python环境指南2023版_第4张图片
注意前面的 ! 是必须的

读者福利:知道你对Python感兴趣,便准备了这套python学习资料

对于0基础小白入门:

如果你是零基础小白,想快速入门Python是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以找到适合自己的学习方案

包括:Python安装包+激活码、Python web开发,Python爬虫,Python数据分析,人工智能、机器学习等习教程。带你从零基础系统性的学好Python!

零基础Python学习资源介绍

Python学习路线汇总

Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。(全套教程文末领取哈)

Python必备开发工具

温馨提示:篇幅有限,已打包文件夹,获取方式在:文末

Python学习视频600合集

观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

实战案例

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
Python环境指南2023版_第5张图片

100道Python练习题

检查学习结果。

面试刷题


Python环境指南2023版_第6张图片

在这里插入图片描述

资料领取

上述这份完整版的Python全套学习资料已经上传CSDN官方,朋友们如果需要可以微信扫描下方CSDN官方认证二维码输入“领取资料” 即可领取

在这里插入图片描述

好文推荐

了解python的前景:https://blog.csdn.net/SpringJavaMyBatis/article/details/127194835

了解python的兼职副业:https://blog.csdn.net/SpringJavaMyBatis/article/details/127196603

你可能感兴趣的:(python,python,开发语言,Python环境,爬虫,Python教程)