从 Python homepage下载对应的程序,以Windows版本为例,下载安装程序,安装软件,会自动安装gui(最新版本是3.8,一般安装3.6,我安装的是3.5,因为网页一直打不开,只好安装以前下载过的版本)。
第二个软件安装anconda或者miniconda 3.7,方便软件管理。
接下来打开conda软件,通过conda install SciPy
或conda install scikit-learn
安装SciPy和scikit-learn组件;顺便安装一下TensorFlow组件,TensorFlow貌似只支持Python 3.5,刚好,安装方法一样,同时也可以设置一个TensorFlow的运行环境,参考anaconda建造新的环境并安装sklearn、numpy等模块,这几个库可以都装在TensorFlow环境下(可以是tensorflow或其他什么名字,名字自己起,以后就通过activate tensorflow
激活该环境。,创建环境的方法参考该博文,即在anaconda下输入“conda create -n tensorflow python=3.5
”,这里tensorflow 即是所创建的环境的名字,激活该环境后输入conda list
可以查看该环境下安装的库有哪些)。
看到有的安装指令在conda install
后面还加了一个-c
,是什么意思呢?比如conda install -c bioconda samtools=1.5
,这是因为有些包在conda默认的channels中不包含,所以保险起见,加上-c
更安全一些。在这个例子中“1.5”表示指定要安装的软件版本。
关于SciPy组件,主页为https://www.scipy.org/。这是一个基于Numpy库的高级科学计算库,通过操控Numpy数组来进行科学计算、统计分析,例如线性代数、常微分方程数值求解、信号处理、图像处理、稀疏矩阵等。Scipy函数库的应用包括最小二乘拟合、函数最小值、非线性方程组求解、雅可比矩阵、数值积分,常见的统计函数如T-检验等。可以参考Python数据分析工具库-Scipy 矩阵支持库, SciPy-数值计算库等;更多教程如Scipy教程、SciPy API文档,举例博文Python易筋经-scipy,Scipy可能需要有一定基础才能看了。
scikit-learn是一个整合了多种常用的机器学习算法的Python库,也是建立在NumPy, SciPy基础上的机器学习库,又简称skLearn。通过一个统一的接口来使用,有助于迅速地在数据集上实
现流行的算法(有点类似于R中的caret)。既能用于分类,也能用于回归,它能实现的分类算法如K近邻、支持向量机分类、逻辑回归、随机森林、决策树、朴素贝叶斯分类器等,回归相关算法包括线性回归、岭回归、支持向量机回归、贝叶斯回归、多项式回归等等,具体实施过程中可能要配合numPy、matplotlib、pandas等库一起使用;机器学习之scikit-learn库的使用这篇博文就介绍了利用scikit-learn实现knn分类和线性回归的两个例子,分别用的是iris数据集和Diabetes数据集(都是scikit-learn内置的)---是的,就是我们在R中很熟悉的iris数据集。其他用scikit-learn实现分类的例子如一次完整的机器学习过程(scikit learn library学习笔记、Machine Learning in Python (Scikit-learn)转人人,以后再看了。而Scikit-learn提供的例子介绍几种常用的特征选择这篇则更多的从思想的角度介绍了特征选择要考虑的几个角度,比较不错。
关于scikit,2个比较不错的英文网站(其实是同一个):scikit-learn,Feature selection
练习几个代码(有的库没有装的顺便也装上前面配置过tensorflow环境的话就会发现已经在开始菜单多了个IPython按钮,IPython 是一个增强的交互式运行环境,也是一个增强的python shell),以下命令可以在IPython中运行:
# Python version
import sys
print('Python: {}'.format(sys.version))
# scipy
import scipy
print('scipy: {}'.format(scipy.__version__))
# numpy
import numpy
print('numpy: {}'.format(numpy.__version__))
# matplotlib
import matplotlib
print('matplotlib: {}'.format(matplotlib.__version__))
# pandas
import pandas
print('pandas: {}'.format(pandas.__version__))
# scikit-learn
import sklearn
print('sklearn: {}'.format(sklearn.__version__))
顺便复习一下conda的几个常见用法:
conda config --get channels #查看已经添加的channels:
conda update conda #更新miniconda
rm -rf ~/miniconda #删除miniconda的整个文件夹
conda install fastqc #conda安装fastqc
conda list #查看conda安装软件列表
conda update 软件名 #更新指定软件
conda remove 软件名 #卸载指定软件
conda search 软件名 #搜索软件版本,星号标记的表示是已经安装的版本。
conda install 软件名=版本号 #conda安装指定版本,同时卸载已安装版本
值得一提的是,conda将conda、python等都视为package,因此,完全可以使用conda来管理conda和python的版本
conda update conda # 更新conda,保持conda最新
conda update anaconda # 更新anaconda
conda update python # 更新python
最后,为conda添加国内镜像源:
conda config --add channels [https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/](https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/) # 添加Anaconda的TUNA镜像
conda config --add channels [https://mirrors.ustc.edu.cn/anaconda/pkgs/free/](https://mirrors.ustc.edu.cn/anaconda/pkgs/free/) #添加中科大镜像
其他:
pip版本查看和升级:https://www.cnblogs.com/xinxin1994/p/11761109.html
一、pip show pip
查看pip版本,下面还提示安装命令和pip可以升级到的最新版本。
二、python -m pip install --upgrade pip
升级我们的pip【实践证明,该命令经常失败,可能是因为服务器在国外的缘故,换成代码为python -m pip install --upgrade pip -i https://pypi.douban.com/simple
即可解决。同样的,安装其他包也可使用此方法加快下载速度,比如 安装pip install scipy使用pip install scipy -i https://pypi.douban.com/simple
】。
在指定conda环境下pip安装:https://blog.csdn.net/weixin_42175217/article/details/104741304
进入对应的conda环境,然后使用pip install
安装:
conda activate your_conda_environment
pip install tensorflow==1.14.0
安装包的时候的命令为进入TensorFlow环境之后,用命令行pip install seaborn
安装或者用conda安装:conda install seaborn
conda update pip
更新pip包,然后进入TensorFlow环境,再用pip安装其他包