Python机器学习基础教程学习笔记(1)——用到的库
1 Numpy
numpy数组
import numpy as np
x = np.array([[1,2,3],[4,5,6]])
print("x:\n{}".format(x))
x:
[[1 2 3]
[4 5 6]]
2 Scipy
scipy中最重要的是scipy.sparse,它可以给出稀疏矩阵
from scipy import sparse
# 创建一个三维Numpy数组,对角线为1,其余都为0
eye = np.eye(4)
print("NumPy array:\n{}".format(eye))
NumPy array:
[[1. 0. 0. 0.]
[0. 1. 0. 0.]
[0. 0. 1. 0.]
[0. 0. 0. 1.]]
# 将Numpy数组转换成CSR格式的稀疏矩阵
# 只保存非零元素
sparse_martrix = sparse.csr_matrix(eye)
print("\nSciPy sparse CSR matrix:\n{}".format(sparse_martrix))
SciPy sparse CSR matrix:
(0, 0) 1.0
(1, 1) 1.0
(2, 2) 1.0
(3, 3) 1.0
# coo格式的稀疏矩阵
data = np.ones(4)
row_indices = np.arange(4)
col_indices = np.arange(4)
eye_coo = sparse.coo_matrix(data,(row_indices,col_indices))
print("COO representation:\n{}".format(eye_coo))
COO representation:
(0, 0) 1.0
(0, 1) 1.0
(0, 2) 1.0
(0, 3) 1.0
3 matplotlib
python的科学绘图库。
在jupyter notebook中,可以使用%matplotlib notebook
(这种写法可以交互)和%matplotlib inline
命令,将图像直接显示在浏览器中。否则要调用plt.show
来显示图像
%matplotlib inline
import matplotlib.pyplot as plt
# 在-10和10之间生成一个数列,共100个数
x = np.linspace(-10,10,100)
# 用正弦函数创建第二个数组
y = np.sin(x)
# 用plot函数绘制一个数组关于另一个数组的折线图
plt.plot(x,y,marker='x')
# plt.show()
[]
4 Pandas
# 利用字典创建DataFrame的一个小例子
import pandas as pd
from IPython.display import display
# 创建关于人的简单数据集
data = {
'name':['john','anan','peter','linda'],
'location':['new york','pairs','berlin','london'],
'age':[24,13,53,33]
}
data_pandas = pd.DataFrame(data)
# IPython.display可以在jupyter notebook中打印出“美观的”dataframe
display(data_pandas)
name | location | age | |
---|---|---|---|
0 | john | new york | 24 |
1 | anan | pairs | 13 |
2 | peter | berlin | 53 |
3 | linda | london | 33 |
# 选择年龄大于30的所有行
display(data_pandas[data_pandas.age>30])
name | location | age | |
---|---|---|---|
2 | peter | berlin | 53 |
3 | linda | london | 33 |
5 查看各库的版本
import sys
print("Python version:{}".format(sys.version))
import pandas as pd
print("pandas version:{}".format(pd.__version__))
import matplotlib
print("matplotlib version:{}".format(matplotlib.__version__))
import numpy as np
print("numpy version:{}".format(np.__version__))
import scipy as sp
print("scipy version:{}".format(sp.__version__))
import IPython
print("IPython version:{}".format(IPython.__version__))
import sklearn
print("sklearn version:{}".format(sklearn.__version__))
Python version:3.7.3 (default, Mar 27 2019, 16:54:48)
[Clang 4.0.1 (tags/RELEASE_401/final)]
pandas version:0.24.2
matplotlib version:3.0.3
numpy version:1.16.2
scipy version:1.2.1
IPython version:7.4.0
sklearn version:0.20.3