Python机器学习基础教程学习笔记(1)——用到的库

Python机器学习基础教程学习笔记(1)——用到的库

1 Numpy

numpy数组

import numpy as np
x = np.array([[1,2,3],[4,5,6]])
print("x:\n{}".format(x))
x:
[[1 2 3]
 [4 5 6]]

2 Scipy

scipy中最重要的是scipy.sparse,它可以给出稀疏矩阵

from scipy import sparse
# 创建一个三维Numpy数组,对角线为1,其余都为0
eye = np.eye(4)
print("NumPy array:\n{}".format(eye))
NumPy array:
[[1. 0. 0. 0.]
 [0. 1. 0. 0.]
 [0. 0. 1. 0.]
 [0. 0. 0. 1.]]
# 将Numpy数组转换成CSR格式的稀疏矩阵
# 只保存非零元素
sparse_martrix = sparse.csr_matrix(eye)
print("\nSciPy sparse CSR matrix:\n{}".format(sparse_martrix))
SciPy sparse CSR matrix:
  (0, 0)    1.0
  (1, 1)    1.0
  (2, 2)    1.0
  (3, 3)    1.0
# coo格式的稀疏矩阵
data = np.ones(4)
row_indices = np.arange(4)
col_indices = np.arange(4)
eye_coo = sparse.coo_matrix(data,(row_indices,col_indices))
print("COO representation:\n{}".format(eye_coo))
COO representation:
  (0, 0)    1.0
  (0, 1)    1.0
  (0, 2)    1.0
  (0, 3)    1.0

3 matplotlib

python的科学绘图库。

在jupyter notebook中,可以使用%matplotlib notebook(这种写法可以交互)和%matplotlib inline命令,将图像直接显示在浏览器中。否则要调用plt.show来显示图像

%matplotlib inline
import matplotlib.pyplot as plt
# 在-10和10之间生成一个数列,共100个数
x = np.linspace(-10,10,100)
# 用正弦函数创建第二个数组
y = np.sin(x)
# 用plot函数绘制一个数组关于另一个数组的折线图
plt.plot(x,y,marker='x')
# plt.show()
[]
output_8_1

4 Pandas

# 利用字典创建DataFrame的一个小例子
import pandas as pd
from IPython.display import display

# 创建关于人的简单数据集
data = {
    'name':['john','anan','peter','linda'],
    'location':['new york','pairs','berlin','london'],
    'age':[24,13,53,33]
}
data_pandas = pd.DataFrame(data)
# IPython.display可以在jupyter notebook中打印出“美观的”dataframe
display(data_pandas)

name location age
0 john new york 24
1 anan pairs 13
2 peter berlin 53
3 linda london 33
# 选择年龄大于30的所有行
display(data_pandas[data_pandas.age>30])
name location age
2 peter berlin 53
3 linda london 33

5 查看各库的版本

import sys
print("Python version:{}".format(sys.version))

import pandas as pd
print("pandas version:{}".format(pd.__version__))

import matplotlib
print("matplotlib version:{}".format(matplotlib.__version__))

import numpy as np
print("numpy version:{}".format(np.__version__))

import scipy as sp
print("scipy version:{}".format(sp.__version__))

import IPython 
print("IPython version:{}".format(IPython.__version__))

import sklearn 
print("sklearn version:{}".format(sklearn.__version__))
Python version:3.7.3 (default, Mar 27 2019, 16:54:48) 
[Clang 4.0.1 (tags/RELEASE_401/final)]
pandas version:0.24.2
matplotlib version:3.0.3
numpy version:1.16.2
scipy version:1.2.1
IPython version:7.4.0
sklearn version:0.20.3

你可能感兴趣的:(Python机器学习基础教程学习笔记(1)——用到的库)