python杂记

python杂记

1.enumerate() 函数

enumerate() 函数用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标,一般用在 for 循环当中
语法
以下是 enumerate() 方法的语法:
enumerate(sequence, [start=0])

参数
sequence – 一个序列、迭代器或其他支持迭代对象。
start – 下标起始位置。
返回值
返回 enumerate(枚举) 对象。

实例
以下展示了使用 enumerate() 方法的实例:

>>>seasons = ['Spring', 'Summer', 'Fall', 'Winter']
>>> list(enumerate(seasons))
[(0, 'Spring'), (1, 'Summer'), (2, 'Fall'), (3, 'Winter')]
>>> list(enumerate(seasons, start=1))       # 下标从 1 开始
[(1, 'Spring'), (2, 'Summer'), (3, 'Fall'), (4, 'Winter')]

普通的 for 循环

>>>i = 0
>>> seq = ['one', 'two', 'three']
>>> for element in seq:
...     print i, seq[i]
...     i +=1
... 
0 one
1 two
2 three

for 循环使用 enumerate

```cpp
>>>seq = ['one', 'two', 'three']
>>> for i, element in enumerate(seq):
...     print i, element
... 
0 one
1 two
2 three

2.求导

求偏导数partial derivative
利用Sympy库

SymPy是一个符号计算的Python库。它的目标是成为一个全功能的计算机代数系统,同时保持代码简洁、易于理解和扩展。它完全由Python写成,不依赖于外部库。

SymPy支持符号计算、高精度计算、模式匹配、绘图、解方程、微积分、组合数学、离散数学、几何学、概率与统计、物理学等方面的功能。

程序代码

>>> from sympy import symbols, diff
>>> x, y = symbols('x y', real=True)
>>> diff( x**2 + y**3, y)
3*y**2
>>> diff( x**2 + y**3, y).subs({x:3, y:1})
3

先将所求变量(x,y)符号化。否则会提示为定义错误:NameError: name ‘y’ is not defined。之后利用diff函数求对应函数偏导数。
求出偏导数之后,若想求具体的值,可利用subs属性进行变量的替换,便可自动求出对应值。

3.一维数组变多维数组

python对数组进行形状变化的代码为 原数组.reshape(新行数,新列数)

首先生成一个一维的数组

import numpy as np
list1=[1,2,3,4,5,6]
array1=np.array(list1)
print(array1)

运行上面的代码得到下面这样的一维数组

在这里插入图片描述

然后对数组进行转化,转换成一列的代码如下

array2=array1.reshape(-1,1)
 
array2=array1.reshape(6,1

这两行代码是等价的,第一行代码用-1代替了6。这两行代码得到的结果都如下

python杂记_第1张图片

转换成2行3列的数组的代码为

array3=array1.reshape(2,3)

得到结果为
在这里插入图片描述

4.Python中求对数方法总结

Python中Math库和Python库都具备求对数的函数。

import numpy as np
import math

1. Numpy库

1.1 求以e、2、10为底的对数
函数 功能
np.log(x) 以e为底的对数(自然对数)
np.log10(x) 以10为底的对数
np.log2(x) 以2为底的对数
np.log1p(x) 等价于:np.log(x + 1)
备注:np.expm1(x) 等价于 np.exp(x) - 1,也是np.log1p(x)的逆运算。

1.2 求以任意数为底的对数
在Numpy中以任意数为底的对数需要用到换底公式:
在这里插入图片描述

例如:以3为底,5的对数

在这里插入图片描述

代码写出来为:

np.log(5)/np.log(3)

2. Math库

2.1 求以e、2、10为底的对数
与Numpy中的用法完全一样

函数 功能
math.log(x) 以e为底的对数(自然对数)
math.log10(x) 以10为底的对数
math.log2(x) 以2为底的对数
math.log1p(x) 等价于:math.log(x + 1),用于数据平滑
备注:math.expm1(x) 等价于 math.exp(x) - 1,也是math.log1p(x)的逆运算。

2.2 求以任意数为底的对数
math.log(x, n)
其中n为底数

  1. 区别
    为什么有了一个Math库中求对数的方法,还要在Numpy库中内置一模一样的函数?
    原因:
    在math库中,函数的输入x只能为单独一个数。
math.log10(100)
[out]: 2.0

如果输入为一个列表:

math.log10([10, 100])   # 会报错
TypeError: must be real number, not list

在Numpy库中,函数的输入x不仅可以为单独一个数,还可以是一个列表,一个Numpy数组。

np.log10([10, 100])
[out]:
array([1., 2.])
 
np.log10([[10, 100], [1000, 10000]])
[out]:
array([[1., 2.],[3., 4.]])

其结果为Numpy数组。也就是说Numpy中的函数不需要循环就可以实现每个元素的批量处理。

5.train_test_split

是交叉验证中常用的函数,功能是从样本中随机的按比例选取train data和test data,形式为:
X_train,X_test, y_train, y_test = cross_validation.train_test_split(train_data,train_target,test_size=0.4, random_state=0)

参数代表含义:
train_data:所要划分的样本特征集
train_target:所要划分的样本结果
test_size:样本占比,如果是整数的话就是样本的数量
random_state:是随机数的种子。

from sklearn import datasets
import numpy as np
from sklearn.cross_validation import train_test_split

iris = datasets.load_iris() # 加载Iris数据集。
X = iris.data[:, [2, 3]]
y = iris.target # 标签已经转换成012了
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0) # 为了看模型在没有见过数据集上的表现,随机拿出数据集中30%的部分做测试

# 为了追求机器学习和最优化算法的最佳性能,我们将特征缩放
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
sc.fit(X_train) # 估算每个特征的平均值和标准差
sc.mean_ # 查看特征的平均值,由于Iris我们只用了两个特征,结果是array([ 3.82857143,  1.22666667])
sc.scale_ # 查看特征的标准差,结果是array([ 1.79595918,  0.77769705])
X_train_std = sc.transform(X_train)
# 注意:这里我们要用同样的参数来标准化测试集,使得测试集和训练集之间有可比性
X_test_std = sc.transform(X_test)

# 训练感知机模型
from sklearn.linear_model import Perceptron
# n_iter:可以理解成梯度下降中迭代的次数
# eta0:可以理解成梯度下降中的学习率
# random_state:设置随机种子的,为了每次迭代都有相同的训练集顺序
ppn = Perceptron(n_iter=40, eta0=0.1, random_state=0)
ppn.fit(X_train_std, y_train)

# 分类测试集,这将返回一个测试结果的数组
y_pred = ppn.predict(X_test_std)
# 计算模型在测试集上的准确性
accuracy_score(y_test, y_pred)

6.赋空值

对于一般数据,可以直接为其赋值为None

7.读取DataFrame中的某一个元素

https://blog.csdn.net/weixin_41261833/article/details/104158011

8.python 生成特定间隔数列的方法

1.range(开始,结束,间隔)。

值得注意的是:生成数列最后一个数< 结束值。

返回结果类型:list,其中元素是integer类型。
2.numpy.linspace(开始,结束,个数(默认50))

返回结果类型:ndarray,其中元素是float类型

9.Python的 plot函数和绘图参数设置

http://www.mamicode.com/info-detail-2965818.html

你可能感兴趣的:(python,python)