zf.xin

数学建模中数据处理类型题目的主要处理流程与方法

本文首发于zhengfei.xin

文章目录

- 曲线插值与拟合
- - 一维插值
  - - 例题1
  - 二维插值
  - - 例题2
  - 曲线拟合
  - - 多项式拟合
    - 最小二乘拟合
- 数值微分与积分
- - 数值积分
  - 数值微分
  - - 求解常微分方程
    - - 标准形式
      - scipy.integrate.odeint()
    - 求解一阶常微分方程
    - 求解一阶常微分方程组
    - 求解高阶常微分方程组
- 优化问题
- - 线性规划
  - - 基本线性规划
- 运输问题
- 指派问题
- - Scipy指派问题
  - 整数规划
  - - 基本定义
    - 基本分类
    - 基本求解方法
    - - 分支定界法
      - 割平面法
    - 例题
    - - 例题1#
      - 问题定义
        
        模型构建
        
        模型求解
        
        导入PuLP并定义规划问题
        
        定义决策变量
        
        添加目标函数
        
        添加约束条件
        
        求解
  - 数值优化算法
  - - 梯度下降法
    - 牛顿法
    - 拟牛顿法
    - Powel法
    - Nelder-Mead法
    - `scipy.optimize`中的3种限制条件
    - - 边界限制
      - 等于限制
      - 大于限制
  - 组合优化算法
  - - 模拟退火算法
    - - 基本原理
      - 方法
      - 代码
      - 问题假设
        
        问题求解
    - 粒子群算法
    - - 基本思想
    - 遗传算法
    - - 适用问题
      - 基本概念
    - 蚁群算法
- 回归分析
- - 相关基础定义
  - 基于python库`statsmodels`的线性回归
  - - 导包
    - 导入（生成）数据
    - 建模与拟合
    - 拟合和统计结果的输出
- 判别分析
- - 距离判别法
  - - 例题3
  - Fisher判别法
- 曲线插值与拟合
- - 一维插值
  - - 例题1
  - 二维插值
  - - 例题2
  - 曲线拟合
  - - 多项式拟合
    - 最小二乘拟合
- 数值微分与积分
- - 数值积分
  - 数值微分
  - - 求解常微分方程
    - - 标准形式
      - scipy.integrate.odeint()
    - 求解一阶常微分方程
    - 求解一阶常微分方程组
    - 求解高阶常微分方程组
- 优化问题
- - 线性规划
  - - 基本线性规划
- 运输问题
- 指派问题
- - Scipy指派问题
  - 整数规划
  - - 基本定义
    - 基本分类
    - 基本求解方法
    - - 分支定界法
      - 割平面法
    - 例题
    - - 例题1#
      - 问题定义
        
        模型构建
        
        模型求解
        
        导入PuLP并定义规划问题
        
        定义决策变量
        
        添加目标函数
        
        添加约束条件
        
        求解
  - 数值优化算法
  - - 梯度下降法
    - 牛顿法
    - 拟牛顿法
    - Powel法
    - Nelder-Mead法
    - `scipy.optimize`中的3种限制条件
    - - 边界限制
      - 等于限制
      - 大于限制
  - 组合优化算法
  - - 模拟退火算法
    - - 基本原理
      - 方法
      - 代码
      - 问题假设
        
        问题求解
    - 粒子群算法
    - - 基本思想
    - 遗传算法
    - - 适用问题
      - 基本概念
    - 蚁群算法
- 回归分析
- - 相关基础定义
  - 基于python库`statsmodels`的线性回归
  - - 导包
    - 导入（生成）数据
    - 建模与拟合
    - 拟合和统计结果的输出
- 判别分析
- - 距离判别法
  - - 例题3
  - Fisher判别法

报名参加了2021年秋季的华为杯数学建模大赛，以往对这类比赛并无经验，比赛在即，几个月来断断续续看了些东西，故决定做一个简单总结。虽说是总结，但更多的还是使用代码解决各类问题，对各种算法的了解还远远不够。这次比赛目测是难以获奖，之后还有机会，希望能在未来的一年时间中，多抽点时间给数学建模，希望最终能取得一个还不错的成绩。

曲线插值与拟合

插值是离散函数逼近的重要方法，通过插值，可以依据已经得到的点数据来推算未给出的点的数据

一维插值

插值通常选用Python SciPY中的interpolate来实现，其中的interp1d函数即可实现一维插值的功能。

该函数有3个参数，除x、y轴点坐标外，“kind”参数指明了插值的方式，具体如下表。

值	效果
‘zero’,‘nearest’	阶梯插值，即0阶B样条曲线
‘slinear’,‘linear’	线性插值，用一条直线连接所有的取样点，相当于1阶B样条曲线
‘quadraic’,‘cubic’	二阶和三阶B样条曲线，更高阶的曲线可以直接使用整数值指定

样条插值是使用一种名为样条的特殊分段多项式进行插值的形式。由于样条插值可以使用低阶多项式样条实现较小的插值误差，这样就避免了使用高阶多项式所出现的龙格现象，所以样条插值得到了流行

import numpy as np
from scipy import interpolate
import pylab as pl

x = np.linspace(0, 10 * np.pi, 5)
y = np.sin(x)

fc = interpolate.interp1d(x, y, kind="cubic")

xint = np.linspace(x.min(), x.max(), 5)

pl.plot(xint, fc(xint), color="red", label="interpid")
pl.savefig("test.jpg")

插值的结果图如下

例题1

下表给出了待加工零件下轮廓线的一组数据，现需要得到x坐标每改变0.1时所对应的y的坐标

x	y
0	0
3	1.2
5	1.7
7	2.0
9	2.1
11	2.0
12	1.8
13	1.2
14	1.0
15	1.6

解题代码如下:

import numpy as np
import pylab as pl
from scipy import interpolate


x = np.array([0, 3, 5, 7, 9, 11, 12, 13, 14, 15])
y = np.array([0, 1.2, 1.7, 2.0, 2.1, 2.0, 1.8, 1.2, 1.0, 1.6])

fc = interpolate.interp1d(x, y, kind="cubic")

result = np.linspace(x.min(), x.max(), 1000)

print(result)
print(fc(result))

二维插值

二维插值与一维类似，示例代码如下

import numpy as np
from scipy import interpolate
import pylab as pl
import matplotlib as mpl

def func(x, y):
    return (x + y) * np.exp(-5 * (x ** 2 + y **2))

y, x = np.mgrid[-1:1:15j, -1:1:15j]

newFunc = interpolate.interp2d(x, y, func(x, y), kind='cubic')
xNew = np.linspace(-1, 1, 100)
yNew = np.linspace(-1, 1, 100)
fNew = newFunc(xNew, yNew)

pl.imshow(fNew, extent=[-1, 1, -1, 1], cmap=mpl.cm.hot, interpolation="nearest", origin="lower")
pl.savefig("test.jpg")

二维插值结果图如下

例题2

有一个长度为5个单位，宽度为3个单位的金属薄片上测得的15个点的温度数据，求此薄片的温度分布，并绘制等温线图

横为x竖为y	1	2	3	4	5
1	82	81	80	82	84
2	79	63	61	65	87
3	84	84	82	85	86

解题代码如下:

import numpy as np
from scipy import interpolate
import pylab as pl
import matplotlib as mpl


source = np.array(
    [
        [11, 12, 13, 14, 15],
        [21, 22, 23, 24, 25],
        [31, 32, 33, 34, 35]
    ]
)

z = np.array([
        [82, 81, 80, 82, 84],
        [79, 63, 61, 65, 87],
        [84, 84, 82, 85, 86]
    ])

# z = np.loadtxt("./Documents/Blogs/数学建模中数据处理类型题目的主要处理流程与方法/data.01.txt")


x = np.arange(1, 6, 1)
y = np.arange(1, 4, 1)

# linear 1
# cubic 3
# quintic 5
f = interpolate.interp2d(x, y, z, kind="linear")

xn = np.linspace(1, 6, 5000)
yn = np.linspace(1, 4, 3000)
zn = f(xn, yn)

pl.imshow(zn, extent=[1, 5, 1, 3], cmap=mpl.cm.hot, interpolation="nearest", origin="lower")
pl.savefig("test.jpg")

二维插值结果图如下

曲线拟合

拟合指的是对一组数据按其规律方程化。

多项式拟合

多项式拟合是指，给出要拟合的阶数n，拟合出一个n阶多项式

如下代码用于生成数据并绘制原始数据图

import numpy as np
import matplotlib as mpl
from matplotlib import pyplot as plt

# numpy中的两个多项式拟合方法
from numpy import polyfit, poly1d


x = np.linspace(-5, 5, 100)
y = 4 * x + 1.5
noise_y = y + np.random.randn(y.shape[-1]) * 2.5

p = plt.plot(x, noise_y, "rx")
p = plt.plot(x, y, "b:")
plt.savefig("test.1.jpg")

由上图，可以观察到数据点的整体情况，接下来使用如下代码进行拟合操作，并绘制出拟合函数图

# 拟合一阶
coeff = polyfit(x, noise_y, 1)
print(coeff)    # [3.94809446 1.66144869]

p = plt.plot(x, noise_y, 'rx')
p = plt.plot(x, coeff[0] * x + coeff[1], 'k-')
p = plt.plot(x, y, 'b--')

plt.savefig("test.2.jpg")

# 利用参数生成对应函数
f = poly1d(coeff)
# 可以利用此函数生成其他的多项式方程
"""
       2
33.36 x + 23.01 x + 3.844
"""
print(f + 2 * f ** 2)

最小二乘拟合

一般情况下，当使用一个N-1阶的多项式拟合M个点时，存在如下关系：

$X C = Y$

即

$KaTeX parse error: No such environment: equation at position 8: \begin{̲e̲q̲u̲a̲t̲i̲o̲n̲}̲ \left[ …$

数值微分与积分

对于微分和积分计算，除了给出具体的函数表达式进行计算外，还可以给出散列的点来计算，本块内容主要展示了根据散列点进行微积分计算的方式。

数值积分

在SciPy中，提供了scipy.intergrate模块进行积分计算。通过散列的点进行数值积分计算主要有梯形法、复合梯形法、Simpson法、Romberg法。如下将展示复合梯形法与Simpson法的计算过程。

对于样本点间隔随机的情况，通常在梯形法和Simpson法中选择。梯形法和Simpson法分别使用一阶和二阶的Newton-Coates公式进行积分。梯形法将函数近似为相邻点间的直线进行计算，Simpson法将函数近似为3个相邻点之间的抛物线进行计算。对于等距的奇数个样本，如果函数是三阶或更少阶的多项式，Simpson法是准确的。如果样本不等距，则只有当函数是二阶或更少阶才是准确的

如下为使用梯形法、复合梯形法、Simpson法的示例代码。

import numpy as np
from scipy import integrate


def f1(x):
    return x ** 2

x = np.array([1, 3, 4])
y = f1(x)

# Simpson法
result = integrate.simps(y, x)
# 梯形法
result1 = integrate.trapz(y, x)
# 复合梯形法
result2 = integrate.cumtrapz(y, x)
print(result, result1, result2) # 21.0 22.5 22.5

如果一个样本等距，且对于k范围内有 $2^k+1$ 个点，则使用Romberg法将会获得高精度的结果。Romberg基于梯形法，步长与2的幂相关，然后对这些估计值进行Richard外推，以得到更高精度的积分结果。

x = np.linspace(1, 4, 1025)
y = f1(x)

print(x[1] - x[0])
result3 = integrate.romb(y, 0.0029296875)
print(result3)  # 21.0

数值微分

求解常微分方程

标准形式

$\left\{ \begin{array}{lcr} \frac{dy}{dt} = f(y, t) & \\ y(t_0)=y_0 \end{array} \right.$

scipy.integrate.odeint()

主要参数:

func: 导数函数
y0: 初始条件
t: 求解函数值对应的时间点序列

求解一阶常微分方程

$\left\{ \begin{array}{lcr} \frac{dy}{dt} = sin(t^2) & \\ y(-10) = 1 \end{array} \right.$

from scipy.integrate import odeint  # 导入 scipy.integrate 模块
import numpy as np
import matplotlib.pyplot as plt

def dy_dt(y, t):  # 定义函数 f(y,t)
    return np.sin(t**2)

y0 = [1]  # y0 = 1 也可以
t = np.arange(-10,10,0.01)  # (start,stop,step)
y = odeint(dy_dt, y0, t)  # 求解微分方程初值问题

# 绘图
plt.plot(t, y)
plt.show()

求解一阶常微分方程组

$\left\{ \begin{array}{lcr} \frac{dx}{dt} = \sigma(y - x) & \\ \frac{dy}{dt} = x(\rho - z) - y & \\ \frac{dz}{dt} = xy - \beta z \end{array} \right.$

from scipy.integrate import odeint    # 导入 scipy.integrate 模块
import numpy as np
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D

# 导数函数, 求 W=[x,y,z] 点的导数 dW/dt
def lorenz(W,t,p,r,b):
    x, y, z = W  # W=[x,y,z]
    dx_dt = p*(y-x)  # dx/dt = p*(y-x), p: sigma
    dy_dt = x*(r-z) - y  # dy/dt = x*(r-z)-y, r:rho
    dz_dt = x*y - b*z  # dz/dt = x*y - b*z, b;beta
    return np.array([dx_dt,dy_dt,dz_dt])

t = np.arange(0, 30, 0.01)  # 创建时间点 (start,stop,step)
paras = (10.0, 28.0, 3.0)  # 设置 Lorenz 方程中的参数 (p,r,b)

# 调用ode对lorenz进行求解, 用两个不同的初始值 W1、W2 分别求解
W1 = (0.0, 1.00, 0.0)  # 定义初值为 W1
track1 = odeint(lorenz, W1, t, args=(10.0, 28.0, 3.0))  # args 设置导数函数的参数
W2 = (0.0, 1.01, 0.0)  # 定义初值为 W2
track2 = odeint(lorenz, W2, t, args=paras)  # 通过 paras 传递导数函数的参数

# 绘图
fig = plt.figure()
ax = Axes3D(fig)
ax.plot(track1[:,0], track1[:,1], track1[:,2], color='magenta') # 绘制轨迹 1
ax.plot(track2[:,0], track2[:,1], track2[:,2], color='deepskyblue') # 绘制轨迹 2
ax.set_title("Lorenz attractor by scipy.integrate.odeint")
plt.show()

求解高阶常微分方程组

高阶常微分方程，必须做变量替换，化为一阶微分方程组，再用 odeint 求数值解

零输入响应的 RLC 振荡电路可以由如下的二阶微分方程描述：

$\left\{ \begin{array}{lcr} \frac{d^2u}{dt^2} + \frac{R}{L} * \frac{du}{dt} + \frac{1}{LC} * u = 0 & \\ u(0) = U_0 & \\ u'(0) = 0 \end{array} \right.$

令 $\alpha = \frac{R}{2L} \omega_0^2=\frac{1}{LC}$ ，在零输入响应 $u_s=0$ 时，上式可写成：

$\left\{ \begin{array}{lcr} \frac{d^2u}{dt^2} + 2\alpha \frac{du}{dt} + \omega_0^2 * u = 0 & \\ u(0) = U_0 & \\ u'(0) = 0 \end{array} \right.$

对二阶微分方程问题，引入变量 $v=\frac{du}{dt}$ ，通过变量替换就把原方程化为如下的微分方程组：

$\left\{ \begin{array}{lcr} \frac{du}{dt} = v & \\ \frac{dv}{dt} = -2 \alpha v - \omega_0^2 u u(0) = U_0 & \\ v(0) = 0 \end{array} \right.$

from scipy.integrate import odeint  # 导入 scipy.integrate 模块
import numpy as np
import matplotlib.pyplot as plt

# 导数函数，求 Y=[u,v] 点的导数 dY/dt
def deriv(Y, t, a, w):
    u, v = Y  # Y=[u,v]
    dY_dt = [v, -2*a*v-w*w*u]
    return dY_dt

t = np.arange(0, 20, 0.01)  # 创建时间点 (start,stop,step)
# 设置导数函数中的参数 (a, w)
paras1 = (1, 0.6)  # 过阻尼：a^2 - w^2 > 0
paras2 = (1, 1)  # 临界阻尼：a^2 - w^2 = 0
paras3 = (0.3, 1)  # 欠阻尼：a^2 - w^2 < 0

# 调用ode对进行求解, 用两个不同的初始值 W1、W2 分别求解
Y0 = (1.0, 0.0)  # 定义初值为 Y0=[u0,v0]
Y1 = odeint(deriv, Y0, t, args=paras1)  # args 设置导数函数的参数
Y2 = odeint(deriv, Y0, t, args=paras2)  # args 设置导数函数的参数
Y3 = odeint(deriv, Y0, t, args=paras3)  # args 设置导数函数的参数
# W2 = (0.0, 1.01, 0.0)  # 定义初值为 W2
# track2 = odeint(lorenz, W2, t, args=paras)  # 通过 paras 传递导数函数的参数

# 绘图
plt.plot(t, Y1[:, 0], 'r-', label='u1(t)')
plt.plot(t, Y2[:, 0], 'b-', label='u2(t)')
plt.plot(t, Y3[:, 0], 'g-', label='u3(t)')
plt.plot(t, Y1[:, 1], 'r:', label='v1(t)')
plt.plot(t, Y2[:, 1], 'b:', label='v2(t)')
plt.plot(t, Y3[:, 1], 'g:', label='v3(t)')
plt.axis([0, 20, -0.8, 1.2])
plt.legend(loc='best')
plt.title("Second ODE by scipy.integrate.odeint")
plt.show()

附：

结果讨论

RLC串联电路是典型的二阶系统，在零输入条件下根据 α 与 ω 的关系，电路的输出响应存在四种情况：

过阻尼： α2−ω2>0 ，有 2 个不相等的负实数根；
临界阻尼： α2−ω2=0，有 2 个相等的负实数根；
欠阻尼： α2−ω2<0，有一对共轭复数根；
无阻尼：R=0，有一对纯虚根

优化问题

线性规划

基本线性规划

示例问题：基本线性规划

$min: z = 2x_1 + 3x_2 + x_3$

$KaTeX parse error: No such environment: equation at position 8: \begin{̲e̲q̲u̲a̲t̲i̲o̲n̲}̲ \left\{ \b…$

import numpy as np
from scipy import optimize


z = np.array([2, 3, 1])
a = np.array([[1, 4, 2], [3, 2, 0]])
b = np.array([8, 6])

x1_bound = x2_bound = x3_bound = (0, None)
res = optimize.linprog(z, A_ub=-a, b_ub=-b, bounds=(x1_bound, x2_bound, x3_bound))

print(res)

运输问题

某商品有m个产地，n个销地，各产地的产量分别是 $a_1$ , $a_2$ , …… $a_m$ ，若该商品由i产地运到j销地的单位运价为 $c_{ij}$ ，应该如何调运才能使总运费最省？
引入变量 $x_{ij}$ ，其取值为i产地运往j销地的商品数量，数学模型如下
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-13lQtRvx-1632730965032)(https://gitee.com/tremblingv5/my-bed/raw/master/%E6%95%B0%E5%AD%A6%E5%BB%BA%E6%A8%A1%E4%B8%AD%E6%95%B0%E6%8D%AE%E5%A4%84%E7%90%86%E7%B1%BB%E5%9E%8B%E9%A2%98%E7%9B%AE%E7%9A%84%E4%B8%BB%E8%A6%81%E5%A4%84%E7%90%86%E6%B5%81%E7%A8%8B%E4%B8%8E%E6%96%B9%E6%B3%95/%E8%BF%90%E8%BE%93%E9%97%AE%E9%A2%98%E5%9B%BE1.0924.svg)]

示例代码如下

import pulp
import numpy as np
from pprint import pprint

def transportation_problem(costs, x_max, y_max):

    row = len(costs)
    col = len(costs[0])

    prob = pulp.LpProblem('Transportation Problem', sense=pulp.LpMaximize)

    var = [[pulp.LpVariable(f'x{i}{j}', lowBound=0, cat=pulp.LpInteger) for j in range(col)] for i in range(row)]

    flatten = lambda x: [y for l in x for y in flatten(l)] if type(x) is list else [x]

    prob += pulp.lpDot(flatten(var), costs.flatten())

    for i in range(row):
        prob += (pulp.lpSum(var[i]) <= x_max[i])

    for j in range(col):
        prob += (pulp.lpSum([var[i][j] for i in range(row)]) <= y_max[j])

    prob.solve()

    return {'objective':pulp.value(prob.objective), 'var': [[pulp.value(var[i][j]) for j in range(col)] for i in range(row)]}

if __name__ == '__main__':
    costs = np.array([[500, 550, 630, 1000, 800, 700],
                       [800, 700, 600, 950, 900, 930],
                       [1000, 960, 840, 650, 600, 700],
                       [1200, 1040, 980, 860, 880, 780]])

    max_plant = [76, 88, 96, 40]
    max_cultivation = [42, 56, 44, 39, 60, 59]
    res = transportation_problem(costs, max_plant, max_cultivation)

    print(f'最大值为{res["objective"]}')
    print('各变量的取值为：')
    pprint(res['var'])

指派问题

拟分配n人去干n项工作，每个人干且仅干一项工作，若分配第i人去干第j项工作，需要花 $c_{ij}$ 单位时间，问应该如何分配工作才能使工人花费的总时间最少？
假设指派问题的系数矩阵如下
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-zYTj0onj-1632730965034)(https://gitee.com/tremblingv5/my-bed/raw/master/%E6%95%B0%E5%AD%A6%E5%BB%BA%E6%A8%A1%E4%B8%AD%E6%95%B0%E6%8D%AE%E5%A4%84%E7%90%86%E7%B1%BB%E5%9E%8B%E9%A2%98%E7%9B%AE%E7%9A%84%E4%B8%BB%E8%A6%81%E5%A4%84%E7%90%86%E6%B5%81%E7%A8%8B%E4%B8%8E%E6%96%B9%E6%B3%95/%E6%8C%87%E6%B4%BE%E9%97%AE%E9%A2%98%E5%9B%BE1.0924.svg)]
引入变量 $x_{ij}$ ，若分配i干j工作，则 $x_{ij}=1$ 否则 $x_{ij}=0$ ，上述指派问题的数学模型如下
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-YVbs6GFW-1632730965036)(https://gitee.com/tremblingv5/my-bed/raw/master/%E6%95%B0%E5%AD%A6%E5%BB%BA%E6%A8%A1%E4%B8%AD%E6%95%B0%E6%8D%AE%E5%A4%84%E7%90%86%E7%B1%BB%E5%9E%8B%E9%A2%98%E7%9B%AE%E7%9A%84%E4%B8%BB%E8%A6%81%E5%A4%84%E7%90%86%E6%B5%81%E7%A8%8B%E4%B8%8E%E6%96%B9%E6%B3%95/math.0924.svg)]
指派问题的可行解用矩阵表示，每行每列有且仅有一个元素为1，其余元素为0

Scipy指派问题

import numpy as np
# linear_sum_assignment 为指派问题专用库
from scipy.optimize import linear_sum_assignment

"""
定义了开销矩阵（指派问题的系数矩阵）efficiency_matrix，
传入linear_sum_assignment，结果返回的是最优指派的行和列，
例如第一行选择第二列，意为：将第一个人派往第二个工作。
而根据numpy.array的性质，传入行和列就会返回行列所对应的值，
即为输出的第三列
"""

efficiency_matrix = np.array([
    [12,7,9,7,9],
    [8,9,6,6,6],
    [7,17,12,14,12],
    [15,14,6,6,10],
    [4,10,7,10,6]
])

row_index, col_index=linear_sum_assignment(efficiency_matrix)
print(row_index+1)
print(col_index+1)
print(efficiency_matrix[row_index,col_index])

print(efficiency_matrix[row_index, col_index].sum())

整数规划

基本定义

要求一部分值必须使整数的规划问题（线性规划、非线性规划、二次规划）

相比于非整数规划，对非整数规划的解进行四舍五入或者取整，并不能保证结果依然使最优解。

基本分类

完全整数规划：要求全部变量为整数
混合整数规划：要求部分变量为整数
0-1整数规划：要求变量必须使0或1
混合0-1整数规划：要求部分变量必须使0或1

基本求解方法

分支定界法

基本思想：把整数规划转换成一个个线性规划问题，在求解这些线性规划问题时过程中不断趋近原问题的上下界

分支：全部可行解空间反复地分割为越来越小地子集

定界：对每个子集计算一个目标上界

设有最大化的整数规划问题 A，先解与之相应的线性规划问题 B，若 B 的最优解不符合 A 的整数条件，则 B 的最优目标函数必是 A 的最优目标函数 z 的上界，记为 z2，而 A 的任意可行解的目标函数值将是 z 的一个下界 z1。分支定界法就是将 B 的可行域分成子区域（分支）的方法，逐步减小 z2 和增大 z1，最终求到 z*

分支定界法是一个迭代算法，随着迭代过程不断更新上界和下界，直到上界和下界非常接近时结束。通常设置 Gap < 0.1%，就可把当前的最优可行解近似为问题的全局最优解了。因此，分支定界法的“收敛” 不是分析意义上的而是算法意义上的，优化结果是近似解而不是精确解。

分支定界法不用区分完全整数规划与混合整数规划，算法便于实现，但计算量比较大

割平面法

基本思路：先求普通线性规划问题地最优解，再对非整数解添加约束条件使可行或缩小，如此反复求解直到得到整数解

不考虑整数约束条件，直接求松弛问题地最优解，在此基础上再添加新地约束条件。

割平面法的计算量比较小，但对问题的结构及求解的要求较高，算法比较复杂。

例题

例题1#

某厂生产甲乙两种饮料，每百箱甲饮料需用原料 6千克、工人 10名，获利 10万元；每百箱乙饮料需用原料 5千克、工人 20名，获利 9万元。
今工厂共有原料 60千克、工人 150名，又由于其他条件所限甲饮料产量不超过8百箱。
问题 1：问如何安排生产计划，即两种饮料各生产多少使获利最大？
问题 2：若投资0.8万元可增加原料1千克，是否应作这项投资？投资多少合理？
问题 3：若不允许散箱（按整百箱生产），如何安排生产计划，即两种饮料各生产多少使获利最大？
问题 4：若不允许散箱（按整百箱生产），若投资0.8万元可增加原料1千克，是否应作这项投资？投资多少合理？

规划类问题：问题定义、模型构建、模型求解

问题定义

问题定义，确定决策变量、目标函数和约束条件。

决策变量是问题中可以在一定范围内进行变化而获得不同结果的变量。

对于问题 1，问题描述中说的很明确，希望通过改变甲、乙两种饮料的产量使总利润最大，甲、乙两种饮料的产量就是决策变量。

对于问题 2 则要注意，如果只看前一句，就是比较问题 1 与问题 2 的利润，还是把甲、乙两种饮料的产量作为决策变量。但要回答后一句“投资多少合理”，这就出现了一个新的变量“投资额”，因此对问题 2 要建立 3个决策变量：甲产量、乙产量和投资额。

目标函数是决策变量的函数，我们希望通过改变决策变量的值而获得目标函数的最大值或最小值，通常是总成本（最小）、总利润（最大）、总时间（最短）。

对于本案例，每个问题都是希望获得最大利润，目标函数都是总利润，问题是求目标函数即总利润的最大值。

约束条件是决策变量所要满足的限制条件。

约束条件 3 种情况：
一是不等式约束，例如题目指出共有原料 60千克、工人 150名，因此生产计划所用的原料、工人的需求不能大于题目中数值。
二是等式约束，本题没有等式约束条件。
三是决策变量取值范围的约束。
通常，题目隐含着决策变量大于等于 0 的条件，例如工人人数、原料数量都要大于等于 0。
另外，如果能通过分析前面的等式约束或不等式约束，得出决策变量的上限，将会极大的提高问题求解的速度和性能。后文将对此举例说明。

模型构建

模型构建，由问题描述建立数学方程，并转化为标准形式的数学模型。

对于问题 1，目标函数是生产甲、乙两种饮料的总利润，约束条件是原料总量、工人总数的约束，而且原料、工人都要大于等于 0。

maxf(x)=10∗x1+9∗x2s.t.:⎧⎩⎨⎪⎪⎪⎪6∗x1+5∗x2≤6010∗x1+20∗x2≤1500≤x1≤8x2≥0
进一步分析决策变量取值范围的约束条件，由原料数量、工人数量的不等式约束可以推出：

x1≤15x2≤7.5
对于问题 2，可以通过增加投资来获得更多的原料，投资额是一个新的变量。要注意的是，此时目标函数虽然也是生产两种饮料的总利润，但总利润不等于总收入，而是总收入减去总成本，在本例中就是要减去购买原料的投资。

maxf(x)=10∗x1+9∗x2−x3s.t.:⎧⎩⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪6∗x1+5∗x2≤60+x3/0.810∗x1+20∗x2≤1500≤x1≤150≤x2≤7.5x3≥0
对于问题 3 和问题 4，区别只是不允许散箱，明确提出了决策变量 x1、x2 的取值要取整数值，所以是整数规划问题。
需要注意的是，问题 4 中对增加的投资额即购买的原料数量并没有整数限制，因此 x1、x2 的取值范围是正整数，但 x3 的取值范围是正数，这是一个混合整数规划问题。
还要说明的是，对于问题 1 和问题 2，虽然题目中没有明确要求生产甲、乙饮料的工人人数为整数，但是人数也不可能是小数的，那么这是不是也是整数规划问题呢？
如果你能提出这个问题，那么恭喜你，你已经从小白升级为菜鸟了。
我的理解是，这个问题怎么说都可以。如果要简化问题，使用线性规划模型，最好在问题假设中说一句，假设甲乙饮料在同一车间先后生产，只要允许甲乙饮料散箱生产，即使根据产量所求出的工人数是小数，也可以解释的通。如果你掌握了整数规划问题的求解，那就先按线性规划建模，再补充讨论工人人数也必须是整数的条件，按整数规划建模求解，这就是妥妥的获奖论文了。

模型求解

python pulp求解步骤

导入PuLP并定义规划问题

import pulp
# 定义问题，求最大值
ProbLP1 = pulp.LpProblem("ProbLP1", sense=pulp.LpMaximize)

定义决策变量

问题1

# 定义x1
x1 = pulp.LpVariable('x1', lowBound=0, upBound=15, cat='Continuous')
# 定义x2
x2 = pulp.LpVariable('x2', lowBound=0, upBound=7.5, cat='Continuous')

pulp.LpVariable定义决策变量
lowBound, upBound 决策变量上下界
cat定义变量类型，连续变量：Continuous，离散变量：Integer，0/1变量：Binary

问题3

x1 = pulp.LpVariable('x1', lowBound=0, upBound=15, cat='Integer')
x2 = pulp.LpVariable('x2', lowBound=0, upBound=7.5, cat='Integer')

添加目标函数

ProbLP1 += (10*x1 + 9*x2)  # 设置目标函数 f(x)

添加约束条件

# 不等式约束
ProbLP1 += (6*x1 + 5*x2 <= 60)
# 不等式约束
ProbLP1 += (10*x1 + 20*x2 <= 150)

求解

ProbLP1.solve()

# 输出求解状态
print(ProbLP1.name)  
print("Status:", pulp.LpStatus[ProbLP1.status])

for v in ProbLP1.variables():
    # 输出每个变量的最优值
    print(v.name, "=", v.varValue)  

# 输出最优解的目标函数值
print("F1(x) =", pulp.value(ProbLP1.objective))

数值优化算法

数值优化算法是寻找一个函数最优解的问题，这个函数被成为目标函数，通常使用scipy.optimize进行优化

梯度下降法

梯度下降法通常是沿着梯度下降的方向寻找最优解，但是对于一些复杂函数，梯度下降法不一定可以找到最优解。

在scipy中，带有梯度下降的方法名通常包含cg，其中简单梯度下降方法的函数名为scipy.optimize.fmin_cg()

from scipy import optimize

def f(x):
    return 0.5 * (1 - x[0]) ** 2 + (x[1] - 7) ** 2
    
optimize.fmin_cg(f,[0,0])

另，可以设置梯度，设置梯度有助于提升算法性能

def fprime(x):
    return np.array((-2 * .5 * (1 - x[0]), 2 * (x[1] - 7)))
optimize.fmin_cg(f, [0, 0], fprime=fprime)

牛顿法

牛顿法在现有极小点估计值的附近对目标函数做二阶展开，进而找到极小点的下一个估计值。

def f(x):
    return 0.5 * (1 - x[0]) ** 2 + (x[1] - 7) ** 2

# 一阶导
def fprime(x):
    return np.array((-2 *.5 * (1 - x[0]), 2 * (x[1] - 7)))

# 二阶导
def hessian(x):
    return np.array(-2 *.5 *x[0], 2 * x[1])

# 最少需要传入一阶导
optimize.fmin_ncg(f, [200,800], fprime=fprime)
optimize.fmin_ncg(f, [200,800], fprime=fprime, fhess=hessian)

拟牛顿法

改进了每一步对Hessian的近似。在一些正常的函数中，BFGS 虽然不如牛顿法快，但是还是比较快的。而且对于一些情况复杂的函数，BFGS 要比牛顿法好，因为它对 Hessian 进行了改进

def f(x):
    return 0.5 * (1 - x[0]) ** 2 + (x[1] - 7) ** 2

# 一阶导
def fprime(x):
    return np.array((-2 *.5 * (1 - x[0]), 2 * (x[1] - 7)))

optimize.fmin_bfgs(f, [200, 800], fprime=fprime)

Powel法

类似梯度下降法

def f(x):
    return 0.5*(1 - x[0])**2 + (x[1] - 7)**2

# 一阶导
def fprime(x):
    return np.array((-2*.5*(1 - x[0]), 2*(x[1] - 7)))
optimize.fmin_powell(f,[0,0])

Nelder-Mead法

对噪音有很好的抵抗性，不依赖于梯度，可以在局部光滑的函数上发挥作用；在光滑、非噪音函数上比梯度法更慢

def f(x):
    return 0.5*(1 - x[0])**2 + (x[1] - 7)**2

# 一阶导
def fprime(x):
    return np.array((-2*.5*(1 - x[0]), 2*(x[1] - 7)))
optimize.fmin(f, [2, 2])

`scipy.optimize`中的3种限制条件

边界限制

在指定边界内寻找最优解

def f(x):
    return 0.5*(1 - x[0])**2 + (x[1] - 7)**2
# 一阶求导
def fprime(x):
    return np.array((-2*.5*(1 - x[0]), 2*(x[1] - 7)))
# 这里限制了 x[0] 的取值在(1,2), x[1] 的取值在(9,19)
optimize.fmin_l_bfgs_b(f, [0,0], approx_grad=1, bounds=((1,2),(9,19)))

等于限制

def f(x):
    return np.sqrt((x[0] - 3)**2 + (x[1] - 2)**2)
# 自定义限制条件
def constraint(x):
    return x[0]+x[1] - 4
#   eqcons == 0.0 
optimize.fmin_slsqp(f, np.array([0, 0]), eqcons=[constraint,])

大于限制

def f(x):
    return np.sqrt((x[0] - 3)**2 + (x[1] - 2)**2)
# 自定义限制条件
def constraint(x):
    return x[0]+x[1] - 4
#   eqcons == 0.0 
optimize.fmin_slsqp(f, np.array([0, 0]), eqcons=[constraint,])

组合优化算法

组合优化算法是一组求离散状态数据集最优解的算法，这些算法常常用来解决NP-Hard级问题。后续组合优化算法均使用python库：scikit-opt来调用。

模拟退火算法

基本原理

模拟退火算法是一种贪心算法，通过模拟淬火降温过程，以一定的概率接受一个比当前解要差的解，从而跳出局部最优解，通过多次迭代计算，从而不断趋近于最优解。

模拟退火算法是一种随机算法，并不能保证得到最优解，可以以较高的效率获取到近似最优解。

方法

确定目标函数
给定初始值
设置参数
代码求解

代码

问题假设

求函数 f(x) = x ^ 2 - 2 * x + 1的最小值

问题求解

设置目标函数

func = lambda x: x[0] ** 2 - x[0] * 2 + 1

调用库函数

"""
初始值设置为50
停止上限为100
停止下限为1e-9
"""
sa = SA(func=func, x0=[50], T_max=100, T_min=1e-9, max_stay_counter=150)

执行并获取结果

best_x, best_y = sa.run()

print(best_x, best_y)

plt.plot(pd.DataFrame(sa.best_y_history).cummin(axis=0))
plt.savefig("test.jpg")

[0.99999992] 5.773159728050814e-15

粒子群算法

粒子群算法是一种进化算法，源于对鸟类捕食的研究，通过群体中个体之间的协作和信息共享来寻找最优解

优势：简单易实现，不需要调节过多参数

基本思想

一个“粒子”只具有两个属性，速度和位置。

每个粒子在空间中单独的寻找最优解，并记录为单个粒子的极值，同时将这个局部最优解和其他粒子共享，每个粒子再通过共享的局部最优解来调整自身的速度和位置，从而使整个粒子群不断趋近最优解

示例代码如下，与模拟退火算法类似，主要流程即定义问题，然后调用库中的算法进行解题：

from sko.PSO import PSO

import matplotlib.pyplot as plt

def target(x):
    x1, x2, x3 = x
    return x1 ** 2 + (x2 - 0.05) ** 2 + x3 ** 2

pso = PSO(
    func=target,
    n_dim=3,
    max_iter=150,
    lb=[0, -1,  0.5],
    ub=[1, 1, 1],
    c1=0.5,
    c2=0.5
)
x, y = pso.run()

print(f"x: {x}, y: {y}")

遗传算法

遗传算法的抽象理解：给定一个初始解，经过一系列的变化（遗传、变异、交叉、复制），最终进化出最优解决。

适用问题

与模拟退火算法使用场景类似，都适用于解决np-hard问题，从随机中不断趋近最优解

基本概念

染色体
问题的一个可行解
基因
一个可行解由多个元素构成，一个元素成为一个基因
适应度函数
适应度函数起“筛选”的作用，将非最优解给筛去
交叉
从上一代中选择两条染色体，在某一点截断并进行组合
变异
随机更改基因
复制
保留优质染色体

示例代码如下：

import pandas as pd
import matplotlib.pyplot as plt
from sko.GA import GA

def schaffer(p):
    x1, x2 = p
    x = np.square(x1) + np.square(x2)
    return 0.5 + (np.square(np.sin(x)) - 0.5) / np.square(1 + 0.001 * x)

ga = GA(
    func=schaffer,
    n_dim=2,
    size_pop=50,
    max_iter=800,
    prob_mut=0.001,
    lb=[-1, -1],
    ub=[1, 1],
    precision=1e-7
)

x, y = ga.run()
print(f"x: {x}, y: {y}")

蚁群算法

蚁群算法是一种用来寻找优化路径的概率型算法。它由Marco Dorigo于1992年在他的博士论文中提出，其灵感来源于蚂蚁在寻找食物过程中发现路径的行为。

示例代码如下:

from sko.ACA import ACA_TSP
from scipy import spatial
import numpy as np

points_coordinate = np.random.rand(50, 2)
distance_matrix = spatial.distance.cdist(points_coordinate, points_coordinate, metric='euclidean')

def cal_total_distance(routine):
    num_points, = routine.shape
    return sum([distance_matrix[routine[i % num_points], routine[(i + 1) % num_points]] for i in range(num_points)])


aca = ACA_TSP(func=cal_total_distance, n_dim=50,
              size_pop=50, max_iter=200,
              distance_matrix=distance_matrix)

best_x, best_y = aca.run()

print(best_x, best_y)

回归分析

基于python库`statsmodels`的线性回归

导包

import statsmodels.api as sm
from statsmodels.sandbox.regression.predstd import wls_prediction_std

导入（生成）数据

nSample = 100
# 起点为 0，终点为 10，均分为 nSample个点
x1 = np.linspace(0, 10, nSample) 
# 正态分布随机数
e = np.random.normal(size=len(x1)) 
# y = b0 + b1*x1
yTrue = 2.36 + 1.58 * x1 
# 产生模型数据
yTest = yTrue + e

本案例是一元线性回归问题，(yTest，x)是导入的样本数据，我们需要通过线性回归获得因变量 y 与自变量 x 之间的定量关系。yTrue 是理想模型的数值，yTest 模拟实验检测的数据，在理想模型上加入了正态分布的随机误差

建模与拟合

一元线性回归模型方程为

y = β0 + β1 * x + e

先通过 sm.add_constant() 向矩阵 X 添加截距列后，再用 sm.OLS() 建立普通最小二乘模型，最后用 model.fit() 就能实现线性回归模型的拟合，并返回拟合与统计分析的结果摘要。

X = sm.add_constant(x1) # 向 x1 左侧添加截距列 x0=[1,...1]
model = sm.OLS(yTest, X) # 建立最小二乘模型（OLS）
results = model.fit() # 返回模型拟合结果

statsmodels.OLS 是 statsmodels.regression.linear_model 的函数，有 4个参数 (endog, exog, missing, hasconst)。
第一个参数 endog 是回归模型中的因变量 y(t), 是1-d array 数据类型。
第二个输入 exog 是自变量 x0(t),x1(t),…,xm(t)，是(m+1)-d array 数据类型。
需要注意的是，statsmodels.OLS 的回归模型没有常数项，其形式为：
y = BX + e = β0x0 + β1*x1 + e, x0 = [1,…1]
而之前导入的数据 (yTest，x1) 并不包含 x0，因此需要在 x1 左侧增加一列截距列 x0=[1,…1]，将自变量矩阵转换为 X = (x0, x1)。函数 sm.add_constant() 实现的就是这个功能。
参数 missing 用于数据检查, hasconst 用于检查常量，一般情况不需要。

拟合和统计结果的输出

print(results.summary()) # 输出回归分析的摘要

coef：回归系数（Regression coefficient），即模型参数 β0、β1、…的估计值。
std err ：标准差（ Standard deviation），也称标准偏差，是方差的算术平方根，反映样本数据值与回归模型估计值之间的平均差异程度。标准差越大，回归系数越不可靠。
t：t 统计量（t-Statistic），等于回归系数除以标准差，用于对每个回归系数分别进行检验，检验每个自变量对因变量的影响是否显著。如果某个自变量 xi的影响不显著，意味着可以从模型中剔除这个自变量。
P>|t|：t检验的 P值（Prob(t-Statistic)），反映每个自变量 xi 与因变量 y 的相关性假设的显著性。如果 p<0.05，可以理解为在0.05的显著性水平下变量xi与y存在回归关系，具有显著性。
[0.025,0.975]：回归系数的置信区间（Confidence interval）的下限、上限，某个回归系数的置信区间以 95%的置信度包含该回归系数。注意并不是指样本数据落在这一区间的概率为 95%。

此外，还有一些重要的指标需要关注：

R-squared：R方判定系数（Coefficient of determination），表示所有自变量对因变量的联合的影响程度，用于度量回归方程拟合度的好坏，越接近于 1说明拟合程度越好。
F-statistic：F 统计量（F-Statistic），用于对整体回归方程进行显著性检验，检验所有自变量在整体上对因变量的影响是否显著。

Statsmodels 也可以通过属性获取所需的回归分析的数据，例如：

print("OLS model: Y = b0 + b1 * x") # b0: 回归直线的截距，b1: 回归直线的斜率
print('Parameters: ', results.params) # 输出：拟合模型的系数
yFit = results.fittedvalues # 拟合模型计算出的 y值
ax.plot(x1, yTest, 'o', label="data") # 原始数据
ax.plot(x1, yFit, 'r-', label="OLS") # 拟合数据

判别分析

判别分析是一种分类方法，根据已掌握的每个类别的若干个样本信息，求出判别函数，再根据判别函数判别未知类别的样本点的类别。

距离判别法

距离判别法为根据待判定对象的距离，以就近原则进行判别。这里的距离通常采用Mahalanobis距离（马氏距离）

例题3

蠓虫是一种昆虫，分为很多类型，其中有一种名为Af，是能传播花粉的益虫；另一种名为Apf，是会传播疾病的害虫。这两种蠓虫在形态上十分相似，难以区分。现测得9只Af和6只Apf的触角长度和翅膀长度数据如下：

Af：

触角长度	翅膀长度
1.24	1.27
1.36	1.74
1.38	1.64
1.38	1.82
1.38	1.90
1.40	1.70
1.48	1.82
1.54	1.82
1.56	2.08

Apf:

触角长度	翅膀长度}
1.14	1.78
1.18	1.96
1.20	1.86
1.26	2.00
1.28	2.00
1.30	1.96

若两类蠓虫协方差矩阵相同，试判别如下3只蠓虫属于哪一类

触角长度	翅膀长度}
1.24	1.80
1.28	1.84
1.40	2.04

示例代码如下:

import numpy as np
from sklearn.neighbors import KNeighborsClassifier

X0 = np.array(
    [
        [1.24, 1.27],
        [1.36, 1.74],
        [1.38, 1.90],
        [1.38, 1.82],
        [1.38, 1.90],
        [1.40, 1.70],
        [1.48, 1.82],
        [1.54, 1.82],
        [1.56, 2.08],
        [1.14, 1.78],
        [1.18, 1.96],
        [1.20, 1.86],
        [1.26, 2.00],
        [1.28, 2.00],
        [1.30, 1.96]
    ]
)

x = np.array(
    [
        [1.24, 1.80],
        [1.28, 1.84],
        [1.40, 2.04]
    ]
)

g = np.hstack(
    [
        np.ones(9),
        2 * np.ones(6)
    ]
)

v = np.cov(X0.T)
knn = KNeighborsClassifier(2, metric='mahalanobis', metric_params={'V': v})
knn.fit(X0,g)
pre = knn.predict(x)
print("马氏距离：", pre)
print("马氏距离已知样本误判率：", 1 - knn.score(X0, g))
knn2 = KNeighborsClassifier(2)
knn2.fit(X0,g)
pre2 = knn2.predict(x)
print("欧式距离", pre2)
print("欧氏距离误判率", 1 - knn2.score(X0,g))

输出结果如下:

马氏距离： [2. 2. 1.]
马氏距离已知样本误判率： 0.0
欧式距离 [2. 1. 2.]
欧氏距离误判率 0.0

Fisher判别法

Fisher判别法是基于方差分析的判别法

示例代码如下：

import numpy as np
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis as LDA
from sklearn.neighbors import KNeighborsClassifier

X0 = np.array(
    [
        [1.24, 1.27],
        [1.36, 1.74],
        [1.38, 1.90],
        [1.38, 1.82],
        [1.38, 1.90],
        [1.40, 1.70],
        [1.48, 1.82],
        [1.54, 1.82],
        [1.56, 2.08],
        [1.14, 1.78],
        [1.18, 1.96],
        [1.20, 1.86],
        [1.26, 2.00],
        [1.28, 2.00],
        [1.30, 1.96]
    ]
)

x = np.array(
    [
        [1.24, 1.80],
        [1.28, 1.84],
        [1.40, 2.04]
    ]
)

g = np.hstack(
    [
        np.ones(9),
        2 * np.ones(6)
    ]
)

clf = LDA()
clf.fit(X0,g)
print("判别结果为", clf.predict(x))
print("已知样本的误判率为：", 1 - clf.score(X0,g))

结果如下:

判别结果为 [2. 2. 1.]
已知样本的误判率为： 0.0

文章目录

- 曲线插值与拟合
- - 一维插值
  - - 例题1
  - 二维插值
  - - 例题2
  - 曲线拟合
  - - 多项式拟合
    - 最小二乘拟合
- 数值微分与积分
- - 数值积分
  - 数值微分
  - - 求解常微分方程
    - - 标准形式
      - scipy.integrate.odeint()
    - 求解一阶常微分方程
    - 求解一阶常微分方程组
    - 求解高阶常微分方程组
- 优化问题
- - 线性规划
  - - 基本线性规划
- 运输问题
- 指派问题
- - Scipy指派问题
  - 整数规划
  - - 基本定义
    - 基本分类
    - 基本求解方法
    - - 分支定界法
      - 割平面法
    - 例题
    - - 例题1#
      - 问题定义
        
        模型构建
        
        模型求解
        
        导入PuLP并定义规划问题
        
        定义决策变量
        
        添加目标函数
        
        添加约束条件
        
        求解
  - 数值优化算法
  - - 梯度下降法
    - 牛顿法
    - 拟牛顿法
    - Powel法
    - Nelder-Mead法
    - `scipy.optimize`中的3种限制条件
    - - 边界限制
      - 等于限制
      - 大于限制
  - 组合优化算法
  - - 模拟退火算法
    - - 基本原理
      - 方法
      - 代码
      - 问题假设
        
        问题求解
    - 粒子群算法
    - - 基本思想
    - 遗传算法
    - - 适用问题
      - 基本概念
    - 蚁群算法
- 回归分析
- - 相关基础定义
  - 基于python库`statsmodels`的线性回归
  - - 导包
    - 导入（生成）数据
    - 建模与拟合
    - 拟合和统计结果的输出
- 判别分析
- - 距离判别法
  - - 例题3
  - Fisher判别法
- 曲线插值与拟合
- - 一维插值
  - - 例题1
  - 二维插值
  - - 例题2
  - 曲线拟合
  - - 多项式拟合
    - 最小二乘拟合
- 数值微分与积分
- - 数值积分
  - 数值微分
  - - 求解常微分方程
    - - 标准形式
      - scipy.integrate.odeint()
    - 求解一阶常微分方程
    - 求解一阶常微分方程组
    - 求解高阶常微分方程组
- 优化问题
- - 线性规划
  - - 基本线性规划
- 运输问题
- 指派问题
- - Scipy指派问题
  - 整数规划
  - - 基本定义
    - 基本分类
    - 基本求解方法
    - - 分支定界法
      - 割平面法
    - 例题
    - - 例题1#
      - 问题定义
        
        模型构建
        
        模型求解
        
        导入PuLP并定义规划问题
        
        定义决策变量
        
        添加目标函数
        
        添加约束条件
        
        求解
  - 数值优化算法
  - - 梯度下降法
    - 牛顿法
    - 拟牛顿法
    - Powel法
    - Nelder-Mead法
    - `scipy.optimize`中的3种限制条件
    - - 边界限制
      - 等于限制
      - 大于限制
  - 组合优化算法
  - - 模拟退火算法
    - - 基本原理
      - 方法
      - 代码
      - 问题假设
        
        问题求解
    - 粒子群算法
    - - 基本思想
    - 遗传算法
    - - 适用问题
      - 基本概念
    - 蚁群算法
- 回归分析
- - 相关基础定义
  - 基于python库`statsmodels`的线性回归
  - - 导包
    - 导入（生成）数据
    - 建模与拟合
    - 拟合和统计结果的输出
- 判别分析
- - 距离判别法
  - - 例题3
  - Fisher判别法

报名参加了2021年秋季的华为杯数学建模大赛，以往对这类比赛并无经验，比赛在即，几个月来断断续续看了些东西，故决定做一个简单总结。虽说是总结，但更多的还是使用代码解决各类问题，对各种算法的了解还远远不够。这次比赛目测是难以获奖，之后还有机会，希望能在未来的一年时间中，多抽点时间给数学建模，希望最终能取得一个还不错的成绩。

曲线插值与拟合

插值是离散函数逼近的重要方法，通过插值，可以依据已经得到的点数据来推算未给出的点的数据

一维插值

插值通常选用Python SciPY中的interpolate来实现，其中的interp1d函数即可实现一维插值的功能。

该函数有3个参数，除x、y轴点坐标外，“kind”参数指明了插值的方式，具体如下表。

值	效果
‘zero’,‘nearest’	阶梯插值，即0阶B样条曲线
‘slinear’,‘linear’	线性插值，用一条直线连接所有的取样点，相当于1阶B样条曲线
‘quadraic’,‘cubic’	二阶和三阶B样条曲线，更高阶的曲线可以直接使用整数值指定

样条插值是使用一种名为样条的特殊分段多项式进行插值的形式。由于样条插值可以使用低阶多项式样条实现较小的插值误差，这样就避免了使用高阶多项式所出现的龙格现象，所以样条插值得到了流行

import numpy as np
from scipy import interpolate
import pylab as pl

x = np.linspace(0, 10 * np.pi, 5)
y = np.sin(x)

fc = interpolate.interp1d(x, y, kind="cubic")

xint = np.linspace(x.min(), x.max(), 5)

pl.plot(xint, fc(xint), color="red", label="interpid")
pl.savefig("test.jpg")

插值的结果图如下

例题1

下表给出了待加工零件下轮廓线的一组数据，现需要得到x坐标每改变0.1时所对应的y的坐标

x	y
0	0
3	1.2
5	1.7
7	2.0
9	2.1
11	2.0
12	1.8
13	1.2
14	1.0
15	1.6

解题代码如下:

import numpy as np
import pylab as pl
from scipy import interpolate


x = np.array([0, 3, 5, 7, 9, 11, 12, 13, 14, 15])
y = np.array([0, 1.2, 1.7, 2.0, 2.1, 2.0, 1.8, 1.2, 1.0, 1.6])

fc = interpolate.interp1d(x, y, kind="cubic")

result = np.linspace(x.min(), x.max(), 1000)

print(result)
print(fc(result))

二维插值

二维插值与一维类似，示例代码如下

import numpy as np
from scipy import interpolate
import pylab as pl
import matplotlib as mpl

def func(x, y):
    return (x + y) * np.exp(-5 * (x ** 2 + y **2))

y, x = np.mgrid[-1:1:15j, -1:1:15j]

newFunc = interpolate.interp2d(x, y, func(x, y), kind='cubic')
xNew = np.linspace(-1, 1, 100)
yNew = np.linspace(-1, 1, 100)
fNew = newFunc(xNew, yNew)

pl.imshow(fNew, extent=[-1, 1, -1, 1], cmap=mpl.cm.hot, interpolation="nearest", origin="lower")
pl.savefig("test.jpg")

二维插值结果图如下

例题2

有一个长度为5个单位，宽度为3个单位的金属薄片上测得的15个点的温度数据，求此薄片的温度分布，并绘制等温线图

横为x竖为y	1	2	3	4	5
1	82	81	80	82	84
2	79	63	61	65	87
3	84	84	82	85	86

解题代码如下:

import numpy as np
from scipy import interpolate
import pylab as pl
import matplotlib as mpl


source = np.array(
    [
        [11, 12, 13, 14, 15],
        [21, 22, 23, 24, 25],
        [31, 32, 33, 34, 35]
    ]
)

z = np.array([
        [82, 81, 80, 82, 84],
        [79, 63, 61, 65, 87],
        [84, 84, 82, 85, 86]
    ])

# z = np.loadtxt("./Documents/Blogs/数学建模中数据处理类型题目的主要处理流程与方法/data.01.txt")


x = np.arange(1, 6, 1)
y = np.arange(1, 4, 1)

# linear 1
# cubic 3
# quintic 5
f = interpolate.interp2d(x, y, z, kind="linear")

xn = np.linspace(1, 6, 5000)
yn = np.linspace(1, 4, 3000)
zn = f(xn, yn)

pl.imshow(zn, extent=[1, 5, 1, 3], cmap=mpl.cm.hot, interpolation="nearest", origin="lower")
pl.savefig("test.jpg")

二维插值结果图如下

曲线拟合

拟合指的是对一组数据按其规律方程化。

多项式拟合

多项式拟合是指，给出要拟合的阶数n，拟合出一个n阶多项式

如下代码用于生成数据并绘制原始数据图

import numpy as np
import matplotlib as mpl
from matplotlib import pyplot as plt

# numpy中的两个多项式拟合方法
from numpy import polyfit, poly1d


x = np.linspace(-5, 5, 100)
y = 4 * x + 1.5
noise_y = y + np.random.randn(y.shape[-1]) * 2.5

p = plt.plot(x, noise_y, "rx")
p = plt.plot(x, y, "b:")
plt.savefig("test.1.jpg")

由上图，可以观察到数据点的整体情况，接下来使用如下代码进行拟合操作，并绘制出拟合函数图

# 拟合一阶
coeff = polyfit(x, noise_y, 1)
print(coeff)    # [3.94809446 1.66144869]

p = plt.plot(x, noise_y, 'rx')
p = plt.plot(x, coeff[0] * x + coeff[1], 'k-')
p = plt.plot(x, y, 'b--')

plt.savefig("test.2.jpg")

# 利用参数生成对应函数
f = poly1d(coeff)
# 可以利用此函数生成其他的多项式方程
"""
       2
33.36 x + 23.01 x + 3.844
"""
print(f + 2 * f ** 2)

最小二乘拟合

一般情况下，当使用一个N-1阶的多项式拟合M个点时，存在如下关系：

$X C = Y$

即

$KaTeX parse error: No such environment: equation at position 8: \begin{̲e̲q̲u̲a̲t̲i̲o̲n̲}̲ \left[ …$

数值微分与积分

对于微分和积分计算，除了给出具体的函数表达式进行计算外，还可以给出散列的点来计算，本块内容主要展示了根据散列点进行微积分计算的方式。

数值积分

如下为使用梯形法、复合梯形法、Simpson法的示例代码。

import numpy as np
from scipy import integrate


def f1(x):
    return x ** 2

x = np.array([1, 3, 4])
y = f1(x)

# Simpson法
result = integrate.simps(y, x)
# 梯形法
result1 = integrate.trapz(y, x)
# 复合梯形法
result2 = integrate.cumtrapz(y, x)
print(result, result1, result2) # 21.0 22.5 22.5

x = np.linspace(1, 4, 1025)
y = f1(x)

print(x[1] - x[0])
result3 = integrate.romb(y, 0.0029296875)
print(result3)  # 21.0

数值微分

求解常微分方程

标准形式

$\left\{ \begin{array}{lcr} \frac{dy}{dt} = f(y, t) & \\ y(t_0)=y_0 \end{array} \right.$

scipy.integrate.odeint()

主要参数:

func: 导数函数
y0: 初始条件
t: 求解函数值对应的时间点序列

求解一阶常微分方程

$\left\{ \begin{array}{lcr} \frac{dy}{dt} = sin(t^2) & \\ y(-10) = 1 \end{array} \right.$

from scipy.integrate import odeint  # 导入 scipy.integrate 模块
import numpy as np
import matplotlib.pyplot as plt

def dy_dt(y, t):  # 定义函数 f(y,t)
    return np.sin(t**2)

y0 = [1]  # y0 = 1 也可以
t = np.arange(-10,10,0.01)  # (start,stop,step)
y = odeint(dy_dt, y0, t)  # 求解微分方程初值问题

# 绘图
plt.plot(t, y)
plt.show()

求解一阶常微分方程组

$\left\{ \begin{array}{lcr} \frac{dx}{dt} = \sigma(y - x) & \\ \frac{dy}{dt} = x(\rho - z) - y & \\ \frac{dz}{dt} = xy - \beta z \end{array} \right.$

from scipy.integrate import odeint    # 导入 scipy.integrate 模块
import numpy as np
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D

# 导数函数, 求 W=[x,y,z] 点的导数 dW/dt
def lorenz(W,t,p,r,b):
    x, y, z = W  # W=[x,y,z]
    dx_dt = p*(y-x)  # dx/dt = p*(y-x), p: sigma
    dy_dt = x*(r-z) - y  # dy/dt = x*(r-z)-y, r:rho
    dz_dt = x*y - b*z  # dz/dt = x*y - b*z, b;beta
    return np.array([dx_dt,dy_dt,dz_dt])

t = np.arange(0, 30, 0.01)  # 创建时间点 (start,stop,step)
paras = (10.0, 28.0, 3.0)  # 设置 Lorenz 方程中的参数 (p,r,b)

# 调用ode对lorenz进行求解, 用两个不同的初始值 W1、W2 分别求解
W1 = (0.0, 1.00, 0.0)  # 定义初值为 W1
track1 = odeint(lorenz, W1, t, args=(10.0, 28.0, 3.0))  # args 设置导数函数的参数
W2 = (0.0, 1.01, 0.0)  # 定义初值为 W2
track2 = odeint(lorenz, W2, t, args=paras)  # 通过 paras 传递导数函数的参数

# 绘图
fig = plt.figure()
ax = Axes3D(fig)
ax.plot(track1[:,0], track1[:,1], track1[:,2], color='magenta') # 绘制轨迹 1
ax.plot(track2[:,0], track2[:,1], track2[:,2], color='deepskyblue') # 绘制轨迹 2
ax.set_title("Lorenz attractor by scipy.integrate.odeint")
plt.show()

求解高阶常微分方程组

高阶常微分方程，必须做变量替换，化为一阶微分方程组，再用 odeint 求数值解

零输入响应的 RLC 振荡电路可以由如下的二阶微分方程描述：

$\left\{ \begin{array}{lcr} \frac{d^2u}{dt^2} + \frac{R}{L} * \frac{du}{dt} + \frac{1}{LC} * u = 0 & \\ u(0) = U_0 & \\ u'(0) = 0 \end{array} \right.$

令 $\alpha = \frac{R}{2L} \omega_0^2=\frac{1}{LC}$ ，在零输入响应 $u_s=0$ 时，上式可写成：

$\left\{ \begin{array}{lcr} \frac{d^2u}{dt^2} + 2\alpha \frac{du}{dt} + \omega_0^2 * u = 0 & \\ u(0) = U_0 & \\ u'(0) = 0 \end{array} \right.$

对二阶微分方程问题，引入变量 $v=\frac{du}{dt}$ ，通过变量替换就把原方程化为如下的微分方程组：

$\left\{ \begin{array}{lcr} \frac{du}{dt} = v & \\ \frac{dv}{dt} = -2 \alpha v - \omega_0^2 u u(0) = U_0 & \\ v(0) = 0 \end{array} \right.$

from scipy.integrate import odeint  # 导入 scipy.integrate 模块
import numpy as np
import matplotlib.pyplot as plt

# 导数函数，求 Y=[u,v] 点的导数 dY/dt
def deriv(Y, t, a, w):
    u, v = Y  # Y=[u,v]
    dY_dt = [v, -2*a*v-w*w*u]
    return dY_dt

t = np.arange(0, 20, 0.01)  # 创建时间点 (start,stop,step)
# 设置导数函数中的参数 (a, w)
paras1 = (1, 0.6)  # 过阻尼：a^2 - w^2 > 0
paras2 = (1, 1)  # 临界阻尼：a^2 - w^2 = 0
paras3 = (0.3, 1)  # 欠阻尼：a^2 - w^2 < 0

# 调用ode对进行求解, 用两个不同的初始值 W1、W2 分别求解
Y0 = (1.0, 0.0)  # 定义初值为 Y0=[u0,v0]
Y1 = odeint(deriv, Y0, t, args=paras1)  # args 设置导数函数的参数
Y2 = odeint(deriv, Y0, t, args=paras2)  # args 设置导数函数的参数
Y3 = odeint(deriv, Y0, t, args=paras3)  # args 设置导数函数的参数
# W2 = (0.0, 1.01, 0.0)  # 定义初值为 W2
# track2 = odeint(lorenz, W2, t, args=paras)  # 通过 paras 传递导数函数的参数

# 绘图
plt.plot(t, Y1[:, 0], 'r-', label='u1(t)')
plt.plot(t, Y2[:, 0], 'b-', label='u2(t)')
plt.plot(t, Y3[:, 0], 'g-', label='u3(t)')
plt.plot(t, Y1[:, 1], 'r:', label='v1(t)')
plt.plot(t, Y2[:, 1], 'b:', label='v2(t)')
plt.plot(t, Y3[:, 1], 'g:', label='v3(t)')
plt.axis([0, 20, -0.8, 1.2])
plt.legend(loc='best')
plt.title("Second ODE by scipy.integrate.odeint")
plt.show()

附：

结果讨论

RLC串联电路是典型的二阶系统，在零输入条件下根据 α 与 ω 的关系，电路的输出响应存在四种情况：

优化问题

线性规划

基本线性规划

示例问题：基本线性规划

$min: z = 2x_1 + 3x_2 + x_3$

$KaTeX parse error: No such environment: equation at position 8: \begin{̲e̲q̲u̲a̲t̲i̲o̲n̲}̲ \left\{ \b…$

import numpy as np
from scipy import optimize


z = np.array([2, 3, 1])
a = np.array([[1, 4, 2], [3, 2, 0]])
b = np.array([8, 6])

x1_bound = x2_bound = x3_bound = (0, None)
res = optimize.linprog(z, A_ub=-a, b_ub=-b, bounds=(x1_bound, x2_bound, x3_bound))

print(res)

运输问题

某商品有m个产地，n个销地，各产地的产量分别是 $a_1$ , $a_2$ , …… $a_m$ ，若该商品由i产地运到j销地的单位运价为 $c_{ij}$ ，应该如何调运才能使总运费最省？
引入变量 $x_{ij}$ ，其取值为i产地运往j销地的商品数量，数学模型如下
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-IPZbDsVg-1632730912718)(https://gitee.com/tremblingv5/my-bed/raw/master/%E6%95%B0%E5%AD%A6%E5%BB%BA%E6%A8%A1%E4%B8%AD%E6%95%B0%E6%8D%AE%E5%A4%84%E7%90%86%E7%B1%BB%E5%9E%8B%E9%A2%98%E7%9B%AE%E7%9A%84%E4%B8%BB%E8%A6%81%E5%A4%84%E7%90%86%E6%B5%81%E7%A8%8B%E4%B8%8E%E6%96%B9%E6%B3%95/%E8%BF%90%E8%BE%93%E9%97%AE%E9%A2%98%E5%9B%BE1.0924.svg)]

示例代码如下

import pulp
import numpy as np
from pprint import pprint

def transportation_problem(costs, x_max, y_max):

    row = len(costs)
    col = len(costs[0])

    prob = pulp.LpProblem('Transportation Problem', sense=pulp.LpMaximize)

    var = [[pulp.LpVariable(f'x{i}{j}', lowBound=0, cat=pulp.LpInteger) for j in range(col)] for i in range(row)]

    flatten = lambda x: [y for l in x for y in flatten(l)] if type(x) is list else [x]

    prob += pulp.lpDot(flatten(var), costs.flatten())

    for i in range(row):
        prob += (pulp.lpSum(var[i]) <= x_max[i])

    for j in range(col):
        prob += (pulp.lpSum([var[i][j] for i in range(row)]) <= y_max[j])

    prob.solve()

    return {'objective':pulp.value(prob.objective), 'var': [[pulp.value(var[i][j]) for j in range(col)] for i in range(row)]}

if __name__ == '__main__':
    costs = np.array([[500, 550, 630, 1000, 800, 700],
                       [800, 700, 600, 950, 900, 930],
                       [1000, 960, 840, 650, 600, 700],
                       [1200, 1040, 980, 860, 880, 780]])

    max_plant = [76, 88, 96, 40]
    max_cultivation = [42, 56, 44, 39, 60, 59]
    res = transportation_problem(costs, max_plant, max_cultivation)

    print(f'最大值为{res["objective"]}')
    print('各变量的取值为：')
    pprint(res['var'])

指派问题

拟分配n人去干n项工作，每个人干且仅干一项工作，若分配第i人去干第j项工作，需要花 $c_{ij}$ 单位时间，问应该如何分配工作才能使工人花费的总时间最少？
假设指派问题的系数矩阵如下
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-SRKV9qo6-1632730912721)(https://gitee.com/tremblingv5/my-bed/raw/master/%E6%95%B0%E5%AD%A6%E5%BB%BA%E6%A8%A1%E4%B8%AD%E6%95%B0%E6%8D%AE%E5%A4%84%E7%90%86%E7%B1%BB%E5%9E%8B%E9%A2%98%E7%9B%AE%E7%9A%84%E4%B8%BB%E8%A6%81%E5%A4%84%E7%90%86%E6%B5%81%E7%A8%8B%E4%B8%8E%E6%96%B9%E6%B3%95/%E6%8C%87%E6%B4%BE%E9%97%AE%E9%A2%98%E5%9B%BE1.0924.svg)]
引入变量 $x_{ij}$ ，若分配i干j工作，则 $x_{ij}=1$ 否则 $x_{ij}=0$ ，上述指派问题的数学模型如下
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-QXZJnEnq-1632730912723)(https://gitee.com/tremblingv5/my-bed/raw/master/%E6%95%B0%E5%AD%A6%E5%BB%BA%E6%A8%A1%E4%B8%AD%E6%95%B0%E6%8D%AE%E5%A4%84%E7%90%86%E7%B1%BB%E5%9E%8B%E9%A2%98%E7%9B%AE%E7%9A%84%E4%B8%BB%E8%A6%81%E5%A4%84%E7%90%86%E6%B5%81%E7%A8%8B%E4%B8%8E%E6%96%B9%E6%B3%95/math.0924.svg)]
指派问题的可行解用矩阵表示，每行每列有且仅有一个元素为1，其余元素为0

Scipy指派问题

import numpy as np
# linear_sum_assignment 为指派问题专用库
from scipy.optimize import linear_sum_assignment

"""
定义了开销矩阵（指派问题的系数矩阵）efficiency_matrix，
传入linear_sum_assignment，结果返回的是最优指派的行和列，
例如第一行选择第二列，意为：将第一个人派往第二个工作。
而根据numpy.array的性质，传入行和列就会返回行列所对应的值，
即为输出的第三列
"""

efficiency_matrix = np.array([
    [12,7,9,7,9],
    [8,9,6,6,6],
    [7,17,12,14,12],
    [15,14,6,6,10],
    [4,10,7,10,6]
])

row_index, col_index=linear_sum_assignment(efficiency_matrix)
print(row_index+1)
print(col_index+1)
print(efficiency_matrix[row_index,col_index])

print(efficiency_matrix[row_index, col_index].sum())

整数规划

基本定义

要求一部分值必须使整数的规划问题（线性规划、非线性规划、二次规划）

相比于非整数规划，对非整数规划的解进行四舍五入或者取整，并不能保证结果依然使最优解。

基本分类

完全整数规划：要求全部变量为整数
混合整数规划：要求部分变量为整数
0-1整数规划：要求变量必须使0或1
混合0-1整数规划：要求部分变量必须使0或1

基本求解方法

分支定界法

基本思想：把整数规划转换成一个个线性规划问题，在求解这些线性规划问题时过程中不断趋近原问题的上下界

分支：全部可行解空间反复地分割为越来越小地子集

定界：对每个子集计算一个目标上界

设有最大化的整数规划问题 A，先解与之相应的线性规划问题 B，若 B 的最优解不符合 A 的整数条件，则 B 的最优目标函数必是 A 的最优目标函数 z 的上界，记为 z2，而 A 的任意可行解的目标函数值将是 z 的一个下界 z1。分支定界法就是将 B 的可行域分成子区域（分支）的方法，逐步减小 z2 和增大 z1，最终求到 z*

分支定界法不用区分完全整数规划与混合整数规划，算法便于实现，但计算量比较大

割平面法

基本思路：先求普通线性规划问题地最优解，再对非整数解添加约束条件使可行或缩小，如此反复求解直到得到整数解

不考虑整数约束条件，直接求松弛问题地最优解，在此基础上再添加新地约束条件。

割平面法的计算量比较小，但对问题的结构及求解的要求较高，算法比较复杂。

例题

例题1#

某厂生产甲乙两种饮料，每百箱甲饮料需用原料 6千克、工人 10名，获利 10万元；每百箱乙饮料需用原料 5千克、工人 20名，获利 9万元。
今工厂共有原料 60千克、工人 150名，又由于其他条件所限甲饮料产量不超过8百箱。
问题 1：问如何安排生产计划，即两种饮料各生产多少使获利最大？
问题 2：若投资0.8万元可增加原料1千克，是否应作这项投资？投资多少合理？
问题 3：若不允许散箱（按整百箱生产），如何安排生产计划，即两种饮料各生产多少使获利最大？
问题 4：若不允许散箱（按整百箱生产），若投资0.8万元可增加原料1千克，是否应作这项投资？投资多少合理？

规划类问题：问题定义、模型构建、模型求解

问题定义

问题定义，确定决策变量、目标函数和约束条件。

决策变量是问题中可以在一定范围内进行变化而获得不同结果的变量。

对于问题 1，问题描述中说的很明确，希望通过改变甲、乙两种饮料的产量使总利润最大，甲、乙两种饮料的产量就是决策变量。

对于本案例，每个问题都是希望获得最大利润，目标函数都是总利润，问题是求目标函数即总利润的最大值。

约束条件是决策变量所要满足的限制条件。

模型构建

模型构建，由问题描述建立数学方程，并转化为标准形式的数学模型。

对于问题 1，目标函数是生产甲、乙两种饮料的总利润，约束条件是原料总量、工人总数的约束，而且原料、工人都要大于等于 0。

模型求解

python pulp求解步骤

导入PuLP并定义规划问题

import pulp
# 定义问题，求最大值
ProbLP1 = pulp.LpProblem("ProbLP1", sense=pulp.LpMaximize)

定义决策变量

问题1

# 定义x1
x1 = pulp.LpVariable('x1', lowBound=0, upBound=15, cat='Continuous')
# 定义x2
x2 = pulp.LpVariable('x2', lowBound=0, upBound=7.5, cat='Continuous')

pulp.LpVariable定义决策变量
lowBound, upBound 决策变量上下界
cat定义变量类型，连续变量：Continuous，离散变量：Integer，0/1变量：Binary

问题3

x1 = pulp.LpVariable('x1', lowBound=0, upBound=15, cat='Integer')
x2 = pulp.LpVariable('x2', lowBound=0, upBound=7.5, cat='Integer')

添加目标函数

ProbLP1 += (10*x1 + 9*x2)  # 设置目标函数 f(x)

添加约束条件

# 不等式约束
ProbLP1 += (6*x1 + 5*x2 <= 60)
# 不等式约束
ProbLP1 += (10*x1 + 20*x2 <= 150)

求解

ProbLP1.solve()

# 输出求解状态
print(ProbLP1.name)  
print("Status:", pulp.LpStatus[ProbLP1.status])

for v in ProbLP1.variables():
    # 输出每个变量的最优值
    print(v.name, "=", v.varValue)  

# 输出最优解的目标函数值
print("F1(x) =", pulp.value(ProbLP1.objective))

数值优化算法

数值优化算法是寻找一个函数最优解的问题，这个函数被成为目标函数，通常使用scipy.optimize进行优化

梯度下降法

梯度下降法通常是沿着梯度下降的方向寻找最优解，但是对于一些复杂函数，梯度下降法不一定可以找到最优解。

在scipy中，带有梯度下降的方法名通常包含cg，其中简单梯度下降方法的函数名为scipy.optimize.fmin_cg()

from scipy import optimize

def f(x):
    return 0.5 * (1 - x[0]) ** 2 + (x[1] - 7) ** 2
    
optimize.fmin_cg(f,[0,0])

另，可以设置梯度，设置梯度有助于提升算法性能

def fprime(x):
    return np.array((-2 * .5 * (1 - x[0]), 2 * (x[1] - 7)))
optimize.fmin_cg(f, [0, 0], fprime=fprime)

牛顿法

牛顿法在现有极小点估计值的附近对目标函数做二阶展开，进而找到极小点的下一个估计值。

def f(x):
    return 0.5 * (1 - x[0]) ** 2 + (x[1] - 7) ** 2

# 一阶导
def fprime(x):
    return np.array((-2 *.5 * (1 - x[0]), 2 * (x[1] - 7)))

# 二阶导
def hessian(x):
    return np.array(-2 *.5 *x[0], 2 * x[1])

# 最少需要传入一阶导
optimize.fmin_ncg(f, [200,800], fprime=fprime)
optimize.fmin_ncg(f, [200,800], fprime=fprime, fhess=hessian)

拟牛顿法

def f(x):
    return 0.5 * (1 - x[0]) ** 2 + (x[1] - 7) ** 2

# 一阶导
def fprime(x):
    return np.array((-2 *.5 * (1 - x[0]), 2 * (x[1] - 7)))

optimize.fmin_bfgs(f, [200, 800], fprime=fprime)

Powel法

类似梯度下降法

def f(x):
    return 0.5*(1 - x[0])**2 + (x[1] - 7)**2

# 一阶导
def fprime(x):
    return np.array((-2*.5*(1 - x[0]), 2*(x[1] - 7)))
optimize.fmin_powell(f,[0,0])

Nelder-Mead法

对噪音有很好的抵抗性，不依赖于梯度，可以在局部光滑的函数上发挥作用；在光滑、非噪音函数上比梯度法更慢

def f(x):
    return 0.5*(1 - x[0])**2 + (x[1] - 7)**2

# 一阶导
def fprime(x):
    return np.array((-2*.5*(1 - x[0]), 2*(x[1] - 7)))
optimize.fmin(f, [2, 2])

`scipy.optimize`中的3种限制条件

边界限制

在指定边界内寻找最优解

def f(x):
    return 0.5*(1 - x[0])**2 + (x[1] - 7)**2
# 一阶求导
def fprime(x):
    return np.array((-2*.5*(1 - x[0]), 2*(x[1] - 7)))
# 这里限制了 x[0] 的取值在(1,2), x[1] 的取值在(9,19)
optimize.fmin_l_bfgs_b(f, [0,0], approx_grad=1, bounds=((1,2),(9,19)))

等于限制

def f(x):
    return np.sqrt((x[0] - 3)**2 + (x[1] - 2)**2)
# 自定义限制条件
def constraint(x):
    return x[0]+x[1] - 4
#   eqcons == 0.0 
optimize.fmin_slsqp(f, np.array([0, 0]), eqcons=[constraint,])

大于限制

def f(x):
    return np.sqrt((x[0] - 3)**2 + (x[1] - 2)**2)
# 自定义限制条件
def constraint(x):
    return x[0]+x[1] - 4
#   eqcons == 0.0 
optimize.fmin_slsqp(f, np.array([0, 0]), eqcons=[constraint,])

组合优化算法

组合优化算法是一组求离散状态数据集最优解的算法，这些算法常常用来解决NP-Hard级问题。后续组合优化算法均使用python库：scikit-opt来调用。

模拟退火算法

基本原理

模拟退火算法是一种随机算法，并不能保证得到最优解，可以以较高的效率获取到近似最优解。

方法

确定目标函数
给定初始值
设置参数
代码求解

代码

问题假设

求函数 f(x) = x ^ 2 - 2 * x + 1的最小值

问题求解

设置目标函数

func = lambda x: x[0] ** 2 - x[0] * 2 + 1

调用库函数

"""
初始值设置为50
停止上限为100
停止下限为1e-9
"""
sa = SA(func=func, x0=[50], T_max=100, T_min=1e-9, max_stay_counter=150)

执行并获取结果

best_x, best_y = sa.run()

print(best_x, best_y)

plt.plot(pd.DataFrame(sa.best_y_history).cummin(axis=0))
plt.savefig("test.jpg")

[0.99999992] 5.773159728050814e-15

粒子群算法

粒子群算法是一种进化算法，源于对鸟类捕食的研究，通过群体中个体之间的协作和信息共享来寻找最优解

优势：简单易实现，不需要调节过多参数

基本思想

一个“粒子”只具有两个属性，速度和位置。

示例代码如下，与模拟退火算法类似，主要流程即定义问题，然后调用库中的算法进行解题：

from sko.PSO import PSO

import matplotlib.pyplot as plt

def target(x):
    x1, x2, x3 = x
    return x1 ** 2 + (x2 - 0.05) ** 2 + x3 ** 2

pso = PSO(
    func=target,
    n_dim=3,
    max_iter=150,
    lb=[0, -1,  0.5],
    ub=[1, 1, 1],
    c1=0.5,
    c2=0.5
)
x, y = pso.run()

print(f"x: {x}, y: {y}")

遗传算法

遗传算法的抽象理解：给定一个初始解，经过一系列的变化（遗传、变异、交叉、复制），最终进化出最优解决。

适用问题

与模拟退火算法使用场景类似，都适用于解决np-hard问题，从随机中不断趋近最优解

基本概念

染色体
问题的一个可行解
基因
一个可行解由多个元素构成，一个元素成为一个基因
适应度函数
适应度函数起“筛选”的作用，将非最优解给筛去
交叉
从上一代中选择两条染色体，在某一点截断并进行组合
变异
随机更改基因
复制
保留优质染色体

示例代码如下：

import pandas as pd
import matplotlib.pyplot as plt
from sko.GA import GA

def schaffer(p):
    x1, x2 = p
    x = np.square(x1) + np.square(x2)
    return 0.5 + (np.square(np.sin(x)) - 0.5) / np.square(1 + 0.001 * x)

ga = GA(
    func=schaffer,
    n_dim=2,
    size_pop=50,
    max_iter=800,
    prob_mut=0.001,
    lb=[-1, -1],
    ub=[1, 1],
    precision=1e-7
)

x, y = ga.run()
print(f"x: {x}, y: {y}")

蚁群算法

蚁群算法是一种用来寻找优化路径的概率型算法。它由Marco Dorigo于1992年在他的博士论文中提出，其灵感来源于蚂蚁在寻找食物过程中发现路径的行为。

示例代码如下:

from sko.ACA import ACA_TSP
from scipy import spatial
import numpy as np

points_coordinate = np.random.rand(50, 2)
distance_matrix = spatial.distance.cdist(points_coordinate, points_coordinate, metric='euclidean')

def cal_total_distance(routine):
    num_points, = routine.shape
    return sum([distance_matrix[routine[i % num_points], routine[(i + 1) % num_points]] for i in range(num_points)])


aca = ACA_TSP(func=cal_total_distance, n_dim=50,
              size_pop=50, max_iter=200,
              distance_matrix=distance_matrix)

best_x, best_y = aca.run()

print(best_x, best_y)

回归分析

基于python库`statsmodels`的线性回归

导包

import statsmodels.api as sm
from statsmodels.sandbox.regression.predstd import wls_prediction_std

导入（生成）数据

nSample = 100
# 起点为 0，终点为 10，均分为 nSample个点
x1 = np.linspace(0, 10, nSample) 
# 正态分布随机数
e = np.random.normal(size=len(x1)) 
# y = b0 + b1*x1
yTrue = 2.36 + 1.58 * x1 
# 产生模型数据
yTest = yTrue + e

本案例是一元线性回归问题，(yTest，x)是导入的样本数据，我们需要通过线性回归获得因变量 y 与自变量 x 之间的定量关系。yTrue 是理想模型的数值，yTest 模拟实验检测的数据，在理想模型上加入了正态分布的随机误差

建模与拟合

一元线性回归模型方程为

y = β0 + β1 * x + e

X = sm.add_constant(x1) # 向 x1 左侧添加截距列 x0=[1,...1]
model = sm.OLS(yTest, X) # 建立最小二乘模型（OLS）
results = model.fit() # 返回模型拟合结果

statsmodels.OLS 是 statsmodels.regression.linear_model 的函数，有 4个参数 (endog, exog, missing, hasconst)。
第一个参数 endog 是回归模型中的因变量 y(t), 是1-d array 数据类型。
第二个输入 exog 是自变量 x0(t),x1(t),…,xm(t)，是(m+1)-d array 数据类型。
需要注意的是，statsmodels.OLS 的回归模型没有常数项，其形式为：
y = BX + e = β0x0 + β1*x1 + e, x0 = [1,…1]
而之前导入的数据 (yTest，x1) 并不包含 x0，因此需要在 x1 左侧增加一列截距列 x0=[1,…1]，将自变量矩阵转换为 X = (x0, x1)。函数 sm.add_constant() 实现的就是这个功能。
参数 missing 用于数据检查, hasconst 用于检查常量，一般情况不需要。

拟合和统计结果的输出

print(results.summary()) # 输出回归分析的摘要

coef：回归系数（Regression coefficient），即模型参数 β0、β1、…的估计值。
std err ：标准差（ Standard deviation），也称标准偏差，是方差的算术平方根，反映样本数据值与回归模型估计值之间的平均差异程度。标准差越大，回归系数越不可靠。
t：t 统计量（t-Statistic），等于回归系数除以标准差，用于对每个回归系数分别进行检验，检验每个自变量对因变量的影响是否显著。如果某个自变量 xi的影响不显著，意味着可以从模型中剔除这个自变量。
P>|t|：t检验的 P值（Prob(t-Statistic)），反映每个自变量 xi 与因变量 y 的相关性假设的显著性。如果 p<0.05，可以理解为在0.05的显著性水平下变量xi与y存在回归关系，具有显著性。
[0.025,0.975]：回归系数的置信区间（Confidence interval）的下限、上限，某个回归系数的置信区间以 95%的置信度包含该回归系数。注意并不是指样本数据落在这一区间的概率为 95%。

此外，还有一些重要的指标需要关注：

R-squared：R方判定系数（Coefficient of determination），表示所有自变量对因变量的联合的影响程度，用于度量回归方程拟合度的好坏，越接近于 1说明拟合程度越好。
F-statistic：F 统计量（F-Statistic），用于对整体回归方程进行显著性检验，检验所有自变量在整体上对因变量的影响是否显著。

Statsmodels 也可以通过属性获取所需的回归分析的数据，例如：

print("OLS model: Y = b0 + b1 * x") # b0: 回归直线的截距，b1: 回归直线的斜率
print('Parameters: ', results.params) # 输出：拟合模型的系数
yFit = results.fittedvalues # 拟合模型计算出的 y值
ax.plot(x1, yTest, 'o', label="data") # 原始数据
ax.plot(x1, yFit, 'r-', label="OLS") # 拟合数据

判别分析

判别分析是一种分类方法，根据已掌握的每个类别的若干个样本信息，求出判别函数，再根据判别函数判别未知类别的样本点的类别。

距离判别法

距离判别法为根据待判定对象的距离，以就近原则进行判别。这里的距离通常采用Mahalanobis距离（马氏距离）

例题3

Af：

触角长度	翅膀长度
1.24	1.27
1.36	1.74
1.38	1.64
1.38	1.82
1.38	1.90
1.40	1.70
1.48	1.82
1.54	1.82
1.56	2.08

Apf:

触角长度	翅膀长度}
1.14	1.78
1.18	1.96
1.20	1.86
1.26	2.00
1.28	2.00
1.30	1.96

若两类蠓虫协方差矩阵相同，试判别如下3只蠓虫属于哪一类

触角长度	翅膀长度}
1.24	1.80
1.28	1.84
1.40	2.04

示例代码如下:

import numpy as np
from sklearn.neighbors import KNeighborsClassifier

X0 = np.array(
    [
        [1.24, 1.27],
        [1.36, 1.74],
        [1.38, 1.90],
        [1.38, 1.82],
        [1.38, 1.90],
        [1.40, 1.70],
        [1.48, 1.82],
        [1.54, 1.82],
        [1.56, 2.08],
        [1.14, 1.78],
        [1.18, 1.96],
        [1.20, 1.86],
        [1.26, 2.00],
        [1.28, 2.00],
        [1.30, 1.96]
    ]
)

x = np.array(
    [
        [1.24, 1.80],
        [1.28, 1.84],
        [1.40, 2.04]
    ]
)

g = np.hstack(
    [
        np.ones(9),
        2 * np.ones(6)
    ]
)

v = np.cov(X0.T)
knn = KNeighborsClassifier(2, metric='mahalanobis', metric_params={'V': v})
knn.fit(X0,g)
pre = knn.predict(x)
print("马氏距离：", pre)
print("马氏距离已知样本误判率：", 1 - knn.score(X0, g))
knn2 = KNeighborsClassifier(2)
knn2.fit(X0,g)
pre2 = knn2.predict(x)
print("欧式距离", pre2)
print("欧氏距离误判率", 1 - knn2.score(X0,g))

输出结果如下:

马氏距离： [2. 2. 1.]
马氏距离已知样本误判率： 0.0
欧式距离 [2. 1. 2.]
欧氏距离误判率 0.0

Fisher判别法

Fisher判别法是基于方差分析的判别法

示例代码如下：

import numpy as np
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis as LDA
from sklearn.neighbors import KNeighborsClassifier

X0 = np.array(
    [
        [1.24, 1.27],
        [1.36, 1.74],
        [1.38, 1.90],
        [1.38, 1.82],
        [1.38, 1.90],
        [1.40, 1.70],
        [1.48, 1.82],
        [1.54, 1.82],
        [1.56, 2.08],
        [1.14, 1.78],
        [1.18, 1.96],
        [1.20, 1.86],
        [1.26, 2.00],
        [1.28, 2.00],
        [1.30, 1.96]
    ]
)

x = np.array(
    [
        [1.24, 1.80],
        [1.28, 1.84],
        [1.40, 2.04]
    ]
)

g = np.hstack(
    [
        np.ones(9),
        2 * np.ones(6)
    ]
)

clf = LDA()
clf.fit(X0,g)
print("判别结果为", clf.predict(x))
print("已知样本的误判率为：", 1 - clf.score(X0,g))

结果如下:

判别结果为 [2. 2. 1.]
已知样本的误判率为： 0.0

你可能感兴趣的:(数学建模,python,数学建模)

【Python】Gym 库：于开发和比较强化学习（Reinforcement Learning, RL）算法彬彬侠 Python基础 python Gym 强化学习 RL Gymnasium
Gym是Python中一个广泛使用的开源库，用于开发和比较强化学习（ReinforcementLearning,RL）算法。它最初由OpenAI开发，提供标准化的环境接口，允许开发者在各种任务（如游戏、机器人控制、模拟物理系统）中测试RL算法。Gym的设计简单且灵活，适合学术研究和工业应用。2022年，Gym被整合到Gymnasium（由FaramaFoundation维护）中，成为主流的强化学习
Python 虚拟环境完全指南 wsj__WSJ python python 开发语言
为何离不开虚拟环境？在Python开发领域，虚拟环境堪称管理项目依赖的不二利器，其重要性体现在多个关键层面：项目隔离独立运行环境构建：为每一个项目量身打造专属的Python运行环境，使各个项目之间相互隔离，互不干扰。化解依赖版本冲突：有效解决不同项目对同一依赖包的版本需求不一致的难题。例如，项目A基于Django3.2进行开发，而项目B需要Django4.0才能正常运作，通过虚拟环境，两者可并行不
python学习路线（从菜鸟到起飞）突突突然不会编了 python 学习开发语言
以下是基于2025年最新技术趋势的Python学习路线，综合多个权威资源整理而成，涵盖从零基础到进阶应用的全流程，适合不同学习目标（如Web开发、数据分析、人工智能等）的学习者。路线分为基础、进阶、实战、高级、方向拓展五个阶段，并附学习资源推荐：一、基础阶段（1-2个月）目标：掌握Python核心语法与编程思维，熟悉开发环境。环境搭建安装Python3.10+，配置PyCharm或VSCode开发
小白带你部署LNMP分布式部署刘俊涛liu 分布式
目录前言一、概述二、LNMP环境部署三、配置nginx1、yum安装2、编译安装四、安装1、编译安装nginx2、网络源3、稍作优化4、修改配置文件vim/usr/local/nginx/conf/nginx.conf5、书写测试页面五、部署应用前言LNMP平台指的是将Linux、Nginx、MySQL和PHP（或者其他的编程语言，如Python、Perl等）集成在一起的一种Web服务器环境。它是
如何构建FunASR的本地语音识别服务
FunASR简介FunASR是阿里巴巴达摩院开源的高性能语音识别工具包，支持离线识别和实时流式识别两种模式。其核心特点包括：支持多种语音任务：ASR（自动语音识别）、VAD（语音活动检测）、标点恢复、关键词检测等。提供预训练模型：覆盖中文、英文等多语言，支持不同场景（通用、会议、直播等）。支持多种部署方式：本地Python、Docker容器、ONNX推理优化等。开源地址：GitHub-FunASR
Python 进阶学习之全栈开发学习路线 Microi风闲【胶水语言】Python python 学习开发语言
文章目录前言一、Python全栈开发技术栈1.前端技术选型2.后端框架选择3.数据库访问二、开发环境配置1.工具链推荐2.VSCode终极配置3.项目依赖管理三、现代Python工程实践1.项目结构规范2.自动化测试策略3.CI/CD流水线四、部署策略大全1.传统服务器部署2.容器化部署3.无服务器部署五、性能优化技巧1.数据库优化2.异步处理3.静态资源优化结语前言Python作为当今最流行的编
Pycharm下载链接 Aderic 杂陈
人生苦短，我用python3.4https://download.jetbrains.8686c.com/python/pycharm-community-2018.1.1.tar.gz后续更新可能就是后面版本号码稍微差异，mark！
python基础语法复习08——模块化编程洛华363 python python 开发语言
python基础语法目录python基础语法01——基本类型python基础语法02——复合类型python基础语法03——语句构成python基础语法04——函数python基础语法05——递归及装饰器python基础语法06——类与对象python基础语法07——迭代器与生成器文章目录python基础语法目录前言一、模块（Module）1.1什么是模块？1.2模块使用1.3模块分类1.3.1系
python基础语法复习02——复合类型洛华363 python python 开发语言
python基础语法目录python基础语法基础类型文章目录python基础语法目录前言一、初识列表list1.列表基本操作1.1创建列表1.2列表运算1.3列表访问1.4列表增删2常用函数二、初识元组tuple1.元组基本操作1.1创建元组1.2元组访问1.3元组运算2.常用函数三、初识字典dict1.字典基本操作1.1创建字典1.2增删改查2常用函数四、初识集合set1.集合基本操作1.1创建
⚡C++ 有必要学吗？⚡我的家长有话说司空妲命 c++开发语言
在编程教育愈发普及的当下，除了备受关注的Python，C++也进入了许多家长和孩子的视野。作为一门经典且强大的编程语言，C++在系统开发、游戏制作、嵌入式领域等有着广泛应用。然而，对于是否让孩子学习C++，家长们看法不一。有人认为它是通往高端技术领域的钥匙，也有人担忧其较高的学习难度会让孩子望而却步。今天，就让我们深入探讨C++学习的必要性。一、家长眼中的C++：潜力与顾虑交织有人疑惑：“C++现
python3异步爬虫：asyncio + aiohttp + aiofiles（python经典编程案例）数据知道 python3案例和总结 python
更多内容请见：python3案例和总结-专栏介绍和目录文章目录1.安装依赖库2.异步爬虫的基本流程3.实现异步爬虫3.1代码实现3.2代码说明4.运行效果5.扩展功能5.1设置请求头5.2处理异常5.3限制并发数5.4爬取图片6.总结使用Python的异步编程技术（asyncio+aiohttp+aiofiles）可以实现高效的异步爬虫。以下是详细的使用指南和代码示例。1.安装依赖库首先安装所需的
Python爬虫实战：借助代理IP破解反爬机制，批量下载哔哩哔哩高清视频程序员威哥最新爬虫实战项目 python 爬虫 tcp/ip
一、前言随着视频平台的蓬勃发展，视频数据成为互联网的一个重要组成部分。特别是哔哩哔哩（B站）作为一个年轻化、内容丰富的综合性视频平台，吸引了大量用户观看、上传和分享各种形式的创作内容。在这个信息高度开放的时代，如何高效、合法地获取这些视频数据成为了一个有挑战的技术问题。哔哩哔哩的视频下载不仅受到版权保护，同时平台也使用了强大的反爬虫机制来保护用户数据和平台内容。本文将通过Python爬虫实战，利用
Python爬虫高阶：Selenium+Scrapy+Playwright融合架构，攻克动态页面与高反爬场景程序员威哥 python 爬虫 selenium
随着互联网应用的不断发展，越来越多的网站采用JavaScript动态渲染页面，常见的静态页面数据抓取方式逐渐失效。此外，高反爬技术也使得传统爬虫架构面临着更大的挑战，许多网站通过复杂的反爬机制如验证码、IP屏蔽、请求频率限制等来防止数据抓取。为了应对这些挑战，我们需要采用更为先进和灵活的爬虫架构。在此背景下，结合Selenium、Scrapy和Playwright这三种技术，能够帮助我们突破动态页
基于ArcPy将HDF格式栅格文件批量转为TIFF格式疯狂学习GIS
本文介绍基于Python中ArcPy模块，实现大量HDF格式栅格图像文件批量转换为TIFF格式的方法。首先，来看看我们想要实现的需求。在一个名为HDF的文件夹下，有五个子文件夹；每一个子文件夹中，都存储了大量的.hdf格式的栅格遥感影像数据。我们在其中任选一个子文件夹，来看看其中所含的文件。我们要做的，就是将HDF文件夹下的全部子文件夹中的全部.hdf格式图像文件，一次性转换为
Python训练 + Go优化 + C#部署：端到端AI模型的跨语言实践威哥说编程人工智能学习资料库 python golang c#
在现代AI应用中，如何高效地训练、优化、并最终部署AI模型是一项复杂且具有挑战性的任务。在这一过程中，选择合适的编程语言和工具可以显著提高效率和系统的性能。Python作为AI领域的主流语言，具有丰富的深度学习框架（如PyTorch和TensorFlow），在模型训练方面处于领先地位。然而，针对计算密集型任务（如数据预处理、加密等），Go语言因其高效的并发处理和出色的性能，成为优化计算的理想选择。
python排序算法之桶排序华强笔记 python数据结构和算法 python 算法
桶排序主要适用于全是数字的列表排序代码如下：defbuckrt_sort(li,n=100,max_num=10000):bucket=[[]for_inrange(n)]
【无标题】
PyQt5相关论文方向扩充及技术特性解析PyQt5的核心优势PyQt5作为基于Qt框架的Python绑定库，在科研与工程应用中具备显著优势。其跨平台兼容性极强，可在Windows、macOS、Linux等主流操作系统上稳定运行，且能保持界面风格的一致性，这对开发多场景应用系统至关重要。在界面设计方面，PyQt5提供了丰富的UI组件库，从基础的按钮、文本框到高级的图表、3D控件应有尽有，同时支持Qt
Python数据读写与组织全解析（查缺补漏篇） Monkey的自我迭代 python学习的查缺补漏机器学习人工智能 python
1高维数据由键值对类型的数据构成，可以多层嵌套。高维数据相比一维和二维数据能表达更加灵活和复杂的数据关系，可以用字典类型表示。一维数据不用字典类型来表示。2read、readline、redlines和for循环输出读取的区别直接read，读取的结果就是一个字符串，和文件中一模一样f_2=open('cpi.csv','r')print(f_2.read())指标,2015,2016,2017,居
Python文件路径操作全面指南：从基础到高级应用 Monkey的自我迭代 python 开发语言
文件路径操作是Python编程中不可或缺的核心技能，无论是数据科学、Web开发还是自动化办公，都离不开对文件路径的有效管理。本文将系统性地介绍Python中文件路径操作的各类方法，帮助您掌握这一关键技术。一、文件路径基础概念1.1路径类型解析文件路径主要分为两种类型，理解它们的区别是路径操作的基础：绝对路径：从文件系统根目录开始的完整路径，如Windows系统中的C:\Users\Username
python排序算法之基数排序华强笔记 python数据结构和算法 python 算法
#代码如下：'''基数排序：1.把数据分为10个桶，以为数字有0-9这10个2.依次把数据的个位，十位，百位等等各个位数的数据进行分桶排序，放在这10个桶中3.最大的数有k位，则循环k次4.时间复杂度O(kn),空间复杂度O(k+n),其中k=log10(n)+1'''defradixs_sort(li):max_num=max(li)it=0while10**it<=max_num:bucket
python折半查找算法_python二分查找代码试用递归法编写python程序实现折半查找算法...
python二分查找算法函数bi_search(),该函数实现检回忆，很美却很伤；回忆只是回不到过去的记忆。输入格式:第一行为正整数n接下来若干行为待查找的数字，每行输入一个总是女人为了天长地久而烦恼，男人却可以洒脱地出乎意料。defprime(n):ifnend:return-1mid=(start+end)//2ifprimelist[mid]==prime:returnmidelifprim
PyCharm高效入门指南：从零开始掌握Python开发利器软考和人工智能学堂 Python开发经验强化学习 PyCharm
引言PyCharm是JetBrains公司推出的一款强大的Python集成开发环境(IDE)，被全球数百万Python开发者所青睐。无论你是Python初学者还是经验丰富的开发者，掌握PyCharm都能显著提升你的开发效率。本文将带你从零开始，全面了解PyCharm的核心功能和使用技巧。1.PyCharm的安装与配置1.1下载与安装首先访问JetBrains官网下载PyCharm。PyCharm有
python作业陈小铃子 python 开发语言
基础练习练习目标函数01.计算车费题目描述小红打车，起步价8元(3公里),每公里收费2元，她打车行驶了n公里，通过函数封装并计算车费输入描述输入一个公里数输出描述输出应付车费示例输入：5输出：12defcalculate_fare(distance):base_price=8#起步价per_km_cost=2#每公里费用min_distance=3#最小计费距离ifdistance0:sum_nu
【Python】(三）面试题和Py基础题戏精亿点点菜面试职场和发展 python
1.技术面试题（1）解释Linux中的进程、线程和守护进程的概念，以及如何管理它们？答：进程（Process）：进程是操作系统中资源分配的基本单位，是正在运行的程序的实例。每个进程都有自己的内存空间、文件描述符和执行上下文。管理：①查看进程：使用ps、top、htop等命令查看当前运行的进程。②启动进程：通过命令行或脚本启动新进程。③终止进程：使用kill命令发送信号终止进程，例如kill-9PI
python小工具：测内网服务器网速和延迟秃了也弱了。 python大家庭服务器 python java
文章目录一、使用1、代码2、使用3、注意事项一、使用1、代码importargparseimportsocketimporttimeimportsubprocessimportreimportsysdefmeasure_latency(host):#使用ping命令测量延迟try:#根据操作系统选择ping参数ifsys.platform.startswith('win'):output=subp
Python面试题-6 编织幻境的妖 python 服务器开发语言
1.请解释Python中的动态类型。Python中的动态类型Python是一种动态类型语言，这意味着你不需要在编程时声明变量的类型，而是在运行时自动推断类型。在Python中，变量的类型是在程序运行时决定的，这意味着同一个变量可以在不改变其类型的情形下被赋予不同类型的值。动态类型的优点在于它提高了编程的灵活性，因为你不需要预先确定数据的类型，可以更容易地写出简洁的代码。然而，这也可能导致运行时错误
火爆全网的条形竞赛图，Python轻松实现统计学家
image这个动图叫条形竞赛图，非常适合制作随时间变动的数据。我已经用streamlit+bar_chart_race实现了，然后白嫖了heroku的服务器，大家通过下面的网址上传csv格式的表格就可以轻松制作条形竞赛图，生成的视频可以保存本地。https://bar-chart-race-app.herokuapp.com/本文我将实现过程介绍一下，白嫖服务器+部署留在下期再讲。纯matplot
【无标题】Python---day9 模块化编程概念（模块、包、导入）及常见系统模块总结和第三方模块管理 AnAn__kang python java 服务器
系列文章目录前言跟着博主学Python，今天我们来到了第九天的学习，模块化编程的概念。Python作为一门编程语言，本身就是用于对模块以及各种包的使用来达到我们自己想到创作的目的。所以今天博主就给大家盘点一下有关于各种常见的包以及如何进行导入的。一.模块Module，模块1.1基本概念定义：模块是一个Python文件，每个.py.py.py文件就是一个模块。作用：用于组织代码，避免代码重复，提高复
Python --- day 10 Opencv模块的使用 AnAn__kang python opencv 开发语言
系列文章目录前言今天博主带大家进入Opencv的学习，这是一个专门针对处理图像和视频的一个模块，大家以理解为主，增强自己的编程思维，再后续我们训练模型时会大批量的处理图片时会经常用到这个模块。1OpenCV介绍OpenCV（开放源代码计算机视觉库）是一个开源的计算机视觉和机器学习软件库。由一系列C++类和函数构成，用于图像处理、计算机视觉领域的算法实现。1.1OpenCV优势**开源免费：**完全
【无标题】Python --- Day5 函数的位置传参、关键词传参及其可变性和解包操作 AnAn__kang python 前端人工智能
系列文章目录前言今天小伙伴们跟我进入第五天的Python课程学习，主要是关于函数的位置传参，关键传参和可变性和解包传参这其中的具体定义以及它们的使用场景`一、调用传参函数调用时传递参数的方式有多种，包括位置传参、关键词传参、多个参数解包、参数默认值等。1.1位置传参最常见的传参方式，参数按定义的顺序依次传入函数。示例：defgreet(name,age):print(f"Hello,{name}.
[星球大战]阿纳金的背叛 comsci
本来杰迪圣殿的长老是不同意让阿纳金接受训练的......... 但是由于政治原因,长老会妥协了...这给邪恶的力量带来了机会所以......现代的地球联邦接受了这个教训...绝对不让某些年轻人进入学院
看懂它，你就可以任性的玩耍了！ aijuans JavaScript
javascript作为前端开发的标配技能，如果不掌握好它的三大特点：1.原型 2.作用域 3. 闭包 ,又怎么可以说你学好了这门语言呢？如果标配的技能都没有撑握好，怎么可以任性的玩耍呢？怎么验证自己学好了以上三个基本点呢，我找到一段不错的代码，稍加改动，如果能够读懂它，那么你就可以任性了。 function jClass(b
Java常用工具包 Jodd Kai_Ge java jodd
Jodd 是一个开源的 Java 工具集，包含一些实用的工具类和小型框架。简单，却很强大！写道 Jodd = Tools + IoC + MVC + DB + AOP + TX + JSON + HTML < 1.5 Mb Jodd 被分成众多模块，按需选择，其中工具类模块有： jodd-core &nb
SpringMvc下载 120153216 springMVC
@RequestMapping(value = WebUrlConstant.DOWNLOAD) public void download(HttpServletRequest request,HttpServletResponse response,String fileName) { OutputStream os = null; InputStream is = null;
Python 标准异常总结 2002wmj python
Python标准异常总结 AssertionError 断言语句（assert）失败 AttributeError 尝试访问未知的对象属性 EOFError 用户输入文件末尾标志EOF（Ctrl+d） FloatingPointError 浮点计算错误 GeneratorExit generator.close()方法被调用的时候 ImportError 导入模块失
SQL函数返回临时表结构的数据用于查询 357029540 SQL Server
这两天在做一个查询的SQL，这个SQL的一个条件是通过游标实现另外两张表查询出一个多条数据，这些数据都是INT类型，然后用IN条件进行查询，并且查询这两张表需要通过外部传入参数才能查询出所需数据，于是想到了用SQL函数返回值，并且也这样做了，由于是返回多条数据，所以把查询出来的INT类型值都拼接为了字符串，这时就遇到问题了，在查询SQL中因为条件是INT值，SQL函数的CAST和CONVERST都
java 时间格式化 | 比较大小| 时区个人笔记 7454103 java eclipse tomcat c MyEclipse
个人总结！不当之处多多包含！引用 1.0 如何设置 tomcat 的时区：位置：(catalina.bat---JAVA_OPTS 下面加上) set JAVA_OPT
时间获取Clander的用法 adminjun Clander 时间
/** * 得到几天前的时间 * @param d * @param day * @return */ public static Date getDateBefore(Date d,int day){ Calend
JVM初探与设置 aijuans java
JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以在多种平台
SQL中ON和WHERE的区别 avords
SQL中ON和WHERE的区别数据库在通过连接两张或多张表来返回记录时，都会生成一张中间的临时表，然后再将这张临时表返回给用户。 www.2cto.com 在使用left jion时，on和where条件的区别如下： 1、 on条件是在生成临时表时使用的条件，它不管on中的条件是否为真，都会返回左边表中的记录。
说说自信 houxinyou 工作生活
自信的来源分为两种,一种是源于实力,一种源于头脑.实力是一个综合的评定,有自身的能力,能利用的资源等.比如我想去月亮上,要身体素质过硬,还要有飞船等等一系列的东西.这些都属于实力的一部分.而头脑不同,只要你头脑够简单就可以了!同样要上月亮上,你想,我一跳,1米,我多跳几下,跳个几年,应该就到了!什么?你说我会往下掉?你笨呀你!找个东西踩一下不就行了吗? 无论工作还
WEBLOGIC事务超时设置 bijian1013 weblogic jta 事务超时
系统中统计数据，由于调用统计过程，执行时间超过了weblogic设置的时间，提示如下错误：统计数据出错! 原因：The transaction is no longer active - status: 'Rolling Back. [Reason=weblogic.transaction.internal
两年已过去，再看该如何快速融入新团队 bingyingao java 互联网融入架构新团队
偶得的空闲，翻到了两年前的帖子该如何快速融入一个新团队，有所感触，就记下来，为下一个两年后的今天做参考。时隔两年半之后的今天，再来看当初的这个博客，别有一番滋味。而我已经于今年三月份离开了当初所在的团队，加入另外的一个项目组，2011年的这篇博客之后的时光，我很好的融入了那个团队，而直到现在和同事们关系都特别好。大家在短短一年半的时间离一起经历了一
【Spark七十七】Spark分析Nginx和Apache的access.log bit1129 apache
Spark分析Nginx和Apache的access.log，第一个问题是要对Nginx和Apache的access.log文件进行按行解析，按行解析就的方法是正则表达式： Nginx的access.log解析正则表达式 val PATTERN = """([^ ]*) ([^ ]*) ([^ ]*) (\\[.*\\]) (\&q
Erlang patch bookjovi erlang
Totally five patchs committed to erlang otp, just small patchs. IMO, erlang really is a interesting programming language, I really like its concurrency feature. but the functional programming style
log4j日志路径中加入日期 bro_feng java log4j
要用log4j使用记录日志，日志路径有每日的日期，文件大小5M新增文件。实现方式 log4j: <appender name="serviceLog" class="org.apache.log4j.RollingFileAppender"> <param name="Encoding" v
读《研磨设计模式》-代码笔记-桥接模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 个人觉得关于桥接模式的例子，蜡笔和毛笔这个例子是最贴切的：http://www.cnblogs.com/zhenyulu/articles/67016.html * 笔和颜色是可分离的，蜡笔把两者耦合在一起了：一支蜡笔只有一种
windows7下SVN和Eclipse插件安装 chenyu19891124 eclipse插件
今天花了一天时间弄SVN和Eclipse插件的安装，今天弄好了。svn插件和Eclipse整合有两种方式，一种是直接下载插件包，二种是通过Eclipse在线更新。由于之前Eclipse版本和svn插件版本有差别，始终是没装上。最后在网上找到了适合的版本。所用的环境系统：windows7JDK：1.7svn插件包版本：1.8.16Eclipse：3.7.2工具下载地址：Eclipse下在地址：htt
[转帖]工作流引擎设计思路 comsci 设计模式工作应用服务器 workflow 企业应用
作为国内的同行，我非常希望在流程设计方面和大家交流，刚发现篇好文(那么好的文章，现在才发现，可惜)，关于流程设计的一些原理，个人觉得本文站得高，看得远，比俺的文章有深度，转载如下 ================================================================================= 自开博以来不断有朋友来探讨工作流引擎该如何
Linux 查看内存，CPU及硬盘大小的方法 daizj linux cpu 内存硬盘大小
一、查看CPU信息的命令 [root@R4 ~]# cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id" model name : Intel(R) Xeon(R) CPU X5450 @ 3.00GHz model name :
linux 踢出在线用户 dongwei_6688 linux
两个步骤： 1.用w命令找到要踢出的用户，比如下面： [root@localhost ~]# w 18:16:55 up 39 days, 8:27, 3 users, load average: 0.03, 0.03, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
放手吧,就像不曾拥有过一样 dcj3sjt126com
内容提要：静悠悠编著的《放手吧就像不曾拥有过一样》集结“全球华语世界最舒缓心灵”的精华故事，触碰生命最深层次的感动，献给全世界亿万读者。《放手吧就像不曾拥有过一样》的作者衷心地祝愿每一位读者都给自己一个重新出发的理由，将那些令你痛苦的、扛起的、背负的，一并都放下吧！把憔悴的面容换做一种清淡的微笑，把沉重的步伐调节成春天五线谱上的音符，让自己踏着轻快的节奏，在人生的海面上悠然漂荡，享受宁静与
php二进制安全的含义 dcj3sjt126com PHP
PHP里，有string的概念。 string里，每个字符的大小为byte（与PHP相比，Java的每个字符为Character，是UTF8字符，C语言的每个字符可以在编译时选择）。 byte里，有ASCII代码的字符，例如ABC，123，abc，也有一些特殊字符，例如回车，退格之类的。特殊字符很多是不能显示的。或者说，他们的显示方式没有标准，例如编码65到哪儿都是字母A，编码97到哪儿都是字符
Linux下禁用T440s，X240的一体化触摸板(touchpad) gashero linux ThinkPad 触摸板
自打1月买了Thinkpad T440s就一直很火大，其中最让人恼火的莫过于触摸板。 Thinkpad的经典就包括用了小红点(TrackPoint)。但是小红点只能定位，还是需要鼠标的左右键的。但是自打T440s等开始启用了一体化触摸板，不再有实体的按键了。问题是要是好用也行。实际使用中，触摸板一堆问题，比如定位有抖动，以及按键时会有飘逸。这就导致了单击经常就
graph_dfs hcx2013 Graph
package edu.xidian.graph; class MyStack { private final int SIZE = 20; private int[] st; private int top; public MyStack() { st = new int[SIZE]; top = -1; } public void push(i
Spring4.1新特性——Spring核心部分及其他 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
配置HiveServer2的安全策略之自定义用户名密码验证 liyonghui160com
具体从网上看 http://doc.mapr.com/display/MapR/Using+HiveServer2#UsingHiveServer2-ConfiguringCustomAuthentication LDAP Authentication using OpenLDAP Setting
一位30多的程序员生涯经验总结 pda158 编程工作生活咨询
1.客户在接触到产品之后，才会真正明白自己的需求。　　这是我在我的第一份工作上面学来的。只有当我们给客户展示产品的时候，他们才会意识到哪些是必须的。给出一个功能性原型设计远远比一张长长的文字表格要好。 2.只要有充足的时间，所有安全防御系统都将失败。　　安全防御现如今是全世界都在关注的大课题、大挑战。我们必须时时刻刻积极完善它，因为黑客只要有一次成功，就可以彻底打败你。 3.
分布式web服务架构的演变自由的奴隶 linux Web 应用服务器互联网
最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易
初探Druid连接池之二——慢SQL日志记录 xingsan_zhang 日志连接池 druid 慢SQL
由于工作原因，这里先不说连接数据库部分的配置，后面会补上，直接进入慢SQL日志记录。 1.applicationContext.xml中增加如下配置： <bean abstract="true" id="mysql_database" class="com.alibaba.druid.pool.DruidDataSourc

数学建模中数据处理类型题目的主要处理流程与方法

文章目录

曲线插值与拟合

一维插值

例题1

二维插值

例题2

曲线拟合

多项式拟合

最小二乘拟合

数值微分与积分

数值积分

数值微分

求解常微分方程

标准形式

scipy.integrate.odeint()

求解一阶常微分方程

求解一阶常微分方程组

求解高阶常微分方程组

优化问题

线性规划

基本线性规划

运输问题

指派问题

Scipy指派问题

整数规划

基本定义

基本分类

基本求解方法

分支定界法

割平面法

例题

例题1#

问题定义

模型构建

模型求解

导入PuLP并定义规划问题

定义决策变量

添加目标函数

添加约束条件

求解

数值优化算法

梯度下降法

牛顿法

拟牛顿法

Powel法

Nelder-Mead法

scipy.optimize中的3种限制条件

边界限制

等于限制

大于限制

组合优化算法

模拟退火算法

基本原理

方法

代码

问题假设

问题求解

粒子群算法

基本思想

遗传算法

适用问题

基本概念

蚁群算法

回归分析

相关基础定义

基于python库statsmodels的线性回归

导包

导入（生成）数据

建模与拟合

拟合和统计结果的输出

判别分析

距离判别法

例题3

Fisher判别法

文章目录

曲线插值与拟合

一维插值

例题1

二维插值

`scipy.optimize`中的3种限制条件

基于python库`statsmodels`的线性回归

`scipy.optimize`中的3种限制条件

基于python库`statsmodels`的线性回归