还有你Y

凸优化学习之旅

目录标题

专业名词
MM算法
CCP算法：
- - 代码说明
SCA算法：
连续松弛
- 梯度投影算法
分支定界搜索法
凸问题辨别
OA算法
λ-representation
ADMM算法
- - 代码说明
BCD算法
- - BCD（Block Coordinate Descent）
  - 代码示例
  - 与ADMM的区别
  - 总结

2024年5月6日15:15:26

专业名词

DC问题：Difference of Convex 。Difference理解为差，convex是凸，DC问题就是两个凸函数的差的问题。
SCA：连续凸逼近（Successive Convex Approximation）
MM算法：Minorize-Maximization、Majorize-Minimization
CCP：convex-concave procedure凹凸过程
BCD：Block Coordinate Descent，指的是块坐标下降法
AO：Alternating Optimization交替优化算法
gradient projection method 梯度投影法（解决连续松弛）
非线性规划：目标函数、约束条件至少一个是决策变量的非线性函数。非线性规划问题包括无约束问题与有约束问题。非线性规划问题引入了不等式约束，标志现代规划理论的开始。
无约束最优化：变量轮换法；最速下降法；牛顿法；共轭梯度法；变尺度法
Quadratic programming：二次规划。
inf，sup为下确界与上确界，在约束条件下取不到极值max与min

MM算法

下图为Majorize-Minimization，即求上界的最小值：（构造的g(x)函数为f(x)的上界函数，求g(x)函数的最小值）

CCP算法：

CSDN链接（讲MM和CCP）
知乎链接（讲MM）

每一次要求新构造的可被优化的问题在初始点的值等于原问题在初始点的值，这里一阶泰勒展开是满足的，当 $x={x_0}$
时二者相等。
原问题可以被分解为多个凸的子问题，通过求解这些凸的子问题的最小值，来逼近或得到原问题的驻点。
示例：
凹凸程序 (Convex-Concave Procedure, CCP) 是用于求解 DC 问题的一种启发式算法。DC 问题（Difference of Convex functions problems）指的是目标函数可被分解为两个凸函数的差值的优化问题。它的形式如下：

$min_{x} f(x) - g(x)$
其中 (f(x)) 和 (g(x)) 都是凸函数。

算法思路：
CCP 通过在每次迭代中线性近似凹的部分，并将问题转化为凸问题进行优化。基本步骤如下：

给定初始解 (x^0)。
在第 (k) 次迭代中，线性化凹的部分 (g(x))：
$\approx g(x^k) + \nabla g(x^k)^T (x - x^k)$
解以下凸优化问题：
$x^{k+1} = \arg\min_{x} f(x) - \left( g(x^k) + \nabla g(x^k)^T (x - x^k) \right)$
检查收敛条件，如果满足则停止，否则返回步骤 2。

示例代码1（调用函数）：

以下 Python 代码展示了如何使用 CCP 求解一个 DC 问题的示例：

import numpy as np
from scipy.optimize import minimize

# 定义目标函数
def f(x):
    return np.sum(x**2)

def g(x):
    return np.sum(np.abs(x))

# 定义凹凸部分的差值目标函数
def objective(x, g_grad, x_k):
    return f(x) - (g(x_k) + g_grad.T @ (x - x_k))

# 定义梯度计算
def grad_g(x):
    return np.sign(x)

# 函数来求解 DC 问题
def solve_dc(x0, max_iter=100, tol=1e-6):
    x = x0
    for k in range(max_iter):
        g_grad = grad_g(x)
        x_prev = x
        result = minimize(objective, x, args=(g_grad, x_prev), method='L-BFGS-B')
        x = result.x
        if np.linalg.norm(x - x_prev) < tol:
            print(f'Converged after {k + 1} iterations.')
            break
    return x

# 初始化和求解
x0 = np.array([5.0, -3.0, 2.0, -1.0])
x_opt = solve_dc(x0)
print("Optimal solution:", x_opt)

代码说明

目标函数：
- (f(x))：凸部分的目标函数。
- (g(x))：凹部分的目标函数。
线性化的凹部分目标函数：
- 使用 objective 函数来计算线性化后的目标函数。
梯度计算：
- 使用 grad_g 函数计算凹目标函数的梯度。
CCP 算法：
- solve_dc 函数实现了 CCP 算法，迭代优化目标函数。

示例代码2（手写函数）：

# time: 2024/5/9 10:51
# author: YanJP
import numpy as np

# 定义目标函数
def objective(x):
    return x[0]**2 + x[1]**2

# 目标函数梯度
def grad_objective(x):
    return np.array([2 * x[0], 2 * x[1]])

# 线性化凹部分 d(x, y) 的梯度
def grad_d(x):
    if x[0]**2 > x[1]**2:
        return np.array([x[0], -x[1]])
    else:
        return np.array([-x[0], x[1]])

# 计算线性化后的凸约束部分梯度
def constraint_linearized(x, grad_d, prev_x):
    return 1 - 0.5 * (x[0]**2 + x[1]**2 - grad_d.T @ (x - prev_x))

# 凹凸过程 (CCP) 求解函数
def solve_ccp(x0, max_iter=100, tol=1e-6, step_size=0.1):
    x = x0
    for k in range(max_iter):
        d_grad = grad_d(x)
        grad = grad_objective(x)

        # 线性化凹部分约束
        g_lin = constraint_linearized(x, d_grad, x)

        # 判断线性化后的约束是否满足
        if g_lin > 0:
            x_new = x - step_size * (grad + d_grad)
        else:
            x_new = x - step_size * grad

        if np.linalg.norm(x_new - x) < tol:
            print(f'Converged after {k + 1} iterations.')
            break

        x = x_new

    return x

# 初始值
x0 = np.array([2.0, 2.0])
x_opt = solve_ccp(x0)
print("Optimal solution:", x_opt)
print("Objective value:", objective(x_opt))

SCA算法：

添加链接描述。注意和MM进行对比：SCA 要求近似函数是凸函数而MM要求近似函数在近似点是原函数的upper bound。

连续松弛

51blog

对于松弛优化问题R和原优化问题P，如果满足
- (i)每一个P的可行解在R中也都可行
- （ii）P中每个可行解在R中的目标值与其在P中的目标相比都相等或更好，
  那么优化问题R是优化问题P的松弛。
  
  上图的意思就是：松弛模型提供了原问题最优解的确界(最大值问题是上界，最小问题是下界)。

梯度投影算法

csdn（讲的可以）
比较专业

分支定界搜索法

凸问题辨别

原文链接：

无论是该和速率是作为目标函数，还是作为约束，都不是凸函数的形式，原因是涉及到 log()+log() 的形式，是非凸的。
常见解决方法，是采用迭代的方法，即采用凸差 / 连续凸近似 / MM算法（这三种算法的思想都是类似的），在每次迭代的过程中，用目标函数的下界（此时是凸的,如下图）去替换原来的目标函数，那么，对每次迭代时，新的目标函数都是凸的，且每次的解出的结果都是原函数的下界。且迭代过程期间所得到解是递增的

OA算法

知乎（有代码）

λ-representation

在凸优化中，λ-representation（也称为Lagrange 表示）是一种用于描述凸集的方法。它通过使用一组凸组合的方式来表示凸集，其中每个凸组合的权重由一组非负的 Lagrange 乘子 $\lambda_i$ 决定。λ-representation 是在凸优化理论中广泛应用的概念，特别是在描述凸包、凸锥和凸函数等方面。

λ-representation 的一般形式可以表示为：

$\{ x \in \mathbb{R}^n \ |\ x = \sum_{i=1}^{m} \lambda_i x_i, \ x_i \in C, \ \lambda_i \geq 0, \ \sum_{i=1}^{m} \lambda_i = 1 \}$

其中， $C$ 是凸集， $x_i$ 是 $C$ 中的点， $\lambda_i$ 是非负的 Lagrange 乘子，且满足 $\sum_{i=1}^{m} \lambda_i = 1$ 。这表示 $C$ 中的任意点都可以通过一组凸组合来表示。

λ-representation 的优点之一是它提供了一种紧凑且直观的表示凸集的方式，特别是在某些情况下，当凸集的结构比较复杂或难以直接描述时，λ-representation 可以提供一种简单的方法来描述凸集。

ADMM算法

知乎
基本概念：

ADMM 将优化问题分解成两个或多个更容易求解的子问题，通过引入拉格朗日乘子进行迭代。
其基本思想来源于拉格朗日乘子法和增广拉格朗日函数。

特征：

适用范围：用于带有线性约束和非光滑正则化的优化问题，例如 LASSO 和约束优化问题。
问题分解：将原始问题分解成多个子问题，逐个优化各个变量块。
拉格朗日乘子：通过引入拉格朗日乘子，实现子问题之间的信息共享。
非光滑正则化：能够处理带非光滑正则项的问题（如 L1 正则项）。

公式：
给定优化问题：
$\min_{x, z} f(x) + g(z), \quad \text{s.t.}\ Ax + Bz = c$
ADMM 将其转化为以下形式：

更新 (x)：
$x^{k+1} = \arg \min_x \left( f(x) + \frac{\rho}{2} \|Ax + Bz^k - c + u^k\|_2^2 \right)$
更新 (z)：
$z^{k+1} = \arg \min_z \left( g(z) + \frac{\rho}{2} \|Ax^{k+1} + Bz - c + u^k\|_2^2 \right)$
更新乘子 (u)：
$u^{k+1} = u^k + Ax^{k+1} + Bz^{k+1} - c$
在交替方向乘子法 (ADMM) 中，u 是拉格朗日乘子，z 是引入的辅助变量，用于分解问题。通过 z 和 u，可以将问题分解为更容易处理的子问题。

在 LASSO 问题中，目标函数：
$\min_{\beta} \frac{1}{2} |X\beta - y|_2^2 + \lambda |\beta|_1$
目标函数被拆分成以下两个部分：

子问题 1（更新 (\beta)）：
$\beta^{k+1} = \arg\min_{\beta} \frac{1}{2} \|X\beta - y\|_2^2 + \frac{\rho}{2} \|\beta - z^k + u^k\|_2^2$
子问题 2（更新 (z)）：
$z^{k+1} = \arg\min_{z} \lambda \|z\|_1 + \frac{\rho}{2} \|\beta^{k+1} - z + u^k\|_2^2$
更新 (u)（拉格朗日乘子）：
$u^{k+1} = u^k + (\beta^{k+1} - z^{k+1})$

完整的 Python 实现：

import numpy as np

# 生成随机数据
np.random.seed(0)
m, n = 100, 20
X = np.random.randn(m, n)
beta_true = np.random.randn(n)
y = X @ beta_true + 0.1 * np.random.randn(m)

# ADMM 参数
rho = 1.0
alpha = 1.0
lambda_lasso = 0.1
max_iter = 1000
abs_tol = 1e-4
rel_tol = 1e-3

# 初始值
beta = np.zeros(n)
z = np.zeros(n)
u = np.zeros(n)

# 定义软阈值算子
def soft_threshold(x, kappa):
    return np.sign(x) * np.maximum(np.abs(x) - kappa, 0)

# 预计算常数
X_T_X = X.T @ X
L = np.linalg.cholesky(X_T_X + rho * np.eye(n))

def solve_admm(X, y, lambda_lasso, rho, alpha, max_iter, abs_tol, rel_tol):
    n = X.shape[1]
    beta = np.zeros(n)
    z = np.zeros(n)
    u = np.zeros(n)
    
    X_T_X = X.T @ X
    L = np.linalg.cholesky(X_T_X + rho * np.eye(n))
    L_T = L.T
    
    for k in range(max_iter):
        # 更新 beta
        q = X.T @ y + rho * (z - u)
        beta = np.linalg.solve(L, np.linalg.solve(L_T, q))

        # 更新 z
        z_old = z.copy()
        beta_hat = alpha * beta + (1 - alpha) * z_old
        z = soft_threshold(beta_hat + u, lambda_lasso / rho)

        # 更新 u
        u += beta_hat - z

        # 计算误差
        r_norm = np.linalg.norm(beta - z)
        s_norm = np.linalg.norm(-rho * (z - z_old))
        eps_pri = np.sqrt(n) * abs_tol + rel_tol * max(np.linalg.norm(beta), np.linalg.norm(z))
        eps_dual = np.sqrt(n) * abs_tol + rel_tol * np.linalg.norm(rho * u)

        if r_norm < eps_pri and s_norm < eps_dual:
            break

        if k % 100 == 0:
            print(f'Iteration {k}, r_norm = {r_norm:.4f}, s_norm = {s_norm:.4f}')

    return beta

# 求解 LASSO 问题
beta_est = solve_admm(X, y, lambda_lasso, rho, alpha, max_iter, abs_tol, rel_tol)
print("Estimated coefficients:", beta_est)

代码说明

solve_admm 函数：
- 用 numpy.linalg.solve 求解 \beta 子问题。
- 使用 soft_threshold 函数实现软阈值算子，解决 (z) 子问题。
- 更新拉格朗日乘子 (u)。
soft_threshold 函数：
- 用于执行 L1 正则化的阈值运算。
Cholesky 分解：
- 用于加速 (\beta) 子问题的求解过程。

BCD算法

交替方向乘子法 (ADMM) 和块坐标下降法 (BCD) 都是用于求解优化问题的分解方法，但它们在处理优化问题的方式和应用场景上存在显著区别。以下是两者的主要区别和应用场景：

BCD（Block Coordinate Descent）

基本概念：

BCD 通过逐次优化目标函数的一个子集变量来迭代接近最优解。
每次只更新一个或一组变量（块），保持其他变量固定。

特征：

适用范围：用于目标函数分解成不同块（子集）独立优化的情况。
块分解：问题被分解为多个块，在每个块内优化子问题。
逐块优化：保持其他变量固定，优化目标函数的一部分（通常使用梯度或闭式解）。

公式：
对于优化问题：
$\min_{x} f(x_1, x_2, \ldots, x_k)$
其中 $(x_1, x_2, \ldots, x_k)$ 被划分成 (k) 个块，BCD 的过程如下：

更新第一个块 (x_1)：
$x_1^{k+1} = \arg \min_{x_1} f(x_1, x_2^k, x_3^k, \ldots, x_k^k)$
更新第二个块 (x_2)：
$x_2^{k+1} = \arg \min_{x_2} f(x_1^{k+1}, x_2, x_3^k, \ldots, x_k^k)$
重复对每个块进行更新，直到所有块都更新完成。

代码示例

该Python函数block_coordinate_descent实现了一个基于块坐标下降法（Block Coordinate Descent, BCD）的算法，用于求解具有正定矩阵Hessian的无约束优化问题。具体来说，它最小化的目标函数形式为：
$f(\mathbf{x}) = \frac{1}{2}\mathbf{x}^T\mathbf{Q}\mathbf{x} + \mathbf{c}^T\mathbf{x}$
其中， $(\mathbf{Q})$ 是一个正定矩阵， $\mathbf{c}$ 是一个常数向量，而 $\mathbf{x}$ 是我们要找的向量解。以下是函数详细步骤的分解：
输入参数说明：

Q (np.ndarray): 正定矩阵，定义了目标函数的二次项。
c (np.ndarray): 向量，定义了一次项系数。
max_iter (int, 默认为1000): 最大迭代次数。
tol (float, 默认为1e-5): 收敛容差，当连续两次迭代解之间的L2范数差小于这个值时，认为算法已收敛。
函数执行流程：
初始化: 初始化解向量 (\mathbf{x}) 为全零向量，长度与 (\mathbf{c}) 相同。
迭代过程:
对于每个迭
代次数 iteration（从0到max_iter-1）：保存旧解: 复制当前解 $\mathbf{x}$ 到
$\mathbf{x}_{old}$ ，用于后续的收敛性检查。循环更新坐标: 遍历每个坐标 (i)（从0到n-1，其中 n = len(c)）：计算梯度分量: 计算目标函数在第 (i) 个坐标上的导数分量，这涉及到矩阵 $\mathbf{Q}$ 的对角元素 $Q_{ii}$ ，以及与其余坐标相关的线性组合。
更新坐标值: 根据计算出的梯度分量，使用封闭形式的解来直接更新 $\mathbf{x}[i]$ 。
检查收敛: 计算新解 $\mathbf{x}$ 与旧解 $\mathbf{x}_{old}$ 之间的L2范数差，若差值小于预设的 tol，则认为算法已收敛，并打印收敛信息，包括迭代次数，然后跳出循环。返回结果: 如果达到最大迭代次数仍未收敛，也会返回最后的解 $\mathbf{x}$ 。

特点与适用场景：
优点: BCD方法特别适合处理大规模优化问题，因为它每次只更新一个坐标，减少了每轮迭代的计算复杂度，尤其是在 $\mathbf{Q}$ 是稀疏或具有特殊结构时。
适用性: 适用于具有大量变量但可以有效独立处理各个变量的优化问题，如稀疏信号恢复、机器学习中的正则化问题等。
综上所述，此函数提供了一个高效求解特定形式优化问题的实现，利用了块坐标下降法的迭代更新策略，旨在找到使目标函数取最小值的向量 $\mathbf{x}$ 。
更新公式: 根据牛顿法或梯度下降法，我们可以写出 (x_i) 的更新规则，即减去梯度方向上的一步大小。这里的目标函数关于 (x_i) 的梯度是 $(-Q_{ii}x_i - c_i - \sum_{j\neq i} Q_{ij}x_j)$ 。将 $x_i)$ 从梯度中分离出来，得到上述更新规则，即 (x_i) 的新值等于旧值乘以 (-1)，再除以 $Q_{ii})$ ，并加上 $Q_i^{rest} * x_i^{rest} + c_i$ 的相反数

更新第 i 个坐标
x[i] = - (Q_i_rest @ x_i_rest + c_i) / Q_ii

与ADMM的区别

问题性质：
- ADMM：用于含线性约束和非光滑目标的问题（L1 正则化、线性约束）。
- BCD：通常用于目标函数可分解为多个块的优化问题。
解的精度：
- ADMM：引入乘子进行拉格朗日松弛，更适用于收敛到全局最优解。
- BCD：块坐标更新容易陷入局部最优解。
迭代方式：
- ADMM：同时引入乘子变量，通过增广拉格朗日函数更新。
- BCD：逐个块逐次优化变量子集。
应用场景：
- ADMM：适用于 LASSO、约束优化、矩阵分解等问题。
- BCD：用于线性回归、聚类、SVM 优化等问题。

总结

ADMM 和 BCD 在处理复杂的优化问题时具有不同的优缺点和适用场景。选择合适的算法可以更好地解决优化问题。

大白话解释深度学习中多尺度特征融合及其意义来自宇宙的曹先生深度学习人工智能
想象一下，你正在看一幅城市街道的照片。在这张照片中，你可能会看到：远处的小汽车，它们在图像中看起来很小。近处的大巴士，它们在图像中看起来很大。还有一些行人，他们可能在不同的距离上，大小各异。假设你想训练一个计算机程序来识别和分割这些不同的物体（汽车、巴士、行人）。如果这个程序只能在一个固定的尺度上“看”图像，比如说只能处理大物体，它可能会错过那些远处的小汽车，因为这些小汽车在图像中占据的像素很少。
SpringBoot多数据源动态切换方案：AbstractRoutingDataSource详解 fanxbl957 Web spring boot 后端 java
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人SpringBoot多数据源动态切换
大学生HTML期末大作业——HTML+CSS+JavaScript传统文化无·糖 Web前端期末大作业 html 课程设计 css 大学生前端大作业期末作业
HTML+CSS+JS【传统文化】网页设计期末课程大作业web前端开发技术web课程设计网页规划与设计文章目录一、网站题目二、网站描述三、网站介绍四、网站效果五、️网站代码六、️‍如何学习进步七、‍☠️更多干货文章目录一、网站题目传统文化精美设计5页含注册登录二、网站描述总结了一些学生网页制作的经验：一般的网页需要融入以下知识点：div+css布局、浮动、定位、高级css、表格、表单及验证、js轮
汇编语言:基于x86处理器第一章习题解答「已注销」 Linux 内核资深专家 arm
汇编语言习题解答习题解答1.1.3本节回顾习题解答1.1.3本节回顾1、汇编器和链接器是如何一起工作的？汇编程序要转化为可执行程序，需要先译码后组合。这是因为一个完整的汇编程序常常是由多个文件构成，先用汇编器将每一个文件中的汇编代码转化为机器语言后，链接器再把这些文件组合成一个可执行程序。2、学习汇编语言如何能提高你对操作系统的理解？可用汇编语言验证操作系统的理论知识，从而更深刻的掌握操作系统3、
Git学习和使用 mayue_csdn 工具 git
文章目录5.2.gitmodules用法5.2.1.gitmodules用法5.2.2纯本地用法5.2.3gitsubmoduleinit5.2.4gitclone子分支不是最新（有的是有的不是、配置没指定）检查子模块状态更新子模块重新初始化子模块清理和重新克隆检查SSH密钥和权限使用最新版本的Gitgitclone指定分支一、Git介绍1.2Git使用教程1.3Git查看和设置用户名和邮箱二、G
stack_queue扩展学习 --- 反向迭代器茉莉玫瑰花茶 C++反向迭代器 C/C++
反向迭代器的实现思路源码及框架分析迭代器是用来遍历容器的，是一种封装，它不需要去关注容器的底层实现（底层是数组，链表，还是树等等这些结构），我们都是用统一的方式去对容器进行访问，访问行为是类似指针的。我们之前学习了普通迭代器和const迭代器：普通迭代器：能读能写；const迭代器：只能读，只能遍历数据，得到数据，不能修改数据，是不能写的。我们之前学的普通迭代器是正向迭代器，如果我想逆方向遍历呢？
Java技术栈/面试题合集(16)-SpringCloud篇霸道流氓气质 Java进阶 Java SpringCloud 微服务面试
场景Java入门、进阶、强化、扩展、知识体系完善等知识点学习、性能优化、源码分析专栏分享：Java入门、进阶、强化、扩展、知识体系完善等知识点学习、性能优化、源码分析专栏分享_java高级进阶-CSDN博客通过对面试题进行系统的复习可以对Java体系的知识点进行查漏补缺。注：博客：霸道流氓气质-CSDN博客实现什么是SpringCloud？一、SpringCloud的核心定位1.定义SpringC
想要了解大模型，看懂这一篇就够了！大模型工作流程及核心参数介绍！ Gq.xxu qwen3 vllm transforms 大语言模型部署深度学习人工智能
若想深入探究大模型核心参数的效果与作用，就务必先弄清大模型的工作流程，明确核心参数在流程各阶段的效能与功能，知晓其具体含义。一，大模型的工作流程大模型运行时的工作原理可以概括为输入处理→特征提取→模型推理→结果生成四个核心阶段，整个过程融合了深度学习架构、自然语言处理技术以及分布式计算能力。从用户输入到大模型输出，整个工作的处理流程如下：输入文本→分词→嵌入+位置编码→Transformer多层处
【初阶学习Linux】初识Linux 鳄鱼皮坡 linux 学习运维开发语言
1.Linux背景介绍发展史:本门课程学习Linux系统编程，你可能要问Linux从哪里来？它是怎么发展的？在这里简要介绍Linuxs的发展史。要说Linux，还得从UNIX说起。UNIX发展的历史：1968年，一些来自通用电器公司、贝尔实验室和麻省理工学院的研究人员开发了一个名叫Multics的特殊操作系统。Multics在多任务文件管理和用户连接中综合了许多新概念。1969－1970年，AT&
LSTM 论文（Hochreiter & Schmidhuber, 1997）精读（三）
文章：SeppHochreiter,JürgenSchmidhuber;LongShort-TermMemory.NeuralComput1997;9(8):1735–1780.doi:https://doi.org/10.1162/neco.1997.9.8.1735第2节PreviousWork（已有研究），这是论文对以往方法的一个评述，总结了已有递归神经网络在面对时间序列学习、尤其是长时依赖
R 语言操作csv文件详解
在R中，我们可以从R环境外部存储的文件中读取数据。我们还可以将数据写入将由操作系统存储和访问的文件中。R可以读取和写入各种文件格式，如csv、excel、xml等。在本章中，我们将学习从csv文件读取数据，然后将数据写入csv文件。该文件应存在于当前工作目录中，以便R可以读取它。当然我们也可以设置自己的目录并从那里读取文件。获取和设置工作目录您可以使用**getwd()函数检查R工作区指向哪个目录
深度学习-Tensor
Tensor张量：与numpy中的ndarray不同之处：tensor可以在GPU或其他专用硬件上运行，以加速计算。一、Tensor初始化1.直接从数据中创建data=[[1,2],[3,4]]x_data=torch.tensor(data)2.从numpy数组创建np_array=np.array(data)x_np=torch.from_numpy(np_array)3.从另一个Tensor
在WPF中使用CommunityToolkit.Mvvm——（一）为什么使用CommunityToolkit.Mvvm 永远的久远 wpf
前言阅读我文章的同学可能已经发现了，我总是会在一个系列文章的第一篇抛出问题，为什么要用到这个技术。因为一些成熟的库和技术会给我们带来生产力大幅的提升，同时通过学习一些优秀的开源项目，对我们个人的能力提升也会有帮助。接下来我们一起来看一下MVVMToolkit能为我们带来哪些惊喜～～CommunityToolkit.Mvvm是什么微软的官方文档这样介绍的CommunityToolkit.Mvvm包（
ubuntu上编译fastDDS库源码并运行hellworld示例程序的流程
1.介绍1.1.目的本文是关于自己了解、学习、并使用fastDDS中间件的文章，描述了在ubuntu18.04上从下载源码到安装运行hellworld的整个流程，本文章为亲身实践，有问题请私信沟通1.2.FastDDS介绍eProsimaFastDDS是一个独立的cpp中间件实现，提供OMGDDS1.4和OMGRTPS2.2可互操作的有线协议标准，是一款免费和开源软件（ApacheLicense2
《沟通力》：沟通力到底藏着多少不为人知的秘密？只因在人海中多看了你一眼个人成长学习
创作背景本文旨在通过多种沟通模型提升个人和团队的沟通能力。《沟通力》强调通过不同的沟通模型，提升沟通的效果和效率。阅读动机提升沟通能力：通过学习不同的沟通模型，提高日常交流的效果。优化工作表现：在职场中更好地表达自己，提高团队协作效率。增强人际关系：改善与家人、朋友的关系，建立更和谐的人际环境。核心概念与方法论1.沟通漏斗效应核心概念：沟通过程中，信息从发送者到接收者会逐渐减少，导致信息失真。方法
从0开始学习R语言--Day41--Moran‘s I Chef_Chen 学习
在处理带有空间特征的数据，我们往往都直接一股脑地处理数据点，但很多时候，空间上的信息对于处理后续衍生出来的问题会有很大帮助，例如对于城市里大小县城的发展情况，只知道单一县城的经济发展曲线，很难解释一些拐点和突然的攀升，而如果知道相邻县城存在经济发展飞快的例子，可能就是被带动了经济水平；亦或者是在处理社交网络的好有问题时，只知道谁和谁是朋友（类似于空间矩阵），是无法推断出经济收入相似的推论的，所以说
Flutter-完整开发实战详解(一、Dart-语言和-Flutter-基础) 2401_85122662 flutter
《Android学习笔记总结+最新移动架构视频+大厂安卓面试真题+项目实战源码讲义》完整开源地址：https://docs.qq.com/doc/DSkNLaERkbnFoS0ZF基本类型var可以定义变量，如vartag=“666”，这和JS、Kotlin等语言类似，同时Dart属于动态类型语言，支持闭包。Dart中number类型分为int和double，其中java中的long对应的也是Da
从0开始学习计算机视觉--Day08--卷积神经网络
之前我们提到，神经网络是通过全连接层对输入做降维处理，将输入的向量通过矩阵和激活函数进行降维，在神经元上输出激活值。而卷积神经网络中，用卷积层代替了全连接层。不同的是，这里的输入不再需要降维，而是可以保留输入的空间结构，例如输入的是32×32×3的图片，在全连接层中是3072×1的向量，而卷积层里则保持不变。这里的改变的地方是对于同样的WX的函数形式，这里是把5×5×3的权重矩阵（也叫卷积核）向量
UniApp的学习 xuzhihuan焕 uni-app 学习
一.Vue.js基础基本概念：总之，Vue.js是一个简洁、灵活、高效的前端JavaScript框架，具有响应式数据绑定、组件化开发、虚拟DOM等特点，适用于构建各种类型的Web应用。Vue.js介绍：了解Vue.js的起源、特点以及基本概念。特点：简洁易用：Vue.js的API简洁明了，学习曲线较为平缓，使得开发者能够快速上手。响应式数据绑定：Vue.js提供了响应式的数据绑定机制，当数据发生变
java中打印sql,利用JDBC的PrepareStatement打印真实SQL的方法详解 weixin_39878549 java中打印sql
前言本文主要给大家介绍了关于利用JDBC的PrepareStatement打印真实SQL的相关内容，分享出来供大家参考学习，下面来一起看看详细的介绍：我们知道，JDBC的PrepareStatement优点多多，通常都是推荐使用PrepareStatement而不是其基类Statment。PrepareStatement支持?占位符，可以将参数按照类型转自动换为真实的值。既然这一过程是自动的，封装
基于存算一体架构的实时深度学习推理优化瑕疵热点资讯架构深度学习人工智能
博客主页：瑕疵的CSDN主页Gitee主页：瑕疵的gitee主页⏩文章专栏：《热点资讯》基于存算一体架构的实时深度学习推理优化基于存算一体架构的实时深度学习推理优化基于存算一体架构的实时深度学习推理优化引言存算一体架构的核心优势1.能效比突破2.实时性保障架构设计与实现技术1.存储单元创新2.硬件加速器设计3.电路级优化深度学习推理优化策略1.模型压缩技术2.硬件-软件协同优化3.运行时调度典型应
每日学习问题记录
提交版本的时候一定注意，你改动的UI后一定要提交相关的文件，比如你的导出文件和UI图片，还有你改动的脚本文件。.血量更新机制立即更新(UpdateBossHpImmediate())//计算血条相关数值float hpPerBar = (float)maxHp / m_BossHpNum; // 每一条血条代表的血量值float totalHpBars = currentHp / hpPerBar
2024年最新4大典型安全漏洞是怎么来的？如何解决？，【2024网络安全最新学习路线】 2401_84297193 程序员 web安全学习网络
还有兄弟不知道网络安全面试可以提前刷题吗？费时一周整理的160+网络安全面试题，金九银十，做网络安全面试里的显眼包！王岚嵚工程师面试题（附答案），只能帮兄弟们到这儿了！如果你能答对70%，找一个安全工作，问题不大。对于有1-3年工作经验，想要跳槽的朋友来说，也是很好的温习资料！【完整版领取方式在文末！！】93道网络安全面试题内容实在太多，不一一截图了黑客学习资源推荐最后给大家分享一份全套的网络安全
在学校研究学习的偏算法，秋招投递开发岗位还有希望吗程序员
前言Thelasttime,Ihavelearned这是星球同学，在周五晚上答疑聊天的时候对我的提问：如果简历上的项目偏算法，但是自学了一些操作系统和计网的知识，秋招的时候投递偏开发的岗位有希望吗？简历上是否也要加上相关项目？估计也是很多朋友的疑问，毕竟很多同学读研，有些老师疯狂push，要成果，发论文。要想尽快发论文，那只能“研究”人工智能、算法的一些东西了。但是众所周知，算法要求很高，不仅要求
AlphaEvolve：谷歌的算法进化引擎 | 从数学证明到芯片设计的AI自主发现新纪元大千AI助手人工智能 Python #OTHER 算法人工智能深度学习 AlphaEvolve google gemini
AlphaEvolve：谷歌的算法进化引擎|从数学证明到芯片设计的AI自主发现新纪元——结合大语言模型与进化计算，重塑科学发现与工程优化的通用智能体本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！⚙️一、核心定义与技术架构AlphaEvolve是由谷歌DeepMind开发的通用科学AI智能体，其核心
python namedtuple转为dict 链池 python 开发语言
python相关学习资料：搭建私人助理大模型需要什么环境？006_指法标准_键盘正位_你好世界_hello_world_单引号_双引号一张图生成指定动作的动态视频,MagicAnimate本地部署Pythonnamedtuple转为dict的方法作为一名经验丰富的开发者，我很高兴能够帮助刚入行的小白们解决编程问题。今天，我们将一起学习如何将Python中的namedtuple转换为dict。这个过
C# 项目卷纸要用清风的 C#c#开发语言
语言基础开发环境与工具框架与库数据库与数据存储项目架构与设计模式前端技术（全栈开发场景）版本控制与协作测试与质量保障部署与运维安全实战项目建议学习资源推荐总结语言基础C#语法：变量、数据类型、控制流（条件语句、循环）、运算符、异常处理（try-catch）等。面向对象编程（OOP）：类与对象、继承、多态、封装、接口、抽象类。高级特性：委托（Delegate）与事件（Event）LINQ（Langu
2025 年机器学习工作流程的 7 个 AI 代理框架盖瑞理 AI Agent 人工智能
介绍机器学习从业者花费大量时间在重复性任务上：监控模型性能、重新训练流程、检查数据质量以及跟踪实验。虽然这些操作任务至关重要，但它们通常会占用团队60%到80%的时间，几乎没有留下任何创新和模型改进的空间。传统的自动化工具可以处理简单的、基于规则的工作流程，但它们难以应对机器学习操作所需的动态决策。何时应该根据性能漂移重新训练模型？当数据分布发生变化时，如何自动调整超参数？这些场景需要能够推理复杂
我与C语言二周目邂逅vlog—1.熟悉而又陌生-初识C语言 hope kc c语言开发语言
如题，在下是一名大二学生，希望改过自新，重新学习C语言（同时也在学习数据结构，希望各位大佬多多指教）1.C语言的历史C语言最初作为Unix系统的开发工具而发明的。如今成为一种高级语言，可谓C生万物2.编译与链接C语言代码是放在.c为后缀的文件里，.c为后缀的文件称为源文件，.c本身就是文本文件，无法直接运行，所以要得到最终运行的可执行程序，中间要经过编译和链接两个过程。3.VS项目的创建打开VS时
学习笔记：oracle online系列：oracle：Per-Process PGA memory limit 认真就输DBA Oracle 学习随笔学习笔记 oracle
我们的文章会在微信公众号IT民工的龙马人生和博客网站(www.htz.pw)同步更新，欢迎关注收藏，也欢迎大家转载，但是请在文章开始地方标注文章出处，谢谢！由于博客中有大量代码，通过页面浏览效果更佳。本文转自朋友的真实案例分享。oracleonline系列：oracle：Per-ProcessPGAmemorylimit前几日，东区某客户的19crac出现了ORA-04030，从报错的trace来
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end

凸优化学习之旅

目录标题

专业名词

MM算法

CCP算法：

代码说明

SCA算法：

连续松弛

梯度投影算法

分支定界搜索法

凸问题辨别

OA算法

λ-representation

ADMM算法

代码说明

BCD算法

BCD（Block Coordinate Descent）

代码示例

与ADMM的区别

总结

你可能感兴趣的:(最优化,学习)