Set_____

【论文笔记】Towards Certifying l-infinity robustness using neural networks with l-infinity-dist neurons

引流　https://www.cnblogs.com/setdong/p/16456887.html

原文地址

slides

GitHub 代码

本文发表于 2021 ICML，提出了一个新颖的神经网络计算方式：对于网络中的每个神经元，不采用传统的线性转换+非线性激活函数的方式，而是计算输入与参数之间的 $\ell_{\infty}$ -distance，作者将其称为 $\ell_{\infty}$ -dist net，网络中的神经元称为 $\ell_{\infty}$ -dist neuron。作者理论证明了 $\ell_{\infty}$ -dist net 具有很好地表达能力（expressivity）和泛化能力（generalization ability），还给出了 $\ell_{\infty}$ -dist net 在训练中的优化策略。 $\ell_{\infty}$ -dist net 还可以作为特征提取器与其他模型结构（如卷积网络）结合使用，实验发现这样的设计在很多数据集上都能获得很好的 certified robustness。

1. $\ell_{\infty}$ -dist net

1.1) Preliminaries

问题描述 考虑一个标准的分类任务：

样本 $\in \mathcal{X}$ 和相应标签 $y\in\mathcal{Y}=\{1,...,M\}$ 的数据分布为 $\mathcal{D}$ ， $\mathcal{D}$ 通常是已知的。
训练集为 $\tau=\{(x_1,y_1),...,(x_n,y_n)\}$ ，其中 $x_i,y_i)$ i.i.d. 取自分布 $\mathcal{D}$ 。
$f:x\in\mathcal{X}\rightarrow \mathcal{Y}$ 是分类器。
$x'=x+\delta$ 是对抗样本。
扰动约束： $\epsilon$ -bounded $\ell_\infty$ -norm constraint（或称为 $\ell_\infty$ 扰动），即 $||\delta||_\infty \leq \epsilon$ 。

任务目标： 使用训练集 $\tau$ 学习一个模型，该模型可以抵抗带有任意 $\ell_\infty$ 扰动的样本 $(x, y)$ ，其中 $(x,y)\sim \mathcal{D}$ 。

这需要计算以 $x$ 为中心的、不会改变 $f$ 对它预测的 $\ell_\infty$ -ball 的最大半径（称为 robust radius）：
$\left\{\begin{matrix} \inf_{f(x')\neq f(x)} ||x'-x||_\infty & ,f(x)=y\\ 0& ,f(x)\neq y \end{matrix}\right. \tag{1}$
但对于标准的 DNNs，robust radius 很难计算，所以转为计算 $R (f; x, y)$ 的下限 $CR (f; x, y)$ ，称为 certified radius。对于任意的 $f, x, y$ 有 $CR(f;x,y)\leq R(f;x,y)$ 。

1.2) $\ell_{\infty}$ -dist neurons

图1的左图是传统的卷积神经元计算方式（线性变换+非线性激活函数），右图是 $\ell_{\infty}$ -dist neuron 的计算方式：
$u(x,\theta)=||x-w||_\infty + b \tag{2}$
其中 $\theta = \{w,b\}$ 是参数集合。公式（2）本身就是非线性的，所以不需要像传统网络那样添加一个激活函数 $\sigma$ 。传统神经元使用点积计算来度量 $x$ 与 $w$ 之间的相似度（similarity），同样地， $\ell_{\infty}$ -dist neuron 使用距离公式作为度量，且距离是非负数，值越小表示相似度越强。

1.3) MLP networks using $\ell_{\infty}$ -dist neurons

考虑将 $\ell_{\infty}$ -dist neurons 应用于最简单的模型结构 MLP：

定义一个 $L$ 层的 $\ell_{\infty}$ -dist net：假设第 $l$ 个隐藏层有 $d_l$ 个隐藏单元，网络的输入为 $x^{(0)}\triangleq x \in \mathbb{R}^{d_{input}}$ ，第 $l$ 个隐藏层中的第 $k$ 个神经元的输出为：
$x_k^{(l)}=u(x^{(l-1)},\theta^{(l,k)})=||x^{(l-1)}-w^{(l,k)}||_\infty+b^{(l,k)} \tag{3}$
其中 $x^{(l)}=(x^{(l)}_{1},x^{(l)}_{2},...,x^{(l)}_{d_{l}})$ 为第 $l$ 层的输出， $\leq l\leq L$ ， $\leq k \leq d_l$ 。

对于 1.1 节描述的分类任务，输出维度 $d_L$ 等于类别 $M$ 。取网络最后一层的输出的负数用于预测，即 $g(x)=(-x^{(L)}_1,-x^{(L)}_2,...,-x^{(L)}_M)$ ，预测输出为 $\arg\max_{i\in [M]}g_i(x)$ 。与标准网络一样，可以对 $\ell_{\infty}$ -dist net 使用任何标准的损失函数，比如交叉熵或 hinge loss。

1.4) 1-Lipschitz w.r.t. $\ell_{\infty}$ -norm

这节首先证明 $\ell_{\infty}$ -dist net 就是 1-Lipschitz w.r.t. $\ell_{\infty}$ -norm；然后根据这一性质推导出模型的 certified robustness。

定义： 如果函数 $g(z):\mathbb{R}^{m} \rightarrow \mathbb{R}^{n}$ 对任意 $z_1,z_2$ 都满足下式，则 $g (z)$ 被称为 $\lambda$ -Lipschitz w.r.t. $\ell_{p}$ -norm ( $||\cdot||_p$ )：
$||g(z_1)-g(z_2)||_p\leq\lambda||z_1 - z_2||_p$

Fact 1： $\ell_{\infty}$ -dist net $g(\cdot)$ 是 1-Lipschitz w.r.t. $\ell_{\infty}$ -norm，即对任意 $x_1,x_2 \in \mathbb{R}^{d_{input}}\;\;$ 都有 $||g(x_1)-g(x_2)||_\infty\leq||x_1 - x_2||_\infty$ .
Proof 1： 网络中每个神经元的计算(即公式3)是 1-Lipschitz → 从 $x^{(l)}$ 到 $x^{(l+1)}$ (层到层)的映射是 1-Lipschitz → 整个网络是 1-Lipschitz。

因此，当扰动很小时，输出的变化是有界的，直接约束了 certified radius。

Fact 2： 设 ${\rm margin}(x;g)$ 是输出向量 $g (x)$ 中最大元素和第二大元素之间的差，那么对于任意 $x^{'}$ 满足 $||x-x'||_\infty < {\rm margin}(x;g)/2$ ，有 $f (x) = f (x^{'})$ 。即：
$CR(f,x,y)\geq {\rm margin}(x;g)/2 \tag{4}$
Proof 2： $g (x)$ 是 1-Lipschitz，因此当将输入从 $x$ 变为 $x^{'}$ 时，模型输出 $g (x)$ 中的每个元素移动不超过 ${\rm margin}(x;g)/2$ ，那么最大的元素（即预测的类）是不变的。

使用 Fact 2 中的 bound，仅需一次正向传播就能够计算 $\ell_{\infty}$ -dist net 的 certified robustness，计算成本小。

2. $\ell_{\infty}$ -dist net 的训练

经验发现传统网络训练方法并不适用于 $\ell_{\infty}$ -dist net，对此作者提出了一系列相应的优化策略。

2.1) Normalization

问题： 传统网络的线性层的输出是无偏的 unbiased(期望均值为0)，而 $\ell_{\infty}$ -dist neuron 的输出是有偏的 biased(假设没有bias项 $b$ ，总是非负的)。这会导致每层的输出会随层数增加而线性增长。

解决方法：
考虑 Batch Normalization (BN)，BN 使用 shift 和 scale 两个操作，但若直接在 $\ell_{\infty}$ -dist net 中使用 BN 会导致 Lipschitz 常数发生变化(由于 scale 操作)，从而无法保证模型的鲁棒性。

不过作者发现，只使用 shift 操作有助于优化，因此在所有的中间层计算完距离后添加 shift 操作，并移除了 bias 项 $b$ （冗余了），但最后一层不做 normalization。与 BN 类似，在 inference 时使用 running mean。

2.2) Smoothed Approximated Gradients

问题： $\ell_{\infty}$ -dist 的梯度向量(如 $\triangledown_w ||z-w||_\infty $ 和 $\triangledown_z ||z-w||_\infty$ )十分稀疏，通常只包含一个非零元素。通过实验观察到，如果直接使用 SGD/Adam 训练(随机初始化的) $\ell_{\infty}$ -dist net，那么在每个 epoch 中，只有不到 1% 的参数在更新。

解决方法：
用 $\ell_{p}$ -dist neuron 替换整个网络的神经元，取得近似的 & 非稀疏的参数梯度。在训练中，最开始时将 $p$ 设置为一个很小的值，在接下来的每次迭代中不断增加 $p$ 的值，直到逼近无穷。在最后几次 epochs 中，将 $p$ 设置为无穷。

2.3) Parameter Initialization

问题： 深层模型的训练准确率比浅层模型的差

解决方法：
参考 ResNet ，可以在初始化 weights 和 biases 时直接构建恒等映射(identity mapping)。具体来说，对于输入-输出维度相同的 $\ell_{\infty}$ -dist layer，首先用标准高斯分布随机初始化 weights，然后将对角元素（即公式3中的 $w^{(l,j)}_j$ ， $l$ 层第 $j$ 个神经元与 $l - 1$ 层第 $j$ 个神经元之间的weight）修改为一个很大的负数 $C_0$ 。在实验中作者设置 $C_0 = -10$ 。当应用了 mean shift normalization 后，不再需要添加偏差 biases，并且 running mean 会自动进行恒等映射。

2.4) Weight Decay

问题： 将 Weight Decay 应用到 $\ell_{\infty}$ -dist net 会使模型的性能变差，可能是由于 Weight Decay 与 $\ell_{\infty}$ -norm 不兼容。

解决方法：
传统网络的计算方式是点积，所以权重的 $\ell_{2}$ -norm 可以控制输出的大小。而 $w||_2$ 与 $\ell_{\infty}$ -dist layer 的输出大小无关。所以对于 Weight Decay Regularizer，可以用 $||w||_{\infty}$ 取代 $w||_2$ 。类似于 $\left \langle x,w \right \rangle \leq ||x||_2||w||_2$ ，我们有 $||x-w||_\infty \leq ||x||_\infty + ||w||_\infty$ 。

对于训练中的 $\ell_p$ -dist neurons，使用 $\ell_p$ -norm regularization。通过对权重 $w$ 的求导，有关权重的 weight decay 公式为：
$\triangle_{w_{i}}=-\lambda \triangledown_{w_{i}}||w||^2_p=-\lambda\left ( \frac{|w_i|}{||w||_p}\right )^{p-2}w_i \tag{5}$
其中 $\lambda$ 是 weight decay 的系数，当 $p\rightarrow \infty$ 时，weight decay 往往只对绝对值最大的元素 $w_i$ 产生影响。

3. 实验

3.1) 实验设置

四个基准数据集：MNIST, Fashion-MNIST, CIFAR-10, TinyImagenet
> 模型配置：
主要研究两种模型：1) 仅 $\ell_\infty$ -dist net；2) $\ell_\infty$ -dist net + MLP： $\ell_\infty$ -dist net 作为特征提取器。

对于 MNIST 和 Fashion-MNIST，使用 5 层 $\ell_\infty$ -dist net；对于 CIFAR-10 和TinyImageNet，使用 6 层 $\ell_\infty$ -dist net。
每个隐藏层包含 5120 个单元。
每个中间层都应用 normalization。
Top 层包含 10 个单元 (TinyImageNet 为 200 个单元)
对于 $\ell_\infty$ -dist net + MLP，移除 top 层，并添加传统的全连接层，隐藏层包含 512 个单元，且添加了 tanh 激活函数。

> 训练配置:

optimizer: 使用 Adam, 其中 $\beta_1 = 0.9, \beta_2 = 0.99, \epsilon = 10^{-10}$ .
data augmentation: 对于 MNIST 和 Fashion-MNIST, 使用随机剪裁 random crop (padding = 1); 对于 CIFAR-10，使用随机剪裁 (padding = 4) 和 random horizontal flip; 对于 TinyImageNet，使用 random horizontal flip, 训练中将每张图剪裁到 $ 56 \times 56$ 像素，测试中使用中心剪裁 center crop.
损失函数: 对于 $\ell_\infty$ -dist net, 使用 hinge loss, threshold 超参数 $t$ 取决于 $\epsilon$ ; 对于 $\ell_\infty$ -dist net + MLP, 使用 IBP loss, 涉及两个超参数 $\kappa, \epsilon_{train}$ .
训练过程: 首先, 用 $\ell_p$ 代替 $\ell_\infty$ , 并令 $p = 8$ ，此时训练 $e_1$ 个 epochs; 然后逐渐将 $p$ 从 $8$ exponentially 增大到 $1000$ , 此时训练 $e_2$ 个 epochs; 最后将 $p$ 设为无穷, 此时训练 $e_3$ 个 epochs. 其中 $e_1,e_2,e_3$ 是超参数, 不同数据集设置的值不同.
$e_1$ epochs 中 $l r = 0.02$ , 在接下来的 $e_2,e_3$ epochs 中使用 cosine annealing 降低学习率.
weight decay: $\lambda=0.005$ . 对于 $\ell_\infty$ -dist nets, 使用 $\ell_p$ -norm weight decay; 对于 MLP, 使用 $\ell_2$ -norm weight decay.

> Evaluation:
使用两种指标来评估模型的 robustness: 1) robust test accuracy: 使用 PGD 攻击, 攻击步长设为 $20$ ; 2) certified radius: 计算每个样本的 CR, 并计算在 CR 内的测试样本的百分比. Note: 第二个指标始终 lower than 第一个指标.

> Baselines:
对比了先进的方法, 包括: 1) relaxation methods: CAP, PVT, DiffAI, IBP, CROWN-IBP, CROWN-IBP with loss function, COLT; 2) Lipschitz networks: GroupSort.

3.2) 实验结果:

“Test” 表示干净样本的测试准确率; “Robust” 表示PGD 样本的测试准确率; “Certified” 表示 certified robust 测试准确率. “FLOPs” 表示前向传播中所需的基本浮点运算的数量 (即传统网络中的点积和加法或 $\ell_\infty$ -dist net 中的减法).

> General profermance of $\ell_\infty$ -dist net
从表 1 中可以看到，单独使用 $\ell_\infty$ -dist net 已经在所有数据集上获得了不错的 certified accuracy. 尤其是, 在 CIFAR10 数据集上达到了最好的 certified accuracy，且获得了比其他方法更高的标准准确率(干净样本).
Note: 只使用标准损失函数来训练 $\ell_\infty$ -dist net, 无需任何对抗训练。

> General profermance of $\ell_\infty$ -dist net + MLP
如表1和表2, 对于所有数据集， $\ell_\infty$ -dist net + MLP 比单独的 $\ell_\infty$ -dist net 获得了更好的 certified accuracy.

> Efficiency
如表4, 训练和 certification 都很快. 训练 $\ell_\infty$ -dist net 的计算成本与训练相同大小的常规网络大致相同，并且 certification 过程只需要一次向前传播 forward pass.

> 与 GroupSort Network 对比
由于 GroupSort 也使用了1-Lipschitz 且使用标准损失函数训练即可(不需要对抗训练), 作者特别地将这两个模型进行了比较. 在 GroupSort Network 中，所有权重矩阵 $W$ 都被限制为 bounded $\ell_\infty$ -norm，即 $||W||_\infty \leq 1$ ，这导致了耗时的 projection 操作, 带来了优化难度，进一步限制了网络结构的可扩展性. 作者将 $\ell_\infty$ -dist net 在 MNIST 数据集上显着优于 GroupSort 的原因也解释为这一点.

> Ablation Studies
作者还实验观察前述的 smoothed approximated gradients, parameter initialization(使用 identity map 构建) 和 $\ell_p$ -norm weight decay 的影响, 结果如表 3 所示, 可以看出:

smoothed approximated gradients 对 $\ell_\infty$ -dist net 的训练十分重要, 添加它后模型的 certified accuracy 可达到 32.56%.
smoothed approximated gradients 和 parameter initialization 均对 $\ell_\infty$ -dist net+MLP 训练十分重要, 结合它们一同使用后, 模型的 certified accuracy 达到 35.02%.
$\ell_\infty$ -norm weight decay 可以进一步提升结果，尽管效果可能很小(两个模型的 certified accuracy 分别提高了 0.59% 和 0.4%).
传统的 $\ell_2$ -norm weight decay 会损害 $\ell_\infty$ -dist net 的性能.

总之, 这几个训练策略都对模型的性能有帮助.

AI 大模型应用数据中心建设：高性能计算与存储架构 AI智能涌现深度研究 AI大模型应用入门实战与进阶 java python javascript kotlin golang 架构人工智能
AI大模型、数据中心、高性能计算、存储架构、分布式训练、GPU加速、数据管理1.背景介绍近年来，人工智能（AI）技术取得了飞速发展，特别是深度学习模型的突破性进展，催生了一系列基于大规模数据训练的强大AI模型，例如GPT-3、BERT、DALL-E等。这些AI大模型在自然语言处理、计算机视觉、语音识别等领域展现出强大的应用潜力，但也对计算资源和数据存储提出了极高的要求。传统的计算架构难以满足AI大
Storyboard 之segue用法总结月未央 iOS学习总结 iOS
Storyboard的好玩之处在于它可以帮我们省略了很多要手动写的代码，其中segue的功劳功不可没，现总结一下学习心得，若有错误之处，望指正。创建工程，选择SingleViewApplication，给工程起个名字，这里是SegueDemo，注意要把下面的UseStoryboard选项勾选上，我使用ARC，这里可以随意。点选工程文件中的MainStoryboard.storyboard文件，可以
人工智能直通车系列24【机器学习基础】（机器学习模型评估指标（回归））浪九天人工智能直通车开发语言 python 机器学习深度学习神经网络人工智能
目录机器学习模型评估指标（回归）1.均方误差（MeanSquaredError,MSE）2.均方根误差（RootMeanSquaredError,RMSE）3.平均绝对误差（MeanAbsoluteError,MAE）4.决定系数（CoefficientofDetermination,R2）机器学习模型评估指标（回归）1.均方误差（MeanSquaredError,MSE）详细解释均方误差是回归问
python_学习爬虫遇到的第一个问题_urllib获取baidu首页源代码 KJDETL python_爬虫 python 学习爬虫
第一天学习爬虫，学习的是urllib的基本用法，通过urllib.request获取baidu首页源代码。#导入urllib所需要的库importurllib.request#左边自定义名称，右边是要访问的地址url='https://www.baidu.com/Index.htm'#左边自定义名称可以叫做响应，右边是通过urllib.request.urlopen方法向url发出请求respon
从零开始学机器学习——构建一个推荐web应用努力的小雨机器学习机器学习前端人工智能
首先给大家介绍一个很好用的学习地址：https://cloudstudio.net/columns今天，我们终于将分类器这一章节学习完活了，和回归一样，最后一章节用来构建web应用程序，我们会回顾之前所学的知识点，并新增一个web应用用来让模型和用户交互。所以今天的主题是美食推荐。美食推荐Web应用程序首先，请不要担心，本章节并不会涉及过多的前端知识点。我们此次的学习重点在于机器学习本身，因此我们
【2025年春季】全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽子凯哥 web安全学习安全 CTF夺旗赛网络安全
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15
【前端入门】应该了解和知道的几个国内外前端开发资源网站爱上大树的小猪前端
与大家分享一下几个国内外前端开发资源网站国际资源MDNWebDocs(MozillaDeveloperNetwork)用途：MDN是Web技术领域最全面的文档库之一，涵盖了HTML、CSS、JavaScript以及浏览器API等。链接:https://developer.mozilla.orgW3Schools用途：适合初学者学习Web技术，提供从基础到进阶的教程，同时还有在线练习环境。链接:ht
[官文翻译]Flutter状态管理库Riverpod - 所有的Provider - StateProvider 2401_84166236 2024年程序员学习 flutter
先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！因此收集整理了一份《2024年最新HarmonyOS鸿蒙全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提
Python自动化炒股：利用XGBoost和LightGBM进行股票市场预测的实战案例云策量化 Python自动化炒股量化投资量化软件 python 量化交易 QMT PTrade 量化炒股量化投资 deepseek
推荐阅读：《程序化炒股：如何申请官方交易接口权限？个人账户可以申请吗？》Python自动化炒股：利用XGBoost和LightGBM进行股票市场预测的实战案例在当今快节奏的金融市场中，自动化交易和预测模型成为了投资者和交易者的重要工具。Python以其强大的数据处理能力和丰富的机器学习库，成为了实现这些模型的首选语言。本文将带你了解如何使用XGBoost和LightGBM这两个流行的机器学习算法来
AI大模型学习路线：从入门到精通的完整指南【2025最新】 AI大模型-大飞人工智能学习大模型 LLM AI 程序员大模型学习
引言近年来，以GPT、BERT、LLaMA等为代表的AI大模型彻底改变了人工智能领域的技术格局。它们不仅在自然语言处理（NLP）任务中表现卓越，还在计算机视觉、多模态交互等领域展现出巨大潜力。本文旨在为开发者、研究者和技术爱好者提供一条清晰的学习路径，帮助读者逐步掌握大模型的核心技术并实现实际应用。一、基础阶段：构建知识体系数学与理论基础线性代数：矩阵运算、特征值与奇异值分解是大模型参数优化的基础
走出内卷的困局盐论君创业创新社交电子远程工作求职招聘
《逃避自由》的作者若能体会《平凡的世界》中孙少平的苦难，就不会以一种消极的口吻提出：人们想要的自由是不需要负责任的自由。如果一个人连体会工作伦理的前提都不具备，那么我们不妨认为父辈们希望后代追求稳定的生活和工作是对的。对于一直生活在不稳定中的大多数人，自由是令人畏惧的，只有当他们拥有对抗这份恐惧的能力时，自由才能真正让人‘横眉冷对千夫指’，但想要做到这一点的前提恰恰是先要拥有一份较为稳定的工作，内
【sklearn 04】DNN、CNN、RNN @金色海岸 sklearn dnn cnn
DNNDNN（DeepNeuralNetworks，深度神经网络）是一种相对浅层机器学习模型具有更多参数，需要更多数据进行训练的机器学习算法CNNCNN（convolutionalNeuralNetworks，卷积神经网络）是一种从局部特征开始学习并逐渐整合的神经网络。卷积神经网络通过卷积层来进行特征提取，通过池化层进行降维，相比较全连接的神经网络，卷积神经网络降低了模型复杂度，减少了模型的参数，
【sklearn 02】监督学习、非监督下学习、强化学习 @金色海岸 sklearn 学习人工智能
监督学习、非监督学习、强化学习**机器学习通常分为无监督学习、监督学习和强化学习三类。-第一类：无监督学习（unsupervisedlearning），指的是从信息出发自动寻找规律，分析数据的结构，常见的无监督学习任务有聚类、降维、密度估计、关联分析等。-第二类：监督学习（supervisedlearning），监督学习指的是使用带标签的数据去训练模型，并预测未知数据的标签。监督学习有两种，当预测
2025-03-15 学习记录--C/C++-PTA 练习3-4 统计字符小呀小萝卜儿学习-C/C++学习 c语言
合抱之木，生于毫末；九层之台，起于累土；千里之行，始于足下。一、题目描述⭐️练习3-4统计字符本题要求编写程序，输入10个字符，统计其中英文字母、空格或回车、数字字符和其他字符的个数。输入格式:输入为10个字符。最后一个回车表示输入结束，不算在内。输出格式:在一行内按照letter=英文字母个数,blank=空格或回车个数,digit=数字字符个数,other=其他字符个数的格式输出。输入样例:a
2025-03-13 学习记录--C/C++-PTA 练习2-9 整数四则运算小呀小萝卜儿学习-C/C++学习 c语言
合抱之木，生于毫末；九层之台，起于累土；千里之行，始于足下。一、题目描述⭐️练习2-9整数四则运算本题要求编写程序，计算2个正整数的和、差、积、商并输出。题目保证输入和输出全部在整型范围内。输入格式:输入在一行中给出2个正整数A和B。输出格式:在4行中按照格式“A运算符B=结果”顺序输出和、差、积、商。输入样例:32输出样例:3+2=53-2=13*2=63/2=1二、代码（C语言）⭐️#incl
跨域视线估计的协同对比学习（重点针对局部对比学习解释）阳光明媚大男孩学习人工智能
跨域视线估计的协同对比学习1.问题表述在视线估计领域中，跨域问题是指当训练数据和测试数据来自不同的领域（如不同的个体、光照条件、拍摄设备等）时，模型性能会显著下降。这种性能下降主要是因为不同领域之间的差异导致模型难以泛化。为了解决这一问题，新方法（CrossGazeGeneralization,CGaG）旨在通过特征解耦的方式减少领域差异对视线估计的影响，从而提高模型在跨域情况下的准确性和稳定性。
c++与c语言的区别是什么？ pythoncainiao221 c++c语言开发语言
1、类型不同C语言是面向过程的，而C++是面向对象的。2、函数库不同C语言的标准的函数库很松散，而C++对于大多数的函数都是集成的很紧密。3、结构不同C语言中结构只有成员变量，而在C++中结构中，可以有成员变量和成员函数。它们的区别是c++是在C语言基础上发展起来的，根据开发过程中遇到的需求，它引入了很多新的特性。如果你不走C/C++方向，直接学习Java就可以了，相同的待遇下，选择简单的更好。当
从LLM出发：由浅入深探索AI开发的全流程与简单实践（全文3w字）码事漫谈 AI 人工智能
文章目录第一部分：AI开发的背景与历史1.1人工智能的起源与发展1.2神经网络与深度学习的崛起1.3Transformer架构与LLM的兴起1.4当前AI开发的现状与趋势第二部分：AI开发的核心技术2.1机器学习：AI的基础2.1.1机器学习的类型2.1.2机器学习的流程2.2深度学习：机器学习的进阶2.2.1神经网络基础2.2.2深度学习的关键架构2.3Transformer架构：现代LLM的核
漫画算法python篇pdf_用Python抓取漫画并制作mobi格式电子书 jian bao 漫画算法python篇pdf
想看某一部漫画，但是用手机看感觉屏幕太小，用电脑看吧有太不方面。正好有一部Kindle，决定写一个爬虫把漫画爬取下来，然后制作成mobi格式的电子书放到kindle里面看。本人对于Python学习创建了一个小小的学习圈子，为各位提供了一个平台，大家一起来讨论学习Python。欢迎各位到来Python学习群：943752371一起讨论视频分享学习。Python是未来的发展方向，正在挑战我们的分析能力
Spring Boot 脚手架搭建：新姿势墨瑾轩一起学学Java【一】spring boot 后端 java
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣‍刨根问底：脚手架是什么？‍嘿，小伙伴们！今天咱们要聊的是如何搭建一个既漂亮又实用的SpringBoot脚手架。脚手架就像是盖房子时搭起的架子，它能帮助我们快速构建出项目的骨架，让我们可以更专注于业务逻辑的实现。那么，如何搭建这样一个脚手架呢？别急，咱们一步一
纳米尺度仿真软件：Quantum Espresso_（20）.机器学习在QuantumEspresso中的应用 kkchenjj 分子动力学2 机器学习人工智能模拟仿真仿真模拟分子动力学
机器学习在QuantumEspresso中的应用在现代材料科学和纳米技术的研究中，机器学习（ML）技术已经成为一种强大的工具，用于加速和优化量子力学计算。QuantumEspresso是一个广泛使用的开源软件包，用于进行第一性原理计算，特别是在纳米尺度材料的模拟中。本节将介绍如何将机器学习技术应用于QuantumEspresso，以提高计算效率、预测材料性质和优化结构。1.机器学习与第一性原理计算
深入探索Ajax技术与应用实践 Javen Fang
本文还有配套的精品资源，点击获取简介：Ajax技术允许在不刷新整个页面的情况下进行网页内容的局部更新，大大提升了用户体验。文章详细解析了Ajax的核心组件和工作流程，并强调了其在Web开发中的重要性。此外，还探讨了Ajax的优点、应用场景以及在实际开发中需要注意的问题。通过学习Ajax，开发者可以设计出更加动态和高效的网页应用。1.Ajax技术概述和定义Ajax技术概述Ajax技术的核心在于其异步
java实现卷积神经网络CNN（附带源码） Katie。 Java 实战项目 java
Java实现卷积神经网络（CNN）项目详解目录项目概述1.1项目背景与意义1.2什么是卷积神经网络（CNN）1.3卷积神经网络的应用场景相关知识与理论基础2.1神经网络与深度学习概述2.2卷积操作与卷积层原理2.3激活函数与池化层2.4全连接层与损失函数2.5前向传播、反向传播与梯度下降项目需求与分析3.1项目目标3.2功能需求分析3.3性能与扩展性要求3.4异常处理与鲁棒性考虑系统设计与实现思路
推荐开源项目：Free Templates for AWS CloudFormation 褚知茉Jade
推荐开源项目：FreeTemplatesforAWSCloudFormationaws-cf-templateswiddix/aws-cf-templates:是一个包含各种AWSCloudFormation模板的存储库。适合查找和学习AWSCloudFormation模板的示例，以及用于构建自己的基础设施。特点是包含了许多AWS服务和功能的模板示例，可以快速地了解如何使用CloudFormati
探索AWS CloudFormation样本模板：构建云环境的新起点劳泉文Luna
探索AWSCloudFormation样本模板：构建云环境的新起点aws-cloudformation-templatesawslabs/aws-cloudformation-templates:是一个包含各种AWSCloudFormation模板的存储库。适合查找和学习AWSCloudFormation模板的示例，以及用于构建自己的基础设施。特点是包含了许多AWS服务和功能的模板示例，可以快速地
批量安装 Python 库的脚本：提高python学习效率的第一步（附源码） TAGRENLA Interesting python project python 学习开发语言
批量安装Python库批量安装Python库的脚本：提高数据分析效率的一步（附源码）批量安装脚本前提条件使用pip：Python包管理工具批量安装脚本查看当前python解释器中安装的所有的库批量安装Python库的脚本：提高数据分析效率的一步（附源码）在现代数据分析领域，Python已成为一个不可或缺的工具。为了进行数据处理、分析、可视化和建模等任务，Python社区涌现出了众多强大的库和工具。
K8S学习之基础二十八：k8s中的configMap 云上艺旅 K8S学习 kubernetes 学习容器云原生
k8s中的configMapconfigMap是k8s的资源对象，简称cm，用于保存非机密性的配置，数据可以用key/value键值对形式保存，也可以通过文件形式保存在部署服务的时候，每个服务都有自己的配置文件，如果一台服务器上部署多个服务：nginx、tomcat、apache等，那么这些配置都存在这个节点上，假如一台服务器不能满足线上高并发的要求，需要对服务器扩容，扩容之后的服务器还是需要部署
kubernetes(K8S)学习（七）：K8S之系统核心组件 ꯭ 瞎꯭扯꯭蛋꯭ Kubernetes kubernetes 学习容器
K8S之系统核心组件K8s系统核心组件1.1Master和Node1.2kubeadm1.3先把核心组件总体过一遍1.4Kubernetes源码查看方式1.5kubectl1.6APIServer1.7集群安全机制之APIServer1.8Scheduler1.9kubelet1.10kube-proxyK8s系统核心组件1.1Master和Node官网：https://kubernetes.io
Python编码系列—Python代码重构：提升代码质量学步_技术 Python编码 python 重构开发语言
欢迎来到我的技术小筑，一个专为技术探索者打造的交流空间。在这里，我们不仅分享代码的智慧，还探讨技术的深度与广度。无论您是资深开发者还是技术新手，这里都有一片属于您的天空。让我们在知识的海洋中一起航行，共同成长，探索技术的无限可能。探索专栏：学步_技术的首页——持续学习，不断进步，让学习成为我们共同的习惯，让总结成为我们前进的动力。技术导航：人工智能：深入探讨人工智能领域核心技术。自动驾驶：分享自动
lua C语言api学习3 lua中调用C语言函数刘阿去 lua lua c语言学习
本文介绍如何在lua中如何调用自定义C语言函数1C函数要求Lua可以调用C语言函数，但这并不意味着Lua可以调用所有的C函数。当Lua调用C函数时，这个C函数必须遵循某种规则来获取参数和返回结果。此外，当Lua调用C函数时，我们必须注册该函数，即必须以一种恰当的方式为Lua提供该C函数的地址。所有在lua中注册的函数必须遵循下面原型。typedefint(*lua_CFunction)(lua_S
继之前的线程循环加到窗口中运行 3213213333332132 java thread JFrame JPanel
之前写了有关java线程的循环执行和结束，因为想制作成exe文件，想把执行的效果加到窗口上，所以就结合了JFrame和JPanel写了这个程序，这里直接贴出代码，在窗口上运行的效果下面有附图。 package thread; import java.awt.Graphics; import java.text.SimpleDateFormat; import java.util
linux 常用命令 BlueSkator linux 命令
1.grep 相信这个命令可以说是大家最常用的命令之一了。尤其是查询生产环境的日志，这个命令绝对是必不可少的。但之前总是习惯于使用（grep -n 关键字文件名）查出关键字以及该关键字所在的行数，然后再用（sed -n '100,200p' 文件名），去查出该关键字之后的日志内容。但其实还有更简便的办法，就是用（grep -B n、-A n、-C n 关键
php heredoc原文档和nowdoc语法 dcj3sjt126com PHP heredoc nowdoc
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body> <?
overflow的属性周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
《我所了解的Java》——总体目录 g21121 java
准备用一年左右时间写一个系列的文章《我所了解的Java》，目录及内容会不断完善及调整。在编写相关内容时难免出现笔误、代码无法执行、名词理解错误等，请大家及时指出，我会第一时间更正。 &n
[简单]docx4j常用方法小结 53873039oycg docx
本代码基于docx4j-3.2.0，在office word 2007上测试通过。代码如下: import java.io.File; import java.io.FileInputStream; import ja
Spring配置学习云端月影 spring配置
首先来看一个标准的Spring配置文件 applicationContext.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&q
Java新手入门的30个基本概念三 aijuans java 新手 java 入门
17.Java中的每一个类都是从Object类扩展而来的。　　18.object类中的equal和toString方法。　　equal用于测试一个对象是否同另一个对象相等。　　toString返回一个代表该对象的字符串,几乎每一个类都会重载该方法,以便返回当前状态的正确表示.(toString 方法是一个很重要的方法)　　 19.通用编程:任何类类型的所有值都可以同object类性的变量来代替。　
《2008 IBM Rational 软件开发高峰论坛会议》小记 antonyup_2006 软件测试敏捷开发项目管理 IBM 活动
我一直想写些总结,用于交流和备忘,然都没提笔,今以一篇参加活动的感受小记开个头,呵呵! 其实参加《2008 IBM Rational 软件开发高峰论坛会议》是9月4号,那天刚好调休.但接着项目颇为忙,所以今天在中秋佳节的假期里整理了下. 参加这次活动是一个朋友给的一个邀请书,才知道有这样的一个活动,虽然现在项目暂时没用到IBM的解决方案,但觉的参与这样一个活动可以拓宽下视野和相关知识.
PL/SQL的过程编程,异常,声明变量,PL/SQL块百合不是茶 PL/SQL的过程编程异常 PL/SQL块声明变量
PL/SQL; 过程; 符号; 变量; PL/SQL块; 输出; 异常; PL/SQL 是过程语言(Procedural Language)与结构化查询语言(SQL)结合而成的编程语言PL/SQL 是对 SQL 的扩展,sql的执行时每次都要写操作
Mockito(三)--完整功能介绍 bijian1013 持续集成 mockito 单元测试
mockito官网：http://code.google.com/p/mockito/，打开documentation可以看到官方最新的文档资料。一.使用mockito验证行为 //首先要import Mockito import static org.mockito.Mockito.*; //mo
精通Oracle10编程SQL(8)使用复合数据类型 bijian1013 oracle 数据库 plsql
/* *使用复合数据类型 */ --PL/SQL记录 --定义PL/SQL记录 --自定义PL/SQL记录 DECLARE TYPE emp_record_type IS RECORD( name emp.ename%TYPE, salary emp.sal%TYPE, dno emp.deptno%TYPE ); emp_
【Linux常用命令一】grep命令 bit1129 Linux常用命令
grep命令格式 grep [option] pattern [file-list] grep命令用于在指定的文件(一个或者多个,file-list)中查找包含模式串(pattern)的行,[option]用于控制grep命令的查找方式。 pattern可以是普通字符串，也可以是正则表达式，当查找的字符串包含正则表达式字符或者特
mybatis3入门学习笔记白糖_ sql ibatis qq jdbc 配置管理
MyBatis 的前身就是iBatis，是一个数据持久层(ORM)框架。 MyBatis 是支持普通 SQL 查询，存储过程和高级映射的优秀持久层框架。MyBatis对JDBC进行了一次很浅的封装。以前也学过iBatis，因为MyBatis是iBatis的升级版本，最初以为改动应该不大，实际结果是MyBatis对配置文件进行了一些大的改动，使整个框架更加方便人性化。
Linux 命令神器：lsof 入门 ronin47 lsof
lsof是系统管理/安全的尤伯工具。我大多数时候用它来从系统获得与网络连接相关的信息，但那只是这个强大而又鲜为人知的应用的第一步。将这个工具称之为lsof真实名副其实，因为它是指“列出打开文件（lists openfiles）”。而有一点要切记，在Unix中一切（包括网络套接口）都是文件。有趣的是，lsof也是有着最多
java实现两个大数相加，可能存在溢出。 bylijinnan java实现
import java.math.BigInteger; import java.util.regex.Matcher; import java.util.regex.Pattern; public class BigIntegerAddition { /** * 题目：java实现两个大数相加，可能存在溢出。 * 如123456789 + 987654321
Kettle学习资料分享，附大神用Kettle的一套流程完成对整个数据库迁移方法 Kai_Ge Kettle
Kettle学习资料分享 Kettle 3.2 使用说明书目录概述..........................................................................................................................................7 1.Kettle 资源库管
[货币与金融]钢之炼金术士 comsci 金融
自古以来,都有一些人在从事炼金术的工作.........但是很少有成功的那么随着人类在理论物理和工程物理上面取得的一些突破性进展...... 炼金术这个古老
Toast原来也可以多样化 dai_lm android toast
Style 1：默认 Toast def = Toast.makeText(this, "default", Toast.LENGTH_SHORT); def.show(); Style 2：顶部显示 Toast top = Toast.makeText(this, "top", Toast.LENGTH_SHORT); t
java数据计算的几种解决方法3 datamachine java hadoop ibatis r-langue r
4、iBatis 简单敏捷因此强大的数据计算层。和Hibernate不同，它鼓励写SQL，所以学习成本最低。同时它用最小的代价实现了计算脚本和JAVA代码的解耦，只用20%的代价就实现了hibernate 80%的功能,没实现的20%是计算脚本和数据库的解耦。复杂计算环境是它的弱项，比如：分布式计算、复杂计算、非数据
向网页中插入透明Flash的方法和技巧 dcj3sjt126com html Web Flash
将 Flash 作品插入网页的时候，我们有时候会需要将它设为透明，有时候我们需要在Flash的背面插入一些漂亮的图片，搭配出漂亮的效果……下面我们介绍一些将Flash插入网页中的一些透明的设置技巧。　　一、Swf透明、无坐标控制　　首先教大家最简单的插入Flash的代码，透明，无坐标控制：　　注意wmode="transparent"是控制Flash是否透明
ios UICollectionView的使用 dcj3sjt126com
UICollectionView的使用有两种方法，一种是继承UICollectionViewController，这个Controller会自带一个UICollectionView；另外一种是作为一个视图放在普通的UIViewController里面。个人更喜欢第二种。下面采用第二种方式简单介绍一下UICollectionView的使用。 1.UIViewController实现委托，代码如
Eos平台java公共逻辑蕃薯耀 Eos平台java公共逻辑 Eos平台 java公共逻辑
Eos平台java公共逻辑 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:20:4
SpringMVC4零配置--Web上下文配置【MvcConfig】 hanqunfeng springmvc4
与SpringSecurity的配置类似，spring同样为我们提供了一个实现类WebMvcConfigurationSupport和一个注解@EnableWebMvc以帮助我们减少bean的声明。 applicationContext-MvcConfig.xml  <
解决ie和其他浏览器poi下载excel文件名乱码 jackyrong Excel
使用poi,做传统的excel导出，然后想在浏览器中，让用户选择另存为，保存用户下载的xls文件，这个时候，可能的是在ie下出现乱码（ie,9,10,11),但在firefox,chrome下没乱码，因此必须综合判断，编写一个工具类： /** * * @Title: pro
挥洒泪水的青春 lampcy 编程生活程序员
2015年2月28日，我辞职了，离开了相处一年的触控，转过身--挥洒掉泪水，毅然来到了兄弟连，背负着许多的不解、质疑——”你一个零基础、脑子又不聪明的人，还敢跨行业，选择Unity3D？“，”真是不自量力••••••“，”真是初生牛犊不怕虎•••••“，••••••我只是淡淡一笑，拎着行李----坐上了通向挥洒泪水的青春之地——兄弟连！这就是我青春的分割线，不后悔，只会去用泪水浇灌——已经来到
稳增长之中国股市两点意见-----严控做空，建立涨跌停版停牌重组机制 nannan408
对于股市，我们国家的监管还是有点拼的，但始终拼不过飞流直下的恐慌，为什么呢？笔者首先支持股市的监管。对于股市越管越荡的现象，笔者认为首先是做空力量超过了股市自身的升力，并且对于跌停停牌重组的快速反应还没建立好，上市公司对于股价下跌没有很好的利好支撑。我们来看美国和香港是怎么应对股灾的。美国是靠禁止重要股票做空，在
动态设置iframe高度(iframe高度自适应) Rainbow702 JavaScript iframe contentDocument 高度自适应局部刷新
如果需要对画面中的部分区域作局部刷新，大家可能都会想到使用ajax。但有些情况下，须使用在页面中嵌入一个iframe来作局部刷新。对于使用iframe的情况，发现有一个问题，就是iframe中的页面的高度可能会很高，但是外面页面并不会被iframe内部页面给撑开，如下面的结构： <div id="content"> <div id=&quo
用Rapael做图表 tntxia rap
function drawReport(paper,attr,data){ var width = attr.width; var height = attr.height; var max = 0; &nbs
HTML5 bootstrap2网页兼容（支持IE10以下） xiaoluode html5 bootstrap
<!DOCTYPE html> <html> <head lang="zh-CN"> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge">