卷卷卷不动

【论文理解】FedSky: An Efficient and Privacy-Preserving Scheme for Federated Mobile Crowdsensing

这篇论文同样是来自陆老师组的，发表在IEEE INTERNET OF THINGS JOURNAL上的一篇关于联邦学习、同态加密的文章。

- 论文背景
- - 群智感知（Crowd Sensing）
  - F-MCS
- 本文的主要贡献
- 模型与设计目标
- - 系统模型
  - 安全模型
  - 设计目标
- PRELIMINARIES
- - A. FedAvg Algorithm
  - B. Different Variants of Skyline Queries
  - C.Bilinear Pairing
  - D.Paillier Cryptosystem
- 提出的方案
- - A.KeyDist $P h a s e$
  - B. WorkSel $P h a s e$
  - C.DataAgg $P h a s e$
- 总结
- 参考

论文背景

在过去的几年里，移动通信和物联网的爆炸性发展带来了一种新的传感方法范式，称为移动群智感知（MCS）。从本质上讲，移动用户的人群，即工人，被MCS平台招募，将他们的传感数据外包给某些任务，如环境监测[、交通密度评估、城市规划、位置导航[和医疗保健供应。然而，工人在执行传感任务时，不可避免地要向平台分享他们的传感信息（如日常轨迹、实时位置和周围环境）。信息泄露可能导致严重的隐私问题。例如，攻击者可以通过分析工人的传感数据来推断其日常行为。因此，保护工人的敏感信息不被泄露是MCS应用的主要挑战之一。
在这里先介绍下群智感知（Crowd Sensing）

群智感知（Crowd Sensing）

群智感知（Crowd Sensing）一开始来源于众包的概念，科技公司将项目工作以自由意愿的形式分配给非特定的社会大众，一种分布式协作。而群智感知（Crowd Sensing） 指大规模的普通用户通过其自身携带的智能移动设备来采集感知数据并上传到服务器，服务提供商对感知数据进行记录处理，最终完成感知任务并利用收集的数据给用户提供日常所需服务的过程。近些年随着各种移动设备和可穿戴设备的普及利用这些传感设备收集的数据可以分析提取许多有用信息。移动的可穿戴的传感器可以有效的收集数据而没有维护成本高覆盖范围有限等问题。如今群智感知在环境污染监测、环境噪声地图、城市交通路况、社交网络与医疗保健等方面都已经得到了应用，在可预见的未来它将会应用到更多的业务场景中。
移动群智感知系统一般会由多个移动用户，任务发起者，云端感知平台组成，任务发起者向云端提交任务需求，感知平台向用户发布任务，移动用户携带智能设备执行任务并上传数据获得相应报酬，感知平台处理数据提供计算服务。整个过程主要设计如下几个研究方向：收集、用户招募、任务分配、隐私保护、数据质量和激励机制

F-MCS

到目前为止，已经有大量的、不断增长的文献被研究用来解决MCS中的隐私挑战。在所有的研究中，联合学习（FL）可以被认为是一个潜在的和实用的解决方案。在联合学习中，平台反复选择随机工人来下载一个可训练的模型。
FL的分布式性质使工作者能够优化共享模型，同时将所有训练数据保存在本地，从而确保他们的隐私。FL可以大致分为跨主机FL和跨设备FL。在跨主机FL中，工作者是具有丰富计算资源的职能机构（例如，金融机构）。

训练好的模型被专门发布给这些组织，但不包括FL聚合平台。相反，在跨设备FL中，工作者是计算能力有限的异质移动用户。FL平台最终将获得训练好的模型。

在这篇文章中，通过将跨设备FL引入MCS，我们提出了一个新的传感场景，称为联合MCS（F-MCS）。F-MCS允许工人建立一个强大而安全的机器学习模型，而不需要分享他们的感应数据。

因此，F-MCS可以解决传统MCS系统中工人信息泄露的关键问题，并有望成为移动传感服务的一个新热点。

尽管如此，如果我们简单地将FL技术与MCS服务相结合，仍然存在两个主要问题。
(1) 在F-MCS中选择稳定的工作者是一个挑战。这里的工作者拥有的搜集、上传数据的可携带式设备工作充满了不稳定性。这些设备硬件条件、网络连接（3G、4G、5G、Wi-Fi和信号强度），电源状态（续航时间），因为分布式训练在顺利进行下一轮训练之前就需要所有的workers的数据被正确上传，意思是受设备影响导致workers之间出现时间上的不协同，会影响后续的聚合步骤。
（2）跨设备的F-MCS平台缺乏实用的隐私保护解决方案。F-MCS是一个跨设备的FL系统，最终的模型将被发布到F-MCS平台，用于某些实时服务。因此，现有的方法不能应用于F-MCS。现在急需为F-MCS的应用设计实用的、保护隐私的解决方案

本文的主要贡献

在这篇文章中，为了解决上述挑战，我们提出了一种新型的、安全的F-MCS应用的数据聚合方案，称为FedSky。通过扩展经典的FedAvg算法，FedSky的特点是采用群体天际线（G-skyline）来选择合格的workers和同态加密来安全地聚合数据。具体来说，本文的主要贡献有以下三点：
（1）我们在FedSky中为F-MCS提出了一种新颖而有效的工人选择机制。具体来说，在每一轮通信中，我们不是随机选择一组工人，而是根据工人的本地数据大小和他们的移动设备的计算能力来选择一个工人的天际线组。这样一来，与传统的FedAvg算法相比，我们的方法可以大大减少工人的计算时间和平台的等待时间，因此，大大地提高了FL过程的效率。
(2)我们为F-MCS平台提出了一种基于HE(t同态加密)技术的新型隐私保护数据聚合方案。该方案是为跨设备的FL设置而设计的，这样，最终的全局模型可以被F-MCS平台访问。此外，整个训练过程不需要所选工人之间的互动。除了左邻的ID和右邻的ID，每个被选中的工人对其他工人的信息一无所知。
（3）我们建立了一个定制的模拟器来进行性能评估。
广泛的实验结果验证了所提方案的有效性和效率。特别是，通过引入一个新的工人选择机制和一个保护隐私的数据聚合协议，我们可以在不影响其准确性的情况下大大提高FL过程的效率。

模型与设计目标

系统模型

场景考虑一个比较典型的F-MCS场景，包括三个实体：一个可信的密钥生成生成器 $\mathcal{TKG}$ ，一个 $F - M C S$ 平台和一组异质工人 $\mathcal{W}=\{w_1,w_2,w_3....\}$ .
(1) $\mathcal{TKG}$ :一个受信任的权威机构，它生成并向相应的实体分发适当的密钥，从而使某项F-MCS任务能够合作完成。
(2) $F - M C S$ 平台 $P$ : $P$ 是提供F-MCS服务的可信平台，负责执行F-MCS任务，包括注册工人、初始化任务模型、选择工人和训练模型。更具体地说，在注册时， $P$ 给每个注册的工人 $W_i$ 分配一个唯一的标识 $ID_{wi}$ 。然后将工人的识别码广播给 $\mathcal{TKG}$ 。在训练的过程中， $P$ 首先会初始化全局模型，然后从 $\mathcal{W}=\{w_1,w_2,w_3....\}$ 选择一部分合格的员工（具体怎么选参考后文）， $P$ 将模型分发给选定的工人，并在每轮训练中通过汇总工人提供的模型参数来训练模型。为了实现最终的全局模型，需要P和选定的工人之间进行多轮互动。
(3) 参与的工作者： $\mathcal{W}=\{w_1,w_2,w_3....\}$ ， $\mathcal{W}$ 是希望进行某项F-MCS任务的参与工作者。如果 $\mathcal{W}$ 中的工人被P选中，首先，他/她需要用他/她的移动设备收集原始感应数据。在收到全局模型后，每个被选中的工人需要通过用他/她的本地数据训练模型来更新模型参数，加密模型参数，并与P交换密文。为了在每轮训练中被选中，工作者需要定期向P发送他们当前的训练能力和计算状态，例如，本地数据集的大小，他们的移动设备的当前CPU份额/电池/内存。

安全模型

首先，我们认为 $\mathcal{P}$ 和 $\mathcal{TKG}$ 是完全可信的。值得注意的是，一些恶意软件已经被对手 $\mathcal{A}$ 安装在 $\mathcal{P}$ 中而没有被发现。因此， $\mathcal{A}$ 可以监视 $\mathcal{P}$ 的数据库，并窃听 $\mathcal{P}$ 和 $\mathcal{W}$ 之间的通信信息。基本上， $\mathcal{A}$ 对每个工人上传至平台的模型更新感兴趣。通过这些更新， $\mathcal{A}$ 可以推断出工人的实时空间-时间信息。
工人 $\mathcal{W}$ 是诚实而好奇的。
因此，所有工人都严格遵守设计的更新、加密和上传模型参数的协议，但可能对其他工人的数据资源感兴趣。此外，我们假设 $\mathcal{W}$ 的工人之间没有串通，工人也不能与 $\mathcal{P}$ 串通。外部攻击者可能利用F-MCS平台的其他漏洞。由于这项工作的重点是隐私保护，这些攻击超出了本文的范围，将在我们未来的工作中讨论。

设计目标

（1）效率：提出的FedSky方案在训练模型和在每轮通信中上传加密的模型参数方面应该是高效的。因此，与传统的FedAvg算法相比，在我们的方案中，P的等待时间应该缩短，整体的FL训练效率应该得到提高。
（2）隐私保护：我们计划设计一个保护隐私的F-MCS框架，它可以防止工人敏感信息的保密性被泄露。更具体地说，对于∀ $w_i$ ， $\mathcal{D}_i$ 表示 $w_i$ 的本地数据， $x_i$ 表示 $w_i$ 在每轮训练后更新的模型参数， $\mathcal{D}_i$ 和xi都应该对其他工人保密。此外，即使 $\mathcal{A}$ 窃听了 $\mathcal{P}$ 的数据库并窃取了 $\mathcal{w}$ 和 $\mathcal{P}$ 之间的通信数据，它仍然无法识别每个工作者的上传模型参数 $x_i$ 。

PRELIMINARIES

A. FedAvg Algorithm

联邦平均算法用于FL中深度学习和机器学习模型。在传统FL中有两种传统的实体：
1)数据聚合器
2) $K$ 个参与的工作者 ${w_{1},w_{2},...，w_{k}\}$
令 $N_{i}$ 表示工作者 $W_{i}$ 拥有的数据集的数量,算法步骤如下：
1、FedAvg算法中每次在 $t$ 轮开始时都会从 $K$ 个工人中随机选择， $k$ 个参与者，将在 $t$ 轮的的模型 $x^{t}$ 广播给每个参与者。
2、在接受到当前模型时候，工作者 $w_{i}$ 都会在本地数据集上计算平均梯度。这个记为 $g_{i}$
3、给定一个固定的学习率 $\eta$ , $w_{i}$ 计算：
$x_{i}\leftarrow x^{t}-\eta·g_{i}$
4、上传 $x_{i}$ 到数据聚合器
5、最后数据聚合器根据下列算式更新全局模型：
$x^{t+1}\leftarrow\sum_{i= 1}^{k}(N_{i}/N)x_{i} 其中 N=N_{1}+N_{2}+....N_{k}$
具体算法细节如下图所示

B. Different Variants of Skyline Queries

不同的天际线查询 ,这使用MCS的工作者来举例说明几种不同的skyline：
skyline , G-skyline , and Constrained skyline
(C-skyline) （约束天际线）然后提出一种新颖的skyline变体——CG-skyline ：这个可以检索对数据具有特定尺寸限制的天际线组。

定义一： $(s k y l i n e)$ : $K$ 个参与的工作者： $\mathcal{W}=\{w_{1},w_{2},...，w_{k}\}$ 每个工作者都可以被表示为d维的数据点,
$wi=(w_{i}[1],w_{i}[2]...w_{i}[d] ，i ∈[1,K])$ , 假设都是优先选择每个维度的最大值。定义一种主导(dominated)关系（ $w_a \prec w_b$ ）如下: 对于 $\mathcal{W}$ 中的俩个不同的工作者 $w_a$ , $w_b$ （a≠b）对于所有的维度 $j \in [1, d]$ 都有 $w_{a[j]}≥w_{b[j]}$ 且至少存在一个维度使得 $w_{a[j]}＞w_{b[j]}$ ，定义相等的关系，对于所有的维度都有， $w_{a[j]}=w_{b[j]}$
举例如下：

可以这样理解靠近坐标右上角的点是最好的点。
$w_1,w_3,w_4,w_5$ 和 $w_6$ 是skyline的工作者。
定义二 $k-Point\ G-Skyline$ : 给定一系列工作者 $\mathcal{W}$
有两组数量为k的工人组 $G=\{w_{1},w_{2},...，w_{k}\}$ ,然后 $G'=\{w_{1}',w_{2}',...，w_{k}'\}$ ,k≤ $K$ 且 $G和G‘都是∈\mathcal{W}$
,定义一种 g-domaintes ( $w_{a} \prec_g w_{b}$ ) ：在两个工人组中找到k个点的排列， $G=\{w_{u1},w_{22},...，w_{uk}\}$ ， $G'=\{w_{v1}',w_{v2}',...，w_{vk}'\}$ 满足所有的维度都有 $w_{ui} \preceq w_{vi}'$ 至少存在一个维度使得 $w_{ui} \prec w_{vi}'$ 这样就找出了k-point G-skyline 的组这里的工作者不能由其他相同大小的组主导，举例如下;

注意：这里定义的符号 $\prec$ 是一种主导关系，具体到数值上其实是大于的关系，图像上显示实在右上角位置
定义三：（C-skyline）: 给定一系列d-维度的工作者 $\mathcal{W}$
令 $\mathcal{C}=\{Con_1,Con_2,...Con_d,\}$ 表示d维度的一些限制。 $Con_i$ 表示的是一个属于一个维度的限制范围 $min_i,max_i]$ ，或者是空集 $\emptyset$ ,这样所有的限制 $\mathcal{C}$ 会在d维度的空闲内形成一个约束空间可以理解是普通的skyline上加上约束之后的点
定义四 (k-Point CG-Skyline，本文提出的新的skyline) 给定一系列d-维的工作者 $\mathcal{W}$ ,和一系列限制 $\mathcal{C}$ , k-point CG-skyline 的点是由约束空间中的所有的拥有k个工作者且不会被别的组 g-dominated的所有组。
举个例子：还是在上图中令 $\mathcal{C}=\{Con1,Con2\}$ 其中 $Con_1=[1,5],Con_2=[1,7]$ 那么图上的蓝色区域就是约束空间，那么对于定义三种C-skyline就是 ${w_3,w_4，w_5\}$ 其中组 $G=\{w_1,w_4，w_5\}$ 是一个 3-point G-skyline 而不是一个 3-point CG-skyline 。

C.Bilinear Pairing

这部分内容就是双线性配对，就不展开讲述可以参考网络上的一些博文：

D.Paillier Cryptosystem

Paillier 同态加密也不做详述

要注意在Paillier密码系统中，两个密文的乘积可以解密为它们对应的明文之和，即：
$D(sk,E（pk,m_1）·E(pk,m2) mod \ n^{2})=m_1+m_2 \ mod \ n$

提出的方案

这一节会提出一个新颖的针对F-MCS -联合移动群智感知的数据聚合方案，称作FedSky 主要由三部分组成：
密钥分发（KeyDist）
工作者选择(WorkSel)
数据聚合（DataAgg）

A.KeyDist $P h a s e$

首先 $\mathcal{TKG}$ 运行 $K e y G e n (k)$ 生成参数 $(p,q,n,\lambda,\mu)$ ,生成公钥 $pk_p=(n,g)$ 和私钥 $sk_p=(\lambda,\mu)$ 然后 $\mathcal{TKG}$ 会选择统一的加密哈希函数 $H_1$ , $H_1:\{0,1\}^{*}\rightarrow\mathbb{Z}_{n^2}$ 和一个双线性隐射 $e:\mathbb{G} ×\mathbb{G}\rightarrow\mathbb{G}_{T}$ 。然后 $\mathcal{TKG}$ 会将 $(pk_p,H_1,e:\mathbb{G} ×\mathbb{G})$ 广播给 $P$ 和系统中的所有工作者，然后安全的将 $sk_p$ 发送给 $P$ （F-MCS 平台）
接下来 $\mathcal{TKG}$ 会选择另一个加密的哈希函数 $H_2$ , $H_2:\{0,1\}^{*}\rightarrow\mathbb{Z}_{n}$ $\mathcal{TKG}$ 选择一个随机数 $S∈\mathbb{Z}^{*}_n$ ,作为一个钥匙，同时对 $W$ 中的每一个工作者 $w_i$ 都给予一个标识 $ID_{w_i}$ 其中 $ID_{w_i}=H_0(w_i) \ H_0:\{0,1\}^{*}\rightarrow\mathbb{G}$ , $\mathcal{TKG}$ 会计算 $ID_{w_i}^S$ 并将这个安全的发送给 $w_i$ ，将哈希函数 $H_2$ 发送给所有工作者

B. WorkSel $P h a s e$

在本文的模型中。所有的工作者 $w i$ 都具备两种属性
(1)本地的数据集大小 $N_i$
(2)移动设备的计算能力大小 $P_i$ ， $P_i$ 表示在F-MCS任务中每分钟可以处理多少任务， $w i$ 需要定期的将 $N_i$ 和 $P_i$ 发送给平台 $P$ 在选择工作者之前，平台 $P$ 会根据F-MCS 任务的要求定义一些二维的限制 $\mathcal{C}=\{Con_1，Con_2\}$ 对于更高的要求限制应该也是更加严格一点。 $Con_1=[min_1,max_1]$ , $Con_2=[min_2,max_2]$ , 我们认为如果 $min_1>min_2$ 且 $max_1>max_2$ 那么 $Con_1$ 是比 $Con_2$ 更加严格的。接着平台 $P$ 会选择一系列符合这些限制的工作者 $\mathcal{W}'$ ,在每轮训练前 $P$ 都会从 $\mathcal{W}'$ 种由 $N_i$ 和 $P_i$ 两个属性的CG-skyline 选择最佳的k个工作者，具体的方法如下：
首先对于每个工作者 $w i$ , $P$ 会计算 $Sum(w_i)=N_i+P_i$ ，根据这个 $S u m (i)$ 所有的工作者都会被添加进一个最大值优先队列 $Q_W$ ,即降序排列，值越大的越先从队列种删去。这里注意 $P_i$ 和 $N_i$ 应该在同一水平(即数值上是在相近的范围内，不会出现某个属性主导的情况) ，由上述章节的描述有以下两个定理:
Theorem 1: 如果 $w_i$ 是第一个被 $Q_W$ 移除的工作者那么 $w_i$ 就是一个符合skyline 的工作者
Theorem 2: 对于所有的 $w_j ∈\mathcal{W}'$ 能主导 $w_j$ 的一定是比 $w_j$ 先移出 $Q_W$ 的
算法执行如下：
首先 $P$ 会初始化另一个空的最大优先队列 $Q_{non}$ ,和一个空的列表 $Q_{sky}$ $P$ 会遍历 $Q_W$ 队列，根据上述的定理，第一个工作者 $w_i$ 会被直接加入 $Q_{sky}$ ，然后接下来的 $Q_W$ 中的第一个工作者，去跟 $Q_{sky}$ 中的所有工作者比较，如果都没被 $Q_{sky}$ 中的工作者所主导那么就加入到 $Q_{sky}$ 中，否则就添加入 $Q_{non}$ 。 $P$ 重复执行上述步骤直到 $Q_{sky}$ 中的数量为k或者 $Q_W$ 队列为空。最后还会进行一个判断，如果最终 $Q_{sky}$ 中的数量少于k个，那么会从 $Q_{non}$ 选出少的个数的工作者加入到 $Q_{sky}$ ，这一部分的理解是即使是某些工作者的计算能力或者数据集不够，还是需要保证有k个参与者。
举例如下

值得注意的是，所提出的CG-skyline技术只能选择一组G-skyline工人。
在选择工人后，MCS平台 $P$ 将全局模型的超参数(如学习速率)广播给所有被选择的工人，工人可以使用这些超参数进行下一步的模型训练和优化.

C.DataAgg $P h a s e$

$\mathcal{W}_s$ 是一个组中k个被挑选的工作者，例如 $\mathcal{W}_s=\{w_1,w_2,...,w_k\}$ 在每一轮开始前 $P$ 都会计算 $y_i=Ni/(N_1+N_2+…N_k)$ 作为 $w_i$ 的模型参数， $y_i$ 会保留三位小数， $P$ 会对 $y_i$ 进行放大1000倍的操作，具体的DataAgg 操作如下：

$P$ 将来自 $\mathcal{W}_s$ 中的k个工人放入一个循环中，排列如下图，注意 $w_i$ 的邻居下标，以及 $w_1$ 的左边是 $w_k$ :
$P$ 产生一个随机数 $\alpha_i ∈\mathbb{Z}^{*}_n$ $P$ 将如下信息发送给每个工作者 $w_i$ :

这里的 $i\rightarrow l$ 和 $i\rightarrow r$ 表示 $w_i$ 的左邻居和右邻居, $t$ 当前训练的轮次，因此值都会随着每轮的变化而变化.
接收到信息之后 $w_i$ 会根据本地数据集计算本地梯度 $g_i$
根据固定的学习率，会计算本地的模型参数 $x_{i}\leftarrow x^{t}-\eta·g_{i}$ ，为了尽可能的保持原始信息，将 $x i$ 保留到小数点后八位，在每轮训练完之后 $w_i$ 都会计算 $\bar{x_i}=10^{8}·x_i$
接下来 $w_i$ 会计算 $\bar{C}_i$ 和三个 $k e y$ , 左会话密钥 $S_{(i,i\rightarrow l)}$ ,右会话密钥 $S_{(i,i\rightarrow r)}$ , 处理密钥 $S_ip$ :

接着 $w_i$ 会计算一个 $\pi_i$ 发送给 $P$ :
$P$ 首先会检查是否存在 $w_i$ 没有提交 $\pi_i$ 如果有那么 $P$ 会终止协议然后开始新的训练回合。如果所有的 $w_i$ 都提交了他们的 $\pi_i，P$ 会计算： $\theta=\prod_{i = 1}^{k}{\pi_i}$ mod n²
计算如下：

令 $\bar{m}=\sum_{i = 1}^{k}{\bar{x}_{i}·y_i}$ $P$ 可以通过 $D (s k, c)$ 进行过解密获得 $\bar{m}$ :

正确性验证：
考虑给定的 $W_i$ 对于所有 $k$ 个工作者，处理密钥的求和形式为 $\prod_{i = 1}^{k}Sip=S_{1p}+S_{2p}+S_{3p}+...S_{kp}=S_{(1,k)}-S_{(2,1)}-S_{(2,3)}+...+S_{(k,k-1)}-S_{(k,1)}$ 由双线性映射的性质我们可以得到 $\sum_{i = 1}^{k}Sip=0$ 所以：

在这里可以将 $H_1(t)^{\sum_{i = 1}^{k}{\bar{x_i}·y_i+\gamma}}$ 看作一个随机数那么，上述的式子就是一个Paillier 密文 $\theta=g^{\bar{m}}·r^{n}$ 可以通过 $D (s k, c)$ 解密。恢复明文如下：

这里对原文中说： $\bar{m} 可以是正的（n/2)$ 有点不太理解

恢复 $m$ 后， $P$ 可以更新轮 $t + 1$ 轮： $x^{t+1}\leftarrow\sum_{i = 1}^{k}{(N_i/N)x_i=m}$
$P$ 将开始下一轮训练，重复上述所有步骤，直到全局模型达到预期性能。

总结

在本文中，我们为F-MCS应用程序提出了一个隐私保护方案，称为FedSky。FedSky通过扩展经典的FedAvg算法，基于CG-skyline技术选择合格的工作者，并安全聚合模型更新来训练全局模型。特别地，与FedAvg相比，我们的方案考虑了工人的动态性和异质性。该方法可以显著提高F-MCS模型训练过程的效率。在此基础上，设计了一种新的隐私保护数据聚合协议。该协议专为跨设备FL设置而设计，在模型训练过程中不需要操作者之间的交互。安全性分析表明，该方案保护了隐私。在一个真实的图像分类任务上进行了大量的实验。比较结果验证了工人选择的效率和FedSky对异质工人的鲁棒性。为了将来的工作，我们将在现实世界的物体检测问题中扩展FedSky。

参考

1、群智感知 https://www.jianshu.com/p/3d250028bd61

[论文阅读]Distilling Step-by-Step! Outperforming Larger Language Models with Less Training Data and Smal 0x211 论文阅读语言模型人工智能自然语言处理
中文译名：逐步蒸馏！以较少的训练数据和较小的模型规模超越较大的语言模型发布链接：http://arxiv.org/abs/2305.02301AcceptedtoFindingsofACL2023阅读原因：近期任务需要用到蒸馏操作，了解相关知识核心思想：改变视角。原来的视角：把LLMs视为噪声标签的来源。现在的视角：把LLMs视为能够推理的代理。方法好在哪？需要的数据量少，得到的结果好。文章的方法
【论文阅读】【IEEE TCYB 2023】Edge-Guided Recurrent Positioning Network forSalient Object Detection in Opt
引言任务：光学遥感图像中显著目标检测论文地址：Edge-GuidedRecurrentPositioningNetworkforSalientObjectDetectioninOpticalRemoteSensingImages|IEEEJournals&Magazine|IEEEXplore代码地址：前置知识一、摘要目前由于光学rsi中目标类型多样、目标尺度多样、目标方向众多以及背景杂乱，现有S
AI模型训练新范式：基于同态加密的隐私保护方案 AIGC应用创新大全人工智能同态加密区块链 ai
AI模型训练新范式：基于同态加密的隐私保护方案技术解析关键词同态加密（HomomorphicEncryption）、隐私保护机器学习（PPML）、全同态加密（FHE）、安全多方计算（MPC）、加密数据训练摘要本报告系统解析基于同态加密的AI模型训练新范式，覆盖从理论基础到工程实践的全生命周期。首先通过第一性原理推导同态加密的数学本质，对比传统隐私保护技术的局限性；其次构建“加密-训练-解密”全流程
大模型服务的推理优化探索半吊子全栈工匠
【引】有的事情别人不问时我们明白，一旦要我们解释它我们就不明白了，而这正是我们必须留心思索的东西。于是，开启了一次又一次的论文阅读之旅。开发并部署大模型应用肯定要考虑它们的服务成本。然而，钱并不是唯一的考虑因素，如果不能解决模型性能方面的问题，即使有很大的预算，大模型服务仍会受到影响。本文尝试讨论将LLM推理服务更改为高吞吐量引擎的挑战与应对方法。1.大模型服务面临的挑战大模型的能力令人惊叹，但其
ER综述论文阅读-Emotion recognition in EEG signals using deep learning methods: A review 今天早睡了情绪识别Emotion Recognition 论文阅读深度学习人工智能
EmotionrecognitioninEEGsignalsusingdeeplearningmethods:AreviewQ1期刊，2023论文链接：https://d1wqtxts1xzle7.cloudfront.net/105887899/emotionreview-libre.pdf?1695460941=&response-content-disposition=inline%3B+f
【论文阅读】AdaCtrl: Towards Adaptive and Controllable Reasoning via Difficulty-Aware Budgeting quintus0505 LLM 论文阅读语言模型
AdaCtrl:TowardsAdaptiveandControllableReasoningviaDifficulty-AwareBudgeting3Method3.1长度触发标签作为控制接口（Length-TriggerTagsasControllingInterface）3.2冷启动微调（Cold-startfine-tuning）3.3难度感知的强化学习框架（Difficulty-awar
【论文阅读笔记】TimesURL: Self-supervised Contrastive Learning for Universal Time Series 少写代码少看论文多多睡觉 #论文阅读笔记论文阅读笔记
TimesURL:Self-supervisedContrastiveLearningforUniversalTimeSeriesRepresentationLearning摘要学习适用于多种下游任务的通用时间序列表示，并指出这在实际应用中具有挑战性但也是有价值的。最近，研究人员尝试借鉴自监督对比学习（SSCL）在计算机视觉（CV）和自然语言处理（NLP）中的成功经验，以解决时间序列表示的问题。
【论文阅读】Decoupled Knowledge Distillation Bosenya12 论文阅读
摘要：最先进的蒸馏方法主要基于从中间层蒸馏出深层特征，而logit蒸馏的重要性则被大大忽视了。为了提供研究logit蒸馏的新观点，我们将经典的KD损失重新表述为两部分，即目标类知识蒸馏（TCKD）和非目标类知识蒸馏（NCKD）。我们实证调查并证明了两部分的效果：TCKD传递了有关训练样本“困难”的知识，而NCKD是logit蒸馏起作用的突出原因。更重要的是，我们揭示了经典的KD损失是一个耦合公式，
【论文阅读】Transfer Learning for Automatic Modulation Recognition Using a Few Modulated Signal Samples
摘要：这封信提出了一种用于自动调制识别（AMR）的迁移学习模型，该模型仅具有少量调制信号样本。传输模型以音频信号UrbanSound8K作为源域进行训练，然后以一些调制信号样本为目标域进行微调。为了提高分类性能，信噪比（SNR）被用作一个功能来促进信号的分类。仿真结果表明，迁移模型在分类精度方面具有显著优势。这篇文章的核心内容是提出了一种基于迁移学习（TransferLearning）的自动调制识
【论文阅读】Meta-SE: A Meta-Learning Framework for Few-Shot Speech Enhancement Bosenya12 论文阅读
这篇文章介绍了一个名为Meta-SE的元学习框架，专门用于少样本（few-shot）语音增强问题。文章的核心目标是解决在实际应用中，由于训练样本有限而导致传统深度神经网络（DNN）模型性能受限的问题。Meta-SE通过元学习的方法，利用先验的元知识快速适应新的任务和噪声类型，即使只有少量训练样本也能表现出色。背景知识与研究动机语音增强技术旨在从带噪语音信号中恢复目标语音，提升语音质量和可懂度。深度
【论文阅读】SASLN：小样本条件下机械故障诊断的信号增强自学习网络
SASLN:SignalsAugmentedSelf-TaughtLearningNetworksforMechanicalFaultDiagnosisUnderSmallSampleCondition本文介绍了一种名为SASLN（SignalsAugmentedSelf-TaughtLearningNetworks）的方法，专门用于在小样本条件下对风力发电机（WT）的发电机轴承故障进行诊断。该方
【论文阅读】SSCL-AMC：一种基于动态增强和集成学习的自监督自动调制分类方法
SSCL-AMC:ASelf-supervisedAutomaticModulationClassificationMethodviaDynamicAugmentationandEnsembleLearning摘要：与传统的手工自动调制分类（AMC）方法相比，深度学习已经显示出有希望的结果，AMC作为信号检测和调制之间的中间步骤发挥着关键作用。然而，获取大规模标记数据仍然具有挑战性，因为数据质量和
[论文阅读] 人工智能 + 软件工程 | 当 LLM 写代码时，它的 “思考过程” 靠谱吗？—— 揭秘 CoT 质量的那些事儿张较瘦_ 前沿技术论文阅读人工智能软件工程
当LLM写代码时，它的“思考过程”靠谱吗？——揭秘CoT质量的那些事儿论文标题：AreTheyAllGood?EvaluatingtheQualityofCoTsinLLM-basedCodeGenerationarXiv:2507.06980[pdf,html,other]AreTheyAllGood?EvaluatingtheQualityofCoTsinLLM-basedCodeGenera
AAAI—24—Main—paper（关于Multi—Modal的全部文章摘要）
我们生活在一个由多种模态（Multimodal）信息构成的世界，包括视觉信息、听觉信息、文本信息、嗅觉信息等等，当研究的问题或者数据集包含多种这样的模态信息时我们称之为多模态学习多模态机器学习旨在处理学习（视觉，听觉，语言等）不同模态融合交织的信息。下游任务（1）视觉问答1.视觉问答(visualquestionanswering,VQA).给予视觉输入(图像或视频),VQA代表了正确提供一个问题
VIT视觉妄想成为master opencv 目标检测机器学习数据挖掘语音识别人工智能计算机视觉
VisionTransformer视觉和语言(Vision-Language)NLPrompt:Noise-LabelPromptLearningforVision-LanguageModelsPaper:https://arxiv.org/abs/2412.01256Code:GitHub-qunovo/NLPromptPhysVLM:EnablingVisualLanguageModelsto
[论文阅读] 人工智能 + 软件工程 | 需求获取访谈中LLM生成跟进问题研究：来龙去脉与创新突破
需求获取访谈中LLM生成跟进问题研究：来龙去脉与创新突破论文标题：RequirementsElicitationFollow-UpQuestionGenerationarXiv:2507.02858RequirementsElicitationFollow-UpQuestionGenerationYuchenShen,AnmolSinghal,TravisBreauxComments:13page
python 科研作图_Origin科研绘图 weixin_39525933 python 科研作图
前言入了生物学的坑，狗狗们需要时不时的画一些图，看着别人高大上的图片，大家有没有好奇这些图片是怎么做出来的呢?就本狗狗来看(狗狗可能来自农村-_-,)，现在铺天盖地的paper里的图，有些，当然本身就是照片啦，比如跑胶啊WB啊，有些是用R、python、或者matlab做的，那么对于不懂编程的狗狗来说，就需要利用一些趁手作图软件，也可以做出毫不逊色于前者的美图，常见的这类软件有origin，gra
Prompt相关论文阅读(02)--Auto-CoT(2024-11-25) zhilanguifang 论文 prompt engineering 论文阅读笔记
论文阅读笔记2024-11-24~2024-11-25Auto-CoT:AutomaticChainofThoughtPromptinginLargeLanguageModels(ICLR2023)碎碎念：复现代码和笔记保存到gitee仓库上海交通大学的学生在亚马逊实习的时候的成果ICLR2023摘要：LLM能够通过生成中间推理步骤执行复杂的推理。提供这些步骤用于提示演示叫做思维链提示CoT。Co
语言大模型综述
Paper:ASurveyofLargelanguageModels目录Paper:ASurveyofLargelanguageModels综述概要LLM关键技术规模定律（ScalingLaws）预训练与微调对齐调优（AlignmentTuning）外部工具集成GPT系列模型的技术演进模型检查点和APIPre-Training数据准备和处理数据准备数据预处理数据调度架构EmergentArchit
Aurora中插入伪代码的字体设置
中文：宋体英文：TimesNewRoman公式：LatinModernMath，跟包newtxmath有关word里面插入对象-->选择AuroraEquation-->Properties-->Packages，复制以下代码：%!TEXprogram=xelatex%强制使用XeLaTeX引擎\documentclass[a4paper]{article}%\usepackage{mathptm
【论文阅读】Dynamic Few-Shot Visual Learning without Forgetting Bosenya12 论文阅读
系统概述如下：(a)一个基于卷积神经网络（ConvNet）的识别模型，该模型包含特征提取器和分类器；(b)一个少样本分类权重生成器。这两个组件都是在一组基础类别上训练的，我们为这些类别准备了大量训练数据。在测试阶段，权重生成器会接收少量新类别的训练数据以及基础类别的分类权重向量（分类器框内的绿色矩形），并为新类别生成相应的分类权重向量（分类器框内的蓝色矩形）。这样，卷积神经网络就能同时识别基础类别
【论文阅读】Few-Shot PPG Signal Generation via Guided Diffusion Models Bosenya12 论文阅读
从少量样本数据选择到后处理的整体框架。首先，扩散模型在N样本数据集和指导下的训练。接着，模型生成一个增强的数据集，并进一步优化以提高保真度。最后，这些合成数据与少量样本训练数据集结合，用于基准模型的训练和评估。数据分布从最初的红色变为保真度增强的蓝色，这表明模型与真实数据更加吻合，如简化后的数据分布示意图所示。这篇文章的核心内容是介绍了一种名为BG-Diff（Bi-GuidedDiffusion）
[论文阅读] 人工智能 | 读懂Meta-Fair：让LLM摆脱偏见的自动化测试新方法张较瘦_ 前沿技术论文阅读人工智能
读懂Meta-Fair：让LLM摆脱偏见的自动化测试新方法论文标题：Meta-Fair:AI-AssistedFairnessTestingofLargeLanguageModelsarXiv:2507.02533Meta-Fair:AI-AssistedFairnessTestingofLargeLanguageModelsMiguelRomero-Arjona,JoséA.Parejo,Jua
SurveyForge：AI自动撰写综述论文的革命性工具，助力科研效率跃升花生糖@ AIGC学习资料库人工智能 AI论文 AI助手
在学术研究领域，综述论文（SurveyPaper）的撰写是一项耗时且复杂的任务，通常需要数周甚至数月的文献调研与内容整合。如今，上海人工智能实验室、复旦大学与上海交通大学联合开源的SurveyForge，通过创新的AI技术，将这一过程压缩至10分钟内，且生成质量接近人工水平，成为科研人员的得力助手。项目简介SurveyForge是一款基于大语言模型（LLM）的自动综述论文生成工具，专为计算机科学领
【LLM论文阅读】一只齐刘海的猫论文阅读
LLM论文阅读论文重点论文链接RopeRoFormer:EnhancedTransformerwithRotaryPositionEmbeddingRoPE论文阅读YarnUnderstandingYaRN:ExtendingContextWindowofLLMs论文YaRN笔记T5ExploringtheLimitsofTransferLearningwithaUnifiedText-to-Te
Segment Anything in High Quality之SAM-HQ论文阅读 qq_41627642 深度学习论文阅读论文阅读
摘要最近的SegmentAnythingModel（SAM）在扩展分割模型规模方面取得了重大突破，具备强大的零样本能力和灵活的提示机制。尽管SAM在训练时使用了11亿个掩码，其掩码预测质量在许多情况下仍不理想，尤其是对于结构复杂的目标。我们提出了HQ-SAM，使SAM能够精确地分割任意目标，同时保留其原有的可提示设计、高效性和零样本泛化能力。我们的设计充分复用并保留了SAM预训练的模型权重，仅引入
2025年电子工程、计算机应用与信号处理国际会议（EECASP 2025）学术交流国际学术会议论文征稿 EI会议
2025年电子工程、计算机应用与信号处理国际会议（EECASP2025）2025InternationalConferenceonElectronicEngineering,ComputerApplications,andSignalProcessing一、大会信息会议简称：EECASP2025大会地点：中国·苏州审稿通知：投稿后2-3日内通知投稿邮箱：[email protected]二、
CHES2024 issue-1文章总结打工小熊猫密码学文献分类总结 arm开发同态加密零知识证明密码学网络攻击模型安全威胁分析计算机网络
来源：https://ches.iacr.org/2024/acceptedpapers.php简要分类：分类文章编号后量子密码软硬件加速相关无侧信道攻防相关1、10、11、12、14、15同态相关18、19、201.Gadget-basedMaskingofStreamlinedNTRUPrimeDecapsulationinHardwareGeorgLand,AdrianMarotzke,Ja
2025年数字信号、计算机通信与软件工程国际会议（DSCCSE 2025）学术交流国际学术会议论文征稿 EI会议
2025年数字信号、计算机通信与软件工程国际会议（DSCCSE2025）2025InternationalConferenceonDigitalSignal,ComputerCommunication,andSoftwareEngineering一、大会信息会议简称：DSCCSE2025大会地点：中国·北京审稿通知：投稿后2-3日内通知投稿邮箱：[email protected]二、会议简介
推荐文章：探索深度学习的不确定性边界 —— SDE-Net 开源项目解析史多苹Thomas
推荐文章：探索深度学习的不确定性边界——SDE-Net开源项目解析SDE-NetCodeforpaper:SDE-Net:EquippingDeepNeuralnetworkwithUncertaintyEstimates项目地址:https://gitcode.com/gh_mirrors/sd/SDE-Net在当今的人工智能领域，深度神经网络(DNN)已经成为推动技术创新的基石。然而，其预测的
iOS http封装 374016526 ios 服务器交互 http 网络请求
程序开发避免不了与服务器的交互，这里打包了一个自己写的http交互库。希望可以帮到大家。内置一个basehttp，当我们创建自己的service可以继承实现。 KuroAppBaseHttp *baseHttp = [[KuroAppBaseHttp alloc] init]; [baseHttp setDelegate:self]; [baseHttp
lolcat ：一个在 Linux 终端中输出彩虹特效的命令行工具 brotherlamp linux linux教程 linux视频 linux自学 linux资料
那些相信 Linux 命令行是单调无聊且没有任何乐趣的人们，你们错了，这里有一些有关 Linux 的文章，它们展示着 Linux 是如何的有趣和“淘气” 。在本文中，我将讨论一个名为“lolcat”的小工具 – 它可以在终端中生成彩虹般的颜色。何为 lolcat ? Lolcat 是一个针对 Linux，BSD 和 OSX 平台的工具，它类似于 cat 命令，并为 cat
MongoDB索引管理（1）——[九] eksliang mongodb MongoDB管理索引
转载请出自出处：http://eksliang.iteye.com/blog/2178427 一、概述数据库的索引与书籍的索引类似，有了索引就不需要翻转整本书。数据库的索引跟这个原理一样，首先在索引中找，在索引中找到条目以后，就可以直接跳转到目标文档的位置，从而使查询速度提高几个数据量级。不使用索引的查询称
Informatica参数及变量 18289753290 Informatica 参数变量
下面是本人通俗的理解，如有不对之处，希望指正 info参数的设置：在info中用到的参数都在server的专门的配置文件中（最好以parma）结尾下面的GLOBAl就是全局的，$开头的是系统级变量，$$开头的变量是自定义变量。如果是在session中或者mapping中用到的变量就是局部变量，那就把global换成对应的session或者mapping名字。 [GLOBAL] $Par
python 解析unicode字符串为utf8编码字符串酷的飞上天空 unicode
php返回的json字符串如果包含中文，则会被转换成\uxx格式的unicode编码字符串返回。在浏览器中能正常识别这种编码，但是后台程序却不能识别，直接输出显示的是\uxx的字符，并未进行转码。转换方式如下 >>> import json >>> q = '{"text":"\u4
Hibernate的总结永夜-极光 Hibernate
1.hibernate的作用,简化对数据库的编码,使开发人员不必再与复杂的sql语句打交道做项目大部分都需要用JAVA来链接数据库，比如你要做一个会员注册的页面，那么获取到用户填写的基本信后，你要把这些基本信息存入数据库对应的表中，不用hibernate还有mybatis之类的框架，都不用的话就得用JDBC，也就是JAVA自己的，用这个东西你要写很多的代码，比如保存注册信
SyntaxError: Non-UTF-8 code starting with '\xc4' 随便小屋 python
刚开始看一下Python语言，传说听强大的，但我感觉还是没Java强吧！写Hello World的时候就遇到一个问题，在Eclipse中写的，代码如下 ''' Created on 2014年10月27日 @author: Logic ''' print("Hello World!"); 运行结果 SyntaxError: Non-UTF-8
学会敬酒礼仪不做酒席菜鸟 aijuans 菜鸟
俗话说，酒是越喝越厚，但在酒桌上也有很多学问讲究，以下总结了一些酒桌上的你不得不注意的小细节。细节一：领导相互喝完才轮到自己敬酒。敬酒一定要站起来，双手举杯。细节二：可以多人敬一人，决不可一人敬多人，除非你是领导。细节三：自己敬别人，如果不碰杯，自己喝多少可视乎情况而定，比如对方酒量，对方喝酒态度，切不可比对方喝得少，要知道是自己敬人。细节四：自己敬别人，如果碰杯，一
《创新者的基因》读书笔记 aoyouzi 读书笔记《创新者的基因》
创新者的基因创新者的“基因”，即最具创意的企业家具备的五种“发现技能”：联想，观察，实验，发问，建立人脉。第一部分破坏性创新，从你开始第一章破坏性创新者的基因如何获得启示：发现以下的因素起到了催化剂的作用：(1) -个挑战现状的问题；(2)对某项技术、某个公司或顾客的观察；(3) -次尝试新鲜事物的经验或实验；(4)与某人进行了一次交谈，为他点醒
表单验证技术百合不是茶 JavaScript DOM对象 String对象事件
js最主要的功能就是验证表单,下面是我对表单验证的一些理解,贴出来与大家交流交流 ,数显我们要知道表单验证需要的技术点, String对象,事件,函数一:String对象;通常是对字符串的操作; 1,String的属性; 字符串.length;表示该字符串的长度; var str= "java"
web.xml配置详解之context-param bijian1013 java servlet web.xml context-param
一.格式定义： <context-param> <param-name>contextConfigLocation</param-name> <param-value>contextConfigLocationValue></param-value> </context-param> 作用：该元
Web系统常见编码漏洞（开发工程师知晓） Bill_chen sql PHP Web fckeditor 脚本
1.头号大敌：SQL Injection 原因：程序中对用户输入检查不严格，用户可以提交一段数据库查询代码，根据程序返回的结果，获得某些他想得知的数据，这就是所谓的SQL Injection，即SQL注入。本质: 对于输入检查不充分，导致SQL语句将用户提交的非法数据当作语句的一部分来执行。示例： String query = "SELECT id FROM users
【MongoDB学习笔记六】MongoDB修改器 bit1129 mongodb
本文首先介绍下MongoDB的基本的增删改查操作，然后，详细介绍MongoDB提供的修改器，以完成各种各样的文档更新操作 MongoDB的主要操作 show dbs 显示当前用户能看到哪些数据库 use foobar 将数据库切换到foobar show collections 显示当前数据库有哪些集合 db.people.update，update不带参数，可
提高职业素养，做好人生规划白糖_ 人生
培训讲师是成都著名的企业培训讲师，他在讲课中提出的一些观点很新颖，在此我收录了一些分享一下。注：讲师的观点不代表本人的观点，这些东西大家自己揣摩。 1、什么是职业规划：职业规划并不完全代表你到什么阶段要当什么官要拿多少钱，这些都只是梦想。职业规划是清楚的认识自己现在缺什么，这个阶段该学习什么，下个阶段缺什么，又应该怎么去规划学习，这样才算是规划。
国外的网站你都到哪边看？ bozch 技术网站国外
学习软件开发技术，如果没有什么英文基础，最好还是看国内的一些技术网站，例如：开源OSchina，csdn，iteye,51cto等等。个人感觉如果英语基础能力不错的话，可以浏览国外的网站来进行软件技术基础的学习，例如java开发中常用的到的网站有apache.org 里面有apache的很多Projects,springframework.org是spring相关的项目网站,还有几个感觉不错的
编程之美-光影切割问题 bylijinnan 编程之美
package a; public class DisorderCount { /**《编程之美》“光影切割问题” * 主要是两个问题： * 1.数学公式（设定没有三条以上的直线交于同一点）： * 两条直线最多一个交点，将平面分成了4个区域； * 三条直线最多三个交点，将平面分成了7个区域； * 可以推出：N条直线 M个交点，区域数为N+M+1。
关于Web跨站执行脚本概念 chenbowen00 Web 安全跨站执行脚本
跨站脚本攻击(XSS)是web应用程序中最危险和最常见的安全漏洞之一。安全研究人员发现这个漏洞在最受欢迎的网站,包括谷歌、Facebook、亚马逊、PayPal,和许多其他网站。如果你看看bug赏金计划,大多数报告的问题属于 XSS。为了防止跨站脚本攻击,浏览器也有自己的过滤器,但安全研究人员总是想方设法绕过这些过滤器。这个漏洞是通常用于执行cookie窃取、恶意软件传播,会话劫持,恶意重定向。在
[开源项目与投资]投资开源项目之前需要统计该项目已有的用户数 comsci 开源项目
现在国内和国外,特别是美国那边,突然出现很多开源项目,但是这些项目的用户有多少,有多少忠诚的粉丝,对于投资者来讲,完全是一个未知数,那么要投资开源项目,我们投资者必须准确无误的知道该项目的全部情况,包括项目发起人的情况,项目的维持时间..项目的技术水平,项目的参与者的势力,项目投入产出的效益.....
oracle alert log file（告警日志文件） daizj oracle 告警日志文件 alert log file
The alert log is a chronological log of messages and errors, and includes the following items: All internal errors (ORA-00600), block corruption errors (ORA-01578), and deadlock errors (ORA-00060)
关于 CAS SSO 文章声明 denger SSO
由于几年前写了几篇 CAS 系列的文章，之后陆续有人参照文章去实现，可都遇到了各种问题，同时经常或多或少的收到不少人的求助。现在这时特此说明几点： 1. 那些文章发表于好几年前了，CAS 已经更新几个很多版本了，由于近年已经没有做该领域方面的事情，所有文章也没有持续更新。 2. 文章只是提供思路，尽管 CAS 版本已经发生变化，但原理和流程仍然一致。最重要的是明白原理，然后
初二上学期难记单词 dcj3sjt126com english word
lesson 课 traffic 交通 matter 要紧；事物 happy 快乐的，幸福的 second 第二的 idea 主意；想法；意见 mean 意味着 important 重要的，重大的 never 从来，决不 afraid 害怕的 fifth 第五的 hometown 故乡，家乡 discuss 讨论；议论 east 东方的 agree 同意；赞成 bo
uicollectionview 纯代码布局, 添加头部视图 dcj3sjt126com Collection
#import <UIKit/UIKit.h> @interface myHeadView : UICollectionReusableView { UILabel *TitleLable; } -(void)setTextTitle; @end #import "myHeadView.h" @implementation m
N 位随机数字串的 JAVA 生成实现 FX夜归人 java Math 随机数 Random
/** * 功能描述随机数工具类<br /> * @author FengXueYeGuiRen * 创建时间 2014-7-25<br /> */ public class RandomUtil { // 随机数生成器 private static java.util.Random random = new java.util.R
Ehcache（09）——缓存Web页面 234390216 ehcache 页面缓存
页面缓存目录 1 SimplePageCachingFilter 1.1 calculateKey 1.2 可配置的初始化参数 1.2.1 cach
spring中少用的注解@primary解析 jackyrong primary
这次看下spring中少见的注解@primary注解，例子 @Component public class MetalSinger implements Singer{ @Override public String sing(String lyrics) { return "I am singing with DIO voice
Java几款性能分析工具的对比 lbwahoo java
Java几款性能分析工具的对比摘自：http://my.oschina.net/liux/blog/51800 在给客户的应用程序维护的过程中，我注意到在高负载下的一些性能问题。理论上，增加对应用程序的负载会使性能等比率的下降。然而，我认为性能下降的比率远远高于负载的增加。我也发现，性能可以通过改变应用程序的逻辑来提升，甚至达到极限。为了更详细的了解这一点，我们需要做一些性能
JVM参数配置大全 nickys jvm 应用服务器
JVM参数配置大全 /usr/local/jdk/bin/java -Dresin.home=/usr/local/resin -server -Xms1800M -Xmx1800M -Xmn300M -Xss512K -XX:PermSize=300M -XX:MaxPermSize=300M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=5 -
搭建 CentOS 6 服务器(14) - squid、Varnish rensanning varnish
（一）squid 安装 # yum install httpd-tools -y # htpasswd -c -b /etc/squid/passwords squiduser 123456 # yum install squid -y 设置 # cp /etc/squid/squid.conf /etc/squid/squid.conf.bak # vi /etc/
Spring缓存注解@Cache使用 tom_seed spring
参考资料 http://www.ibm.com/developerworks/cn/opensource/os-cn-spring-cache/ http://swiftlet.net/archives/774 缓存注解有以下三个： @Cacheable @CacheEvict @CachePut
dom4j解析XML时出现"java.lang.noclassdeffounderror: org/jaxen/jaxenexception"错误 xp9802
java.lang.NoClassDefFoundError: org/jaxen/JaxenExc 关键字: java.lang.noclassdeffounderror: org/jaxen/jaxenexception 使用dom4j解析XML时，要快速获取某个节点的数据，使用XPath是个不错的方法，dom4j的快速手册里也建议使用这种方式执行时却抛出以下异常： Exceptio