lingpy

跨媒体检索（关联）之基于CCA的方法大总结

跨媒体检索相关英文论文下载地址

文章目录

背景
1 2010-A New Approach to Cross-Modal Multimedia Retrieval[1]

1.1 主要思想
1.2 模型

1.2.1 问题

1.2.2 CM
1.2.3 SM
1.2.4 SCM

1.3 实验
1.4 讨论

2 2013-Deep Canonical Correlation Analysis[2]

2.1 主要思想
2.2 KCCA
2.3 DCCA
2.4 实验

3 2014-Cluster Canonical Correlation Analysis[4]

3.1主要思想
3.2 模型
3.3 实验

3.3.1 数据集
3.3.2 预处理和结果

3.4 结论

4 2014-On the Role of Correlation and Abstraction in Cross-Modal Multimedia Retrieval[5]

4.1 主要思想
4.2 模型

4.2.1 相关匹配（CM）
4.2.2 语义匹配（SM）
4.2.3 语义相关篇匹配（SCM）

4.3 实验
4.4 讨论

5 2015- Multi-Label Cross-modal Retrieval[6]

5.1 主要思想
5.2 模型

5.3 多标签典型相关分析算法（Multi-Label C anonical Correlation Analysis,ml-CCA）

5.4 实验

参考文献

背景

跨媒体既表现为包括文本、图像、音频、视频等媒体类型混合并存，又表现为各种媒体类型形成复杂的关联关系和组织结构。如何在不同媒体之间建立一种联系使得能够统一的表达跨媒体信息是目前跨媒体研究的一个重要挑战。
常见的方法是建立一个共享子空间，不同媒体类型的数据对象的相似性可以映射到这个子空间中使用常见的距离度量（如欧几里得和余弦距离）算法直接计算。

本文依据几篇经典的论文，介绍了几种基于典型相关分析（CCA）的方法。

1 2010-A New Approach to Cross-Modal Multimedia Retrieval[1]

1.1 主要思想

本文研究多媒体文本和图像联合建模问题。

表示：
文本使用LDA（latent Dirichlet allocation）模型表示。
图像使用SIFT特征表示。
学习模型：CM/SM/SCM
数据集：Wikipedia dataset.
创新之处：
提出三种子空间学习模型。
增加语义层的推断。例如，将层次主题模型用于文本聚类或层次语义表示用于图像检索。通过将图像和文档利用逻辑回归算法建模为关于一组预定义文档类的后验概率向量，并与通过CCA学习后的子空间联合，提出一个语义相关匹配（SCM）跨媒体检索模型。

1.2 模型

图1.1 跨媒体检索模型系统

1.2.1 问题

在 $R^I和R^T$ 特征空间中表示图像和文本向量，每个文档和图像与各自的空间中的点建立一对一的映射。目标是给定一个查询文本（图像） $T_q ∈R^T（I_q ∈R^I）$ ，检索模型在图像空间 $R^I$ （文本空间 $R^T$ ）中返回最相近的匹配。

一般情况下，在 $R^I$ 和 $R^T$ 建立一个可逆映射，如：
$M: R^T→R^I$
给定一个 $T_q \ in\ R^T$ ，返回一个最近匹配 $M(T_q ) \ in\ R^I$ ，反之同。

但由于文本和图像的表示方法不同，因此上述表示不能直接建立。一种方法是，建立两个中间空间用来映射这两种表示，如：
$M_I: R^I→U^I$ $M_T: R^T→U^T$
$U^I,U^T$ 空间是同构的，因此可以建立一个映射，如：
$M: U^T→U^I.$
给定一个 $T_q \ in\ R^T$ 。返回最近匹配 $M_I^{-1}∘M∘M_T (T_q ) \ in\ R^I$ ,反之，给定 $I_q \ in\ R^I$ ,返回 $M_T^{-1}∘M^{-1}∘M_I (I_q ) \ in\ R^T.$
所以在这种情况下，目标是学习 $U^I,U^T$ 。

论文提出3种方法，分别是 $C o r r e l a t i o n m a t c h i n g (C M)$ ， $S e m a n t i c m a t c h i n g (S M)$ ， $S e m a n t i c c o r r e l a t i o n m a t c h i n g (S C M)$ .

1.2.2 CM

第一种方法，建立两个线性投影矩阵：
$P_T: R^T→U^T$ $P_I: R^I→U^I$
分别将 $R^I,R^T$ 映射到相关的d维子空间 $U^I,U^T$ ，其维持了表示的抽象层级。

这里使用了典型相关分析（Canonical correlation analysis ,CCA）方法学习子空间 $U^I⊂R^I$ , $U^T⊂R^T$ 。CCA是一种类似于PCA的数据分析和降维方法，和PCA不同的是CCA可以对两个空间进行降维，并提供相同的异构表示。

定义 $w_i∈R^I,w_t∈R^T$ ,目标是最大化文本和图像变量的相关性，如，
$\max_{w_i\neq0,w_t\neq0} \frac{w_i^T\sum_{IT}w_t} {\sqrt{w_i^T\sum_{II}w_i}\sqrt{w_t^T\sum_{TT}w_t}} \tag{1-1}$
$\sum_{II}$ 和 $\sum_{TT}$ 分别表示图像 ${I_1,...,I_(|D|)}$ 和文本${T_1,…,T_(|D|)} $经验协相关矩阵\sum_{IT}$ $=$ $\sum_{TI}^T$ 是其交叉-协相关矩阵。
公式（1-1）可以转化为一个一般的求特征值的问题（generalized eigenvalue problem，GEV）。首先利用LDA优化问题，固定分母，求分子最大化。如：
$\ imize \ w_i^T\sum_{IT}w_t \\ s.t. \ w_i^T\sum_{II}w_i=1,w_t^T\sum_{TT}w_t=1 \tag{1-2}$
求解此问题可以用拉格朗日乘数法，令：
$w_i^T\sum_{IT}w_t - \frac {\lambda}{2}({w_i^T\sum_{II}w_i-1})-\frac {\theta}{2}(w_t^T\sum_{TT}w_t-1) , \tag{1-3}$
对（1-3）求偏导，得到 $\frac{\partial L} {\partial w_i}$ 和 $\frac{\partial L} {\partial w_t}$ ，令其等于0，得：
$\begin{cases} \sum_{IT}w_t-\lambda \sum_{II}w_i=0,\\\sum_{TI}w_i-\theta \sum_{TT}w_t=0. \end{cases} \tag{1-4}$
公式（1-4）可以转化为一个求特征值问题，简化得：
$\begin{pmatrix} 0 & \sum_{IT} \\\\ \sum_{TI} & 0 \\ \end{pmatrix} \begin{pmatrix} w_i \\\\ w_t \\ \end{pmatrix} = \lambda \begin{pmatrix} \sum_{II} &0 \\\\ 0 & \sum_{TT}\end{pmatrix} \begin{pmatrix} w_i \\\\ w_t \\ \end{pmatrix}. \tag{1-5}$
最终求出 $λ$ 和 $w_i,w_t$ .
应用于跨媒体检索中，每个文本 $T∈ R^T$ 被映射到其投影 $p_{T}=P_T (T)$ 到 ${w_(t,k)}_{k=1}^d$ 上，图像与之类似。这样向量 $p_T$ 和 $p_I$ 分别是两个同构d维子空间 $U^T和U^I$ 的坐标，它们也被认为是属于通过 $U^T$ 和 $U^I$ 叠加而形成的单个空间 $U$ .
给定一个图像 $I_q$ ,且 $p_I=P(I_q)$ ,目标是求使得公式（1-6）最小的 $p_T=P_T (T)$ 的值 $T ∈ R^T）$ ，并返回最相似的匹配 $T$ ，式（1-6）如下：
$d(p_I,p_T) \tag{1-6}$
式（1-6）中 $d$ 是一种距离度量公式。
以上检索类型被定义为 $c o r r e l a t i o n m a t c h i n g$ .

1.2.3 SM

第二种方法，建立两个非线性转换：
$L_T: R^T→S^T$ $L_I: R^I→S^I$
将 $R^I,R^T$ 映射到一对语义空间 $S^T, S^I, s.t. S^T= S^I$ 。其增加了表示的语义抽象。

首先在数据库中定义语义概念词典 $V=\lbrace{ v_1,…,v_K }\rbrace$ ,其中 $v_K$ 表示一个类，比如“History” 或者 “Biology”。
$L_T$ 将一个文本 $\in R^T$ 映射到一个后验概率向量 $P_(V|T) (v_i│T),i∈\lbrace{1,…,K}\rbrace$ .这些向量构成一个语义空间 $S^T$ ，类似地，图像的语义空间为 $S^I$ 。

一种求后验概率分布的方法是多类逻辑回归算法。逻辑回归通过训练数据得到一个回归函数，从而计算一个类j的后验概率。回归函数公式如下：
$P_{V|X}(j|x;w)=\frac{1}{Z(x,w)}exp(w_j^Tx) \tag{1-7}$
其中 $Z(x,w)=∑_jexp(w_j^T x)$ 是归一化常数， $V$ 代表类别集合， $X$ 是输入的特征向量集合， $w_j$ 是类 $j$ 的参数向量。

由于 $S^T$ 和 $S^I$ 在相同的文档类中表示的后验概率向量空间，因此 $S^T$ 和 $S^I$ 是同构的，即认为 $S^T=S^I$ 。
给定一个图像 $I_q$ ,将其表示为概率向量 $π_I∈S^I$ ,通过最小化公式（1-8）得到 $π_T∈S^T$ ,公式如下：
$D(I,T)=d(\pi_I,\pi_T) \tag{1-8}$
这种检索类型被定义为 $s e m a n t i c m a t c h i n g$ 。

1.2.4 SCM

第三种方法，将1,2联合。
首先，使用CCA学习子空间 $U^I⊂R^I,U^T⊂R^T$ ，然后用逻辑回归算法在第一步基础上学习语义空间 $S^T$ 和 $S^I$ ，最后根据公式（1-8）检索，其中 $π_I=L_I (P_I (I)), π_T=L_T (P_T (T))$ .

这种检索类型被定义为 $s e m a n t i c c o r r e l a t i o n m a t c h i n g (S C M)$ .

1.3 实验

在Wikipedia dataset中检索结果如截图所示。

图1.2 不同距离度量下的检索结果

图1.2 最佳检索结果

1.4 讨论

CCA方法只能解决线性表示的数据，Hwang[3]等人提出KCCA，可以表示非线性数据。
KCCA相对CCA的优势是：

由于其复杂的函数空间，使用足够的训练数据可以用来表示更高的相关性。
可以生成特征以提高分类器性能。
不足：
训练速度慢。
测试时需要用到训练集，因此事先要存储训练集。
模型难以解释。
以上参考网站

2 2013-Deep Canonical Correlation Analysis[2]

2.1 主要思想

本文提出DCCA。实验表明，相比于CCA和KCCA，使用DCCA在相关性测量上具有更好的表示。

2.2 KCCA

原论文见[3]，关于KCCA的详细原理见博客。
普通的线性CCA只能探索两组随机变量之间的线性关系，而在实际情况中，变量间的关系往往是非线性的，于是非线性的CCA出现了，KCCA就是一种常用的非线性CCA算法。
KCCA是把核函数的思想引入CCA中，思想是把低维的数据映射到高维的特征空间（核函数空间），并通过核函数方便地在核函数空间进行关联分析。

2.3 DCCA

KCCA方法虽然解决了数据的非线性问题，但是由于其核函数选取的不可知性，训练开销较大，模型较为复杂，因此DCCA被提出以解决这些问题。
神经网络解决非线性问题的时候，是通过嵌入每个层次的非线性函数来解决的，Deep CCA就是先用深度神经网络分别求出两个视图的经过线性化的向量，然后求出两个投影向量的最大相关性，最后求出新的投影向量。用这个投影向量加入到机器学习算法进行分类，聚类回归。
关于DCCA的详细原理见博客和原论文[2]。

2.4 实验

DCCA也能解决非线性问题，论文中的实验室在2种数据集（MNIST handwritten digits和Articulatory speech data）上进行，在这两个数据集上做相关性测试。结果略。

3 2014-Cluster Canonical Correlation Analysis[4]

3.1主要思想

本文解决了CCA要求数据必须是配对的条件限制。何为配对限制？一句话解释即运用CCA算法处理两个模态的数据时，必须一个文本对应一个图像且同时处理。
本文提出的cluster-CCA、mean-CCA和cluster-KCCA可以解决上述问题。
关于以上提到的几种方法，图3.1可以帮助我们更好的理解。

图 3.1 获取两个集合的相关子空间的各种方法表示

CCA：使用集合之间的成对对应关系，不能分离两个集合
CCA for sets：计算两个子空间之间的主角，不能处理多个集合
cluster-CCA：使用集群内的所有成对对应
Mean-CCA：计算平均聚类向量之间的CCA

3.2 模型

有两组数据，每组数据分为C个不同但相互对应的类，令 $T_x=\lbrace{X_1,X_2,…,X_C}\rbrace$ 和 $T_y=\lbrace{Y_1,Y_2,…,Y_C}\rbrace$ ，其中 $X_c=\lbrace{x_1^C,…,x_{|X_c|}^C}\rbrace$ 和 $Y_c=\lbrace{y_1^C,…,y_{|Y_c |}^C}\rbrace$ 分别为集合中第C类的数据点。

通过选择方向 $w$ 和 $v$ 找到 $X$ 和 $y$ 的新坐标，使得 $T_x$ 和 $T_y$ 在 $w$ 和 $v$ 上的投影有最大的相关性，同时，类之间可以很好地分离。但是无法直接计算这些投影之间的相关性，因为他们在 $w$ 和 $v$ 上的投影没有任何直接的对应关系。因此提出了Mean-CCA与Cluster-CCA。
关于这两个模型的详细解释参考博客。

3.3 实验

3.3.1 数据集

本文使用了5种数据集：Pascal VOC 2007, TVGraz, Wiki Text-Image Dataset, Heterogeneous Face Biometrics (HFB) and Materials Dataset.

3.3.2 预处理和结果

举例，预处理wiki数据集，采用10-主题LDA模型提取文本特征，dense SIFT BOW提取图像特征。
跨媒体检索-PR曲线

图3.2 跨媒体检索PR曲线（数据集TVGraz）

跨媒体检索MAP分数

图3.3 跨媒体检索MAP分数

从图3.3看出，mean-CCA的性能高于CCA，KCCA的性能也不是太好，而cluster-CCA和cluster-KCCA的性能明显优于其他算法。

与现存的方法比较。其中 $SM（χ^2 ）$ 是 $S M$ 方法使用了 $S V M$ 作为分类器。

图3.4 与现存的方法比较

3.4 结论

将CCA和cluster-CCA核化后，可以将其应用范围扩展至非线性，将CCA改进至cluster- CCA后，可以改进CCA只能应用于所有数据必须成对对应的数据集的性能，即：拓宽了应用范围。当然，也是有一定弊端的，就是在大型数据集上使用时，计算量很大，因为它在计算协方差的时候对数据的数量呈平方的关系增长。

4 2014-On the Role of Correlation and Abstraction in Cross-Modal Multimedia Retrieval[5]

4.1 主要思想

本文实际上是对2010年论文[1]所提出方法的一个整合，使其更加完整。同样包括CM、SM、SCM算法。
本文给出一个CCA方法如何学习子空间的原理图，笔者认为这个图很形象的解释了CM方法。

图4.1 CM方法原理图
同样，本文也给出了SM方法原理图。（同样很形象）

图4.2 SM方法原理图

4.2 模型

大体上与[1]类似。相对于[1]，本文对跨媒体检索方法做了一些分类，包括以下几个方面。

4.2.1 相关匹配（CM）

关于CM详见1.2.2。本文总结了4个部分，分别是线性子空间学习、非线性子空间学习、图像和文本投影以及相关匹配（最后两个部分见1.2.2）。

线性子空间学习。包括CFA（如下图）和CCA算法（见1.2.2）。

图4.3 CFA算法描述

非线性子空间学习。主要指KCCA算法，详见2.2。

4.2.2 语义匹配（SM）

这一部分与1.2.3方法类似。不同之处是增加了另外两种分类器。
原1.2.3在求语义空间的映射矩阵时用到了逻辑回归算法。本文又增加了SVM算法和Boosting方法。其相关原理简单介绍如下。
SVM学习两个类之间最大边距的分离超平面，其优化函数如下:
$\min_{w,b,\xi}\frac{1}{2}w'w+C\sum_i\xi_i \\ s.t.\ y_i(w'x_i+b) \geq 1-\xi_i,\forall i \ \xi_i \geq0, \tag{1-9}$
$w$ 和 $b$ 是超平面参数， $y_i$ 是类标签， $x_i$ 是输入特征向量， $ξ_i$ 是松弛变量， $C > 0$ 是异常值（孤立点）的惩罚系数，
Boosting方法通过联合一系列弱学习器变为一个强规则学习器。详细描述自行百度or谷歌。

4.2.3 语义相关篇匹配（SCM）

见本文1.2.4。

4.3 实验

本文实验更加丰富，并加入了一些优化方法。
首先进行了使用不同距离度量方法的实验，包括Kullback-Leibler divergence（KL），l_1和l_2范数，normalized correlation (NC) 和 centered normalized correlation (NC_c)。实验结果表明NC_c性能最好，因此将使用NC_c作为实验的距离度量。

在进行CM实验时，加入了线性判别KCCA方法，最终结果表明KCCA和LD-KCCA性能较好。如下图。

图4.4 CM实验结果

然后是SM实验。论文比较了3种分类器，结果表明逻辑回归分类器性能最好。如下图。

图4.5 SM实验结果

最后进行了整体的跨媒体检索实验，包括CM、SM、SCM和Baseline的对比实验。如图所示。

图4.6 CM、SM、SCM和TTI对比实验结果

实验表明，SCM算法获得了最好的检索效果。

4.4 讨论

本文是[1]的扩充版，更加详细的介绍了CM、SM、SCM算法。

5 2015- Multi-Label Cross-modal Retrieval[6]

5.1 主要思想

本文提出多标签典型相关分析，以解决多标签注释的跨媒体检索问题。
常用的CCA方法由于简单性和高效率而广受欢迎，但它有几个缺点。最明显的缺点是CCA无法考虑高级的语义信息，比如数据的类标签。

本文提出的多标签典型相关分析（ml-CCA），可以利用多标签信息，同时学习两种模态的共同语义空间。此外也提出了fast ml-CCA，相比于ml-CCA，大大提高了效率。

5.2 模型

对于多标签数据集，不同模态之间存在自然的多对多对应关系，即来自一种模态的每个数据点与来自另一模态的若干其他数据点相关。如图5.1所示。

图 5.1 4种CCA方法的对应关系图5.1中，圆圈和方块表示两种模态的数据点。‘+’、‘-’、‘x’标明了类标签。在cluster-CCA中，一种模态中的每个点与另一个模态中的所有相同的类点配对。在3view-CCA中，第一模态中的每个样本与来自第二模态的单个样本配对，并且两个样本与基础标签配对。在ml-CCA中，一组中的样本可与第二组中的多个样本配对。

5.3 多标签典型相关分析算法（Multi-Label C anonical Correlation Analysis,ml-CCA）

见论文[6] 3.2节。

5.4 实验

略。

参考文献

[1] N. Rasiwasia et al., “A new approach to cross-modal multimedia retrieval,” in Proc. ACM Int. Conf.
Multimedia (ACM MM), 2010, pp. 251–260.
[2] G. Andrew, R. Arora, J. Bilmes, and K. Livescu, “Deep canonical correlation analysis,” in Proc. Int. Conf. Mach. Learn. (ICML), 2013, pp. 3408–3415.
[3] S. J. Hwang and K. Grauman, “Learning the relative importance of objects from tagged images for retrieval and cross-modal search,” Int. J. Comput. Vis., vol. 100, no. 2, pp. 134–153, 2012.
[4] N. Rasiwasia, D. Mahajan, V. Mahadevan, and G. Aggarwal, “Cluster canonical correlation analysis,” in Proc. Int. Conf. Artif. Intell. Statist. (AISTATS), 2014, pp. 823–831.
[5] J. C. Pereira et al., “On the role of correlation and abstraction in crossmodal multimedia retrieval,” IEEE Trans. Pattern Anal. Mach. Intell., vol. 36, no. 3, pp. 521–535, Mar. 2014.
[6] V. Ranjan, N. Rasiwasia, and C. V. Jawahar, “Multi-label cross-modal retrieval,” in Proc. IEEE Int. Conf. Comput. Vis. (ICCV), Dec. 2015, pp. 4094–4102.

【Hinton论文精读】The Forward-Forward Algorithm: Some Preliminary Investigations-202212 tyhj_sf 论文研读笔记 ML理论系列人工智能深度学习 FF算法
博文导航0引言1论文摘要2反向传播有什么问题呢？3Forward-Forward算法3.1使用逐层优化函数学习多层表示4Forward-Forward算法的实验4.1反向传播baseline4.2FF算法的一个简单的无监督的例子4.3FF算法的一个简单的监督例子4.4使用FF算法来模拟感知中自上而下的效应4.5作为教师使用空间环境的预测4.6CIFAR-10实验5睡眠6FF算法与其他对比性学习技术
SSA麻雀搜索算法LSTM 数分小白.py lstm 人工智能 rnn
SSA（SparrowSearchAlgorithm）是一种受麻雀觅食和反捕食行为启发的群体智能优化算法，具有全局搜索能力强、收敛速度快的特点。SSA麻雀搜索算法核心思想群体角色划分：发现者（Discoverers）：占种群10-20%，负责探索新区域，引导群体移动。加入者（Joiners）：占60-80%，跟随发现者进行局部搜索。侦察者（Scouts）：占10-20%，监测环境，危险时触发预警机
【MySQL】关闭外键约束检查 AutismBtkrsr mysql 数据库
插入SQL之前，可以关闭外键约束检查CREATEDATABASEIFNOTEXISTSexam;SHOWVARIABLESLIKE'collation%';SHOWVARIABLESLIKE'character%';USEexam;SETFOREIGN_KEY_CHECKS=0;SETFOREIGN_KEY_CHECKS=1;
libilibi项目优化（1）使用Redis实现缓存 Nijika... libilibi项目优化缓存 redis 数据库 java 后端 spring
第一版获取视频信息使用旁路缓存当视频信息存在缓存中时（命中），直接从缓存中获取。不存在缓存中时，先从数据库中查出对应的信息，写入缓存后再放回数据。//获取视频详细信息@RequestMapping("/getVideoInfo")publicResponseVOgetVideoInfo(@NotEmptyStringvideoId){//旁路缓存模式，先从缓存中拿VideoInfovideoInf
使用GCC编译Notepad++的插件硫酸锌01 Windows C/C++notepad++windows c++
Notepad++的本体1是支持使用MSVC和GCC编译的2，但是Notepad++插件的官方文档3里却只给出了MSVC的编译指南4。网上也没有找到相关的讨论，所以我尝试在Windows上使用MinGW，基于GCC-8.1.0的posix-sjlj线程版本5，研究一下怎么编译：官方例程：https://github.com/npp-plugins/plugindemo语法修改：在StaticDia
我的Notepad++插件推荐硫酸锌01 Windows ide 编辑器
上一篇文章我对x86版本的Notepad++官方支持的167个第三方插件，做了一个总结和翻译介绍。这几天我对感兴趣的插件做了一些测试，推荐22个高频使用的实用插件。Notepad++的插件可以从菜单栏的插件-插件管理中查找并下载：或者也可以下载文件后将插件拷贝到Notepad++安装目录下的plugins目录下。其中本文提到的全部22个插件我已经上传到了网盘。其中我对dll文件使用了upx压缩，所
Notepad++绿色版：便携高效的代码编辑器 FasterThanMind
本文还有配套的精品资源，点击获取简介：Notepad++是一款免费且无需安装的绿色版源代码编辑器，专为编程和文本处理设计。它支持多种编程语言的语法高亮、宏功能、增强的查找和替换、多文档界面、插件支持、编码转换、智能提示、个性化设置以及轻量级运行。Notepad++体积小、启动快，且对Windows平台具有良好的兼容性，适合在任何Windows系统计算机上使用，包括最新的Windows11。这款编辑
计算基因组学需要计算机知识吗,生物信息学——计算基因组学的一些参考书 weixin_39610422 计算基因组学需要计算机知识吗
有两个都可以在新浪爱问资料Bioinformatics.For.Dummies.2nd.Ed.2007.pdfAnIntroductiontoBioinformaticsAlgorithms.pdf另外看到Virginia大学的一些课程The2012ComputationalGenomicsCoursehasbeenrescheduledtoNovember28-December4,2012用mo
EDAS：投稿经验-word版本-问题解决 weixin_41724971 学习总结 Latex写作经验总结 SCI科研写作方法总结 word
1.字体不对，字体未嵌入问题问题：word转PDF后，总是显示有字体格式不对（忘记截图了）。办法：1.EDAS投稿PDF格式问题-CSDN博客-PDF上修改+IEEE论文检测的字体未嵌入问题TimesNewRoman,Bold,TimesNewRoman,Italicisnotembedded解决方法_打开其他人的word显示文字未嵌入-CSDN博客（必须有会员，说实话我没弄出来。如有需要这俩结合
《Operating System Concepts》阅读笔记：p331-p353 操作系统
《OperatingSystemConcepts》学习第30天，p331-p353总结，总计23页。一、技术总结1.lockdep工具2.claimedge3.banker'salgorithmAdeadlockavoidancealgorithm,lessefficientthantheresource-allocationgraphschemebutabletodealwithmultiple
draw.io插入 Mermaid格式画图
现在很多ai工具生成的流程图都如下sequenceDiagramparticipantSSPparticipantADXSSP->>ADX:广告播放完成ADX->>ADX:更新flow_distribute.status=1ADX->>SLS:记录adPlayed事件NoterightofADX:定时任务同步状态与日志如果想自己编辑这种格式，draw.io就支持，操作如下，我的是网页版参考链接：h
linux 安装anaconda与jupyter notebook配置土豆土豆，我是洋芋 python
一、anaconda安装在官网或清华镜像下载anaconda在载前看一下自己的系统版本，下载对应的anaconda版本。在系统中输入：cat/proc/version，如下图所示##下载地址1）官网：https://www.anaconda.com/distribution/2）清华镜像：https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/安
侯捷 C++ 课程学习笔记：C++常用标准库 Three～stone c++学习笔记
标准库#include万能头是一个简写方式，用来一次性包含C++标准库中的许多常用部分，比如输入输出流（iostream）、算法（algorithm）、向量（vector）、列表（list）、队列（queue）、栈（stack）、映射（map）、集合（set）等。使用它可以让程序员在编写解决特定问题的代码时，不必一一列出所需的所有头文件，简化了代码的编写过程。在实际的工程项目或更专业的编程实践中，
论文笔记：Deep Algorithm Unrolling for Blind Image Deblurring 爱学习的小菜鸡论文笔记去模糊图像处理神经网络
这是一篇CVPR2020的去模糊论文，主要是通过传统与深度相结合，将迭代次数变成神经网络的层数，使网络结构的网络结构更加具有解释性。主要贡献：DeepUnrollingforBlindImageDeblurring(DUBLID)：提出一种可解释的神经网络结构叫做DUBLID，首先提出一种迭代算法，该算法被认为是梯度域中传统的广义全变分正则方法(generalizedTV-regularizeda
linux UDP/TCP socket 编程守护安静星空 linux应用编程 udp linux tcp/ip 网络 websocket
UDP编程：使用socket创建描述符绑定bind本地ip地址端口使用recvfrom接收数据使用sendto发送数据关闭描述符close(fd)#include"stdio.h"#include#include/*SeeNOTES*/#include#include#include#include"string.h"charbuffer[256];intmain(intargc,char*arg
群体智能优化算法-GOOSE优化算法（含Matlab源代码） HR Zhou 算法 matlab 开发语言群体智能优化优化
摘要GOOSE（GooseOptimizationAlgorithm）是一种基于大雁（Goose）在自然界中觅食与捕猎行为所启发的元启发式算法。它借助大雁的飞行速度、加速度、随机跳跃等策略，以实现对搜索空间进行全局探索和局部开发。通过设置自由落体速度（FreeFallSpeed）、声音传播距离（SoundDistance）与时间平均（TimeAverage）等多种机制，GOOSE在处理复杂的高维非
群体智能优化算法-澳洲野狗优化算法（含Matlab源代码） HR Zhou 算法 matlab 开发语言群体智能优化优化
DingoOptimizationAlgorithm(DOA)sourcecodeDevelopedinMATLAB9.4.0.813654(R2018a)Author:Dr.HernanPeraza-VazquezMTA.GustavoEchavarria-Castilloe-mail:[email protected]@alumno.ipn.mxProgrammer:
Github2025-03-10 开源项目周报 Top13 老孙正经胡说开源 Github趋势分析开源项目 Python Golang
根据GithubTrendings的统计，本周(2025-03-10统计)共有13个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Python项目7TypeScript项目2JavaScript项目2C++项目1JupyterNotebook项目1Vue项目1文档项目1Rust项目1Svelte项目1从零开始构建你喜爱的技术创建周期：2156天Star数量：253338个For
MySQL---DDL（3.17）秋凉づᐇ mysql oracle 数据库
1、DDL-数据库操作查询：查询所有数据库：SHOWDATABASES;查询当前数据库：SELECTDATABASE();创建:CREATEDATABASE[IFNOTEXISTS]数据库名[DEFAULTCHARSET字符集][COLLATE排序规则]；删除：DROPDATABASE[IFEXISTS]数据库名；使用：USE数据库名；2、DDL--表操作-查询查询当前数据库所有表：SHOWTAB
iOS QLPreviewController预览PDF文件等（Swift） #摩斯先生 iOS pdf swift ios xcode 开发语言
QLPreviewController是可以显示常见文件的专用控制器。可以显示的文件有：文档类：PDF(.pdf)MicrosoftOffice文件：Word文档(.doc,.docx)Excel表格(.xls,.xlsx)PowerPoint演示文稿(.ppt,.pptx)iWork文档：Pages(.pages)Numbers(.numbers)Keynote(.key)纯文本文件(.txt,
Java开发-面试题-0014-@Component, @Controller, @Repository,@Mapper,@Service有何区别 CodeZeng1998 面试题 java 开发语言 spring boot
更多内容欢迎关注我（持续更新中，欢迎Star✨）Github：CodeZeng1998/Java-Developer-Work-Note技术公众号：CodeZeng1998（纯纯技术文）生活公众号：好锅（Lifeismorethancode）其他平台：CodeZeng1998、好锅@Component,@Controller,@Repository,@Mapper,@Service有何区别：@Co
新手村：数据预处理-异常值检测方法嘉羽很烦机器学习机器学习
机器学习中异常值检测方法一、前置条件知识领域要求编程基础Python基础（变量、循环、函数）、JupyterNotebook或PyCharm使用。统计学基础理解均值、中位数、标准差、四分位数、正态分布、Z-score等概念。机器学习基础熟悉监督/无监督学习、分类、聚类、回归等基本概念。数据预处理数据清洗、特征缩放（标准化/归一化）、数据可视化（Matplotlib/Seaborn）。二、渐进式学习
算法题刷题方法记录（蓝桥杯、Leetcode)
Algorithmexercises尘封已久的算法，又要重新开始刷题了，不知道题量能不能达到预期研一寒假期间，断断续续的，平均下来大概每天一题，懒懒散散的，开学来了继续刷。记录下让人眼前一新的算法题喜欢就要勇敢去爱，对一件事，对一个人，如何付出，如何去追求，如何去爱，在付出的的过程中又如何去确定自己的内心？在追求一个目标或者一个人的时候，如何确保自己在付出的时候也是开心的？^_^加油<(￣︶￣)↗
R语言：初始环境配置一头大学牲程序--编程记录 r语言开发语言
文章目录R语言的配置URL和种子R语言的配置在R中安装languageserver包：（直接在R.exe中运行即可）install.packages("languageserver")关于jupyternotebook如何编写R语言：（好像每种jupyternotebook支持的编程语言，解释器都有对应的jupyternotebook）install.packages('IRkernel')IRk
MATH6189 Efficient energy 后端
MATH6189Assignment1Worth20%Submissiondate:14March,2025,23:59.Rules•YoumustworkonyourownonthisassignmentwithnohelpfromothersorGenAI.•YoumustsubmitasingleJupyternotebookfileasasubmission.•Clearlyindicat
【Linux】learning notes（4）cat、more、less、head、tail、vi、vim bryant_meng Server Config /Tools linux less vim tail more
文章目录catmore查看整个文件less查看整个文件head查看部分文件tail查看部分文件vim/vicatcat命令在Linux和Unix系统中非常常用，它用于连接文件并打印到标准输出设备（通常是屏幕）。虽然cat的基本用法很简单，但它也支持一些参数来提供额外的功能。-n或--number：对所有输出的行进行编号。示例：cat-nfile.txt这会显示file.txt的内容，并在每行的开头
opencv图像视频的加载和显示 NDNPOMDFLR opencv python
opencv图像视频的加载和显示基于上篇文章，在开始之前需要在上级目录里打开jupyternotebook首先需要进入scrips目录里进行激活，然后如果在该目录下输入jupyternotebook的话，不太好所以需要进入上级目录创建和显示窗口需要牢记的命令namedWindow()创建命令窗口imshow()显示窗口destroyAllwindows()摧毁窗口resizeWindow()改变窗
php后端分页_thinkphp5框架前后端分离项目实现分页功能的方法分析淡定男 php后端分页
本文实例讲述了thinkphp5框架前后端分离项目实现分页功能的方法。分享给大家供大家参考，具体如下：方法一利用tp5提供的paginate方法实现自动分页参数page第几页，paginate分页方法会自动获取size每页数量代码/***Notes:消费记录*Date:2019/6/25*Time:15:43*@paramRequest$request*@return\think\response
jenkins通过ssh连接远程服务器出错解决方案（Algorithm negotiation fail） luopeng207663436 jenkins ssh 服务器
错误截图jenkins.plugins.publish_over.BapPublisherException:FailedtoconnectandinitializeSSHconnection.Message:[Failedtoconnectsessionforconfig[192.168.13.104].Message[Algorithmnegotiationfail]]将需要连接的目标服务器通
深入 Python 网络爬虫开发：从入门到实战南玖yy python python爬虫
一、为什么需要爬虫？在数据驱动的时代，网络爬虫是获取公开数据的重要工具。它可以帮助我们：监控电商价格变化抓取学术文献构建数据分析样本自动化信息收集二、基础环境搭建1.核心库安装pipinstallrequestsbeautifulsoup4lxmlseleniumscrapy2.开发工具推荐PyCharm（专业版）VSCode+Python扩展JupyterNotebook（适合调试）三、爬虫开发
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S