一亩高粱

[CVPR 2019 论文笔记] On zero-shot recognition of generic objects

文章目录

摘要
1. 引言
2. 相关工作
3. 准备知识
4. 误差分析

4.1 结构缺陷
4.2 词嵌入

4.2.1 出现频率
4.2.2 多义词

4.3 图像样本

4.3.1 按类别选择
4.3.2 按样本选择

4.4 数据集总结

5. 结构偏置

5.1 小例子
5.2 标准基准测试
5.3 测量结构偏置

6. 新基准

6.1 提出的基准
6.2 评估

7. 总结和讨论

On zero-shot recognition of generic objects

pdf

摘要

这篇论文要讨论的是ZSL在大型数据集ImageNet benchmark上的精度非常低的问题。原因主要是ImageNet benchmark针对这个任务有两方面的缺陷：一个是结构缺陷，一个是低质量语义和图像。

论文主要是为ZSL任务挑选一个更合适的数据集。在总结中，作者也提出ZSL的目标和定义到底是什么，也有待深入讨论。

1. 引言

本文的分析引出了两个影响ZSL模型精度主要因素：标准评估协议中的结构缺陷，低质量语义和视觉样本。从好的方面来看，我们表明，一旦考虑到这些缺陷，实际存在ZSL模型的准确性比之前认为的要高得多。

另一方面，我们证明了一个平凡的解决方案比大多数现有的ZSL模型有很大的优势，这是令人沮丧的。为了解释这一现象，我们引入了ZSL数据集中结构偏置的概念。我们认为ZSL模型旨在开发组合推理能力，但是Imagenet基准测试中存在的结构偏置更倾向于基于训练类和测试类之间的简单一对一映射的解决方案。

2. 相关工作

Frome等人[3]提出了一种基于Imagenet数据集的ZS通用对象识别基准，并在近期的工作中被广泛采用作为标准评价基准[13,20,15,1,21,7,18]。他们使用word embeddings作为语义表示，使用ILSVRC数据集的1000个类作为训练类，并根据与Wordnet层次结构中的训练类的距离，从Imagenet数据集的其余20845个类中提取不同的测试分割:2跳、3跳和所有的测试分割。

3. 准备知识

所有类别 $C$
训练类别 $C_{tr}$
测试类别 $C_{te}$
标注图像 $X$
语义表示 $Y$

$C_{tr} \cup C_{te} \subset C \tag {1a}$

$C_{tr} \cap C_{te} = \phi \tag {1b}$

${y_c \in R^d c \in C} \tag {1c}$

$\{ (x, c) \in R^{3 \times h \times w} \quad \forall c \in C \} \tag {1d}$

$\{ (x, y_c) | c \in C_{tr} \}$

$\{ (x, y_c) | c \in C_{te} \}$

ZSL模型旨在求解最优参数 $\theta^*$ ：

$\theta^* = argmin_{\theta} \mathbb E_{(x, y) \in Tr} \mathcal L(E_{\theta}(x, y) + \Omega(\theta)) \tag{2}$

其中， $\mathcal L$ 是损失函数， $E$ 是相似度分数函数。

$\mathbb E$ 是什么？

在标准的ZSL设置下，测试样本 $x_{te}$ 的分类是通过在未见类别中检索相似度分数最高的类别描述 $y$ ：

$argmax_{c \in C_{te}} E(x_{te}, y_c) \tag{3}$

在广义的ZSL设置下，测试样本 $x_{te}$ 的分类是通过在所有类别中检索相似度分数最高的类别描述 $y$ ：

$argmax_{c \in C} E(x_{te}, y_c) \tag{4}$

4. 误差分析

ZSL基准测试包含三个部件：标注图像集合 $X$ 、语义表示集合 $Y$ 和训练测试类别 $C_{tr}, C_{te})$ 。作者接着分析了误差来源：不同测试分割的不一致性、词嵌入的质量低的影响因素、图像样本的歧义性。

4.1 结构缺陷

[CVPR 2019 论文笔记] On zero-shot recognition of generic objects_第1张图片

图1说明了Wordnet层次结构中标准测试分割的测试类的配置。这种配置导致了一个明显的矛盾:测试集包括父类和子类概念的可视类。

考虑在hop-1测试拆分中对鸟类图像进行分类的问题，如图1所示。标准的测试分割会导致两种可能不一致的场景:

将子类Cathartid的图片分类为其父类Raptor。标准基准将这种情况认定为分类错误，而这种分类在语义上是正确的。
将父类Raptor的图片分类为其子类Cathartid。标准基准将这种情况认定为分类错误，而这种分类在语义上是不确定的。

我们把上述两种情况都称为假负例。图2 给出了在1-hop测试拆分上不同场景的ZSL分类分布。

一张图片 $x$ 的分类输出有4种：正确标签 $c$ 、 $c$ 的父类、 $c$ 的子类、不相关类。只有最后一种情况是确定错误的。

分析：GCN模型

	标准ZSL	广义ZSL
分类正确	21.8%	10.3%
分成父类	6.0%	12.2%
分成子类	12.6%	22.1%
分类错误	59.6%	55.4%

在标准ZSL设置下，假负例的比率为18.6%。真正的准确率应该在27.8%-40.4%之间。
在广义ZSL设置下，假负例的比率为34.3%。真正的准确率应该在22.5%-44.6%之间。

4.2 词嵌入

作者确定了影响词嵌入质量的两个因素，并分析了它们对ZSL准确性的影响：多义词和出现频率。作者认为，这些问题在定义大规模物体类别时自然会出现，所以这是一般物体零样本识别的隐含问题。但是，我们认为ZSL基准测试应该提供一个高质量的、明确的语义表示的精心策划的环境，并且将来应该分别研究解决多义词和罕见词的特殊情况的解决方案。

4.2.1 出现频率

从大型文本语料库中单词的共现统计量中，以无监督的方式学习单词嵌入。常用词是从大量的统计信息中学习而来的，因此我们希望它们比从稀少的共现统计信息中学习的罕见词汇提供更有语义意义的表示。我们发现很多Imagenet类标签都是稀有词(见补充资料附录B)，多达33.7%的标签词在Wikipedia中出现不到50次。在这里，我们质疑从这些罕见的词嵌入中学习到的少数共现统计信息是否为ZSL提供了任何视觉上的判别性信息。

图中每个点表示100个测试类的top-1精度。x轴，表示测试类标签的平均出现频率。y轴，表示top-1精度平均值。

4.2.2 多义词

多义词的说明。每种颜色代表一个单词的100个最近邻。“Cairn”及其近邻围绕着与石头和纪念碑相关的词汇，远离与狗相关的词汇，因此我们将top visual class作为单词Cairn的主要含义。

为了处理一词多义现象，我们假设所有的词都有一个主要的意思，可能还有几个次要的意思。我们将单词嵌入考虑为唯一反映其主要含义的语义，并丢弃与其单词标签的次要含义相关的可视类。

图3报告了在这些不同的测试划分上获得的准确性。我们可以看到，单词标签被标识为主要含义的测试类的ZSL准确性有了显著提高。相比之下，只包含次要含义的测试划分表现得很差。这证实了一词多义确实影响了ZSL的准确性，并表明我们对主要含义识别的解决方案可以解决这个问题。

4.3 图像样本

ILSVRC数据集由Imagenet数据集的高质量子集组成。当前的ZSL基准使用ILSVRC类作为训练类，并使用从Imagenet数据集的其余部分提取的类作为测试集，假设这些测试类具有类似的质量标准。经过仔细检查，我们发现这些测试类包含许多不一致和歧义。在本节中，我们详细介绍了一个自动过滤模糊样本的解决方案，以便仅为我们建议的基准选择高质量的样本。

4.3.1 按类别选择

图5：相对于样本总体大小的ZSL精度。
左:Imagenet类总体大小的分布。6.1%的Imagenet类的样本小于10个，21.1%的Imagenet类的样本小于100个。右:不同测试划分的ZSL准确度相对于它们的平均样本总体大小。

在图5中，我们报告了我们的模型相对于它们的平均总体计数的不同测试分裂的ZSL准确性。从图中可以看出，样本总体大小与两种模型的精度之间存在明显的相关性，对于低样本总体类，其精度较低。我们使用样本总体作为一个粗略的指标来快速过滤模糊的视觉类，只考虑样本总体大于300幅图像的类作为我们建议的数据集中的有效候选类。

4.3.2 按样本选择

即使在选定的类中，我们也发现了许多不一致和模糊的图像，所以我们想按样本进一步过滤测试图像。但是，什么是ZSL基准测试的良好候选映像呢?我们如何测量样品的质量?我们认为，ZSL基准测试应该只反映模型的零样本能力：ZSL基准测试应该相对于标准非ZSL模型的准确性来评估ZSL模型的准确性。因此，我们将一个好的ZSL样本定义为一个足够清晰的图像，使其能够被以监督方式训练的标准图像分类器正确分类。

4.4 数据集总结

图6总结了我们分析的不同因素对我们的基线模型在“1跳”测试分割上的top-1分类错误的影响。在标准ZSL设置下，去除模糊图像、模糊语义样本和结构缺陷后，线性模型的误差率从86%下降至61%。GCN模型对广义设置的误差率从90%下降到47%。

5. 结构偏置

ZSL型是受启发于人类从一个纯粹的描述中识别未知对象的能力，它通常是如下例所示：没有见过斑马，一个人能够识别它，知道斑马看起来像马覆盖着黑色和白色的条纹。这个例子说明了人类组合不同已知对象的视觉特征来定义和识别以前未知对象类别的能力。

标准图像分类vsZSL图像分类

标准图像分类器将类标签编码为本地表示(one-hot嵌入)，其中每个维度表示一个不同的可视类，如图8所示。因此，标签空间中的类之间不共享任何信息:可视类嵌入同样遥远且彼此正交。ZSL模型背后的主要思想是将可视类嵌入到分布式表示中:在标签空间中，可视类由类之间共享的多个可视特性(马的形状、条纹、颜色)定义。分布式表示允许通过与已知类共享的可视特性组合来定义和识别未知类，其方式与上面描述的人类能力类似。

将可视化类嵌入到分布式特征表示中是非常强大的，因为它允许通过组合从给定的训练类集合中学习的一组可能很小的特征来定义一定数量的组合测试类。因此，我们认为，ZSL背后的关键挑战是通过已知视觉特征的组合来实现对未知类的ZS识别，遵循它们最初对人类能力的启发，并尽可能通过分布式特征表示来实现。在本节中，我们将看到并不是所有ZSL问题都需要这种类型的组合能力。在标准基准测试中，我们展示了基于可视化类的本地表示的简单解决方案优于基于word嵌入的现有方法。我们证明了这个平凡解是由标准测试分割的特定配置所实现的，并引入了结构偏差的概念来指代ZSL数据集中存在这样的平凡解。

5.1 小例子

图7演示了一个玩具ZSL问题，其中，给定一组Horse和TV monitor图像的训练集，目标是对Zebra和PC laptop的图像进行分类。让我们考虑在训练集上训练一个图像分类器，并将其直接应用于来自测试集的图像。因此，这个问题的一个简单解决方案就是在测试类和它们最近的训练类之间定义一个一对一的映射:Horse=Zebra和TV monitor=PC laptop。这个例子很明显，并不是所有的ZSL问题都需要组合可视化特性来解决。

5.2 标准基准测试

平凡方案好于很多最好的方法。

5.3 测量结构偏置

在我们的玩具示例中，我们已经暗示了这样一个事实，即对于测试类与训练类相对相似的测试集，而测试类彼此之间(与它们的负集)的差异则相对更大，会出现结构性偏差。为了证实这种直觉，我们定义了如下结构比:

$\frac{min_{c' \in C_{tr}} d(c, c')}{min_{c' \in C_{te}} d(c, c')} \tag{5a}$
$R(C_{te}) \frac {1} {|C_{te}|} \sum_{c \in C_{te} } r(c) \tag{5b}$

其中 $c$ 表示一个可视类， $C_{te}$ 和 $C_{tr}$ 分别表示测试集和训练集， $d$ 表示两个类之间的相似性距离。其中 $r (c)$ 表示 $c$ 与其最近的训练类之间的距离与 $c$ 与其最近的测试类之间的距离之比。在我们的实验中，我们使用Wordnet层次结构中两个类之间的最短路径长度作为距离 $d$ 的度量，尽管不同的度量标准也值得研究。我们计算一个测试集的各个类的平均结构比 $R(C_{te})$ 作为它的结构比。图9显示了基线模型在不同结构比 $R$ 的测试集上获得的top-1精度。和之前的实验一样，我们给出了100个测试分割类的结果。

在低结构比的测试划分中，平凡解的性能非常好，与目前最好的GCN模型的技术水平相当。这种测试分割类似于玩具示例，其中每个测试类都与一个训练类紧密相关，而远离Wordnet层次结构中的其他测试类。例如，我们的玩具例子中测试分割的结构比是 $R(C_{te}) = 1/2×(2/4 + 2/4)= 0.5$ ，这对应于平凡解所达到的最高精度。我们说这样的测试分割在结构上偏向于基于相似性的平凡解。

然而，基于相似性的平凡解的精度随着结构比的增大而急剧下降，直到达到最高比率的近似概率精度为止。因此，最大限度地提高测试分割的结构比似乎是一种有效的方法，以最小化结构偏差。虽然GCN模型和线性模型的精度随着结构比的增大而降低，但它们仍然远远高于随机模型。这些结果表明，基于词嵌入的ZSL模型确实能够进行组合推理。至少，它们能够执行比基于简单相似性的解决方案更复杂的ZSL任务。有趣的是，当平凡解收敛于随机精度时，GCN模型的精度似乎收敛于ZSL基线的精度。这表明GCN模型成功的主要原因是它们有效地利用Wordnet层次结构来利用结构偏见。

标准基准的1跳和2跳测试分割由一组测试类组成，这些测试类与Wordnet层次结构中的培训类最接近。这导致测试分裂非常低的结构比，类似于我们的玩具例子。例如，1跳测试拆分的结构比为0.55。这是结构偏见的一个例子，甚至比我们的玩具例子更极端，因为测试类要么是训练类的子类，要么是训练类的父类。

6. 新基准

6.1 提出的基准

两步：
1）去掉语义质量差的可视类、去掉样本总体小的可视类、去掉歧义图像
2）最小化结构偏置

6.2 评估

7. 总结和讨论

ZSL对目标识别具有重要的现实意义。然而，对于任何计算机视觉任务，高质量基准的可用性是取得进展的先决条件。在本文中，我们指出了标准泛型对象ZSL基准的主要缺陷，并提出了一种新的基准来解决这些缺陷。更重要的是，我们引入了结构偏差的概念在语义空间中允许基于简单相似性匹配的平凡解的ZSL数据集。我们鼓励研究人员根据我们提出的基准评估他们过去和未来的模型。似乎合理的想法可能已经被抛弃了，因为它们相对于从结构偏差中获益最多的基准模型而言，性能较差。其中的一些想法可能值得今天重新审视。

最后，我们认为对ZSL的目标和定义还需要进行更深入的讨论。开发复杂模型来解决特征不佳的问题存在风险:数学复杂性可能成为复杂性的烟幕，混淆了ZSL背后的真正问题和关键挑战。相反，我们认为在ZSL研究的这个阶段仍然非常需要基于常识的实际考虑。结构偏差的识别是正确描述ZSL问题的第一步。继续讨论的一个实际方法是调查其他ZSL基准的结构偏差。

python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
自动写论文的网站推荐这5款实用类工具小猪包333 写论文人工智能深度学习计算机视觉 AI写作
在当今学术研究和写作领域，AI论文写作工具的出现极大地提高了写作效率和质量。这些工具不仅能够帮助研究人员快速生成论文草稿，还能进行内容优化、查重和排版等操作。以下是五款实用类工具推荐，特别是千笔-AIPassPaper。1.千笔-AIPassPaper千笔-AIPassPaper是一款功能强大且全面的AI论文写作助手，用户只需输入基本的研究需求和关键词，便能迅速生成一篇完整的论文。该工具利用先进的
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
4款毕业论文参考文献格式生成器（附加详细步骤）小猪包333 写论文人工智能深度学习计算机视觉 AI写作
在撰写毕业论文时，参考文献的格式规范是至关重要的。为了帮助学生和学者们更高效地生成符合要求的参考文献格式，本文将详细介绍四款推荐的参考文献格式生成器，并提供详细的使用步骤。1.千笔-AIPassPaper千笔-AIPassPaper是一款先进的AI辅助论文写作工具，不仅能够自动生成大纲、开题报告，还能一键生成参考文献。AI论文，免费大纲，10分钟3万字https://www.aipaperpass
AI论文写作推荐哪个好？分享5款AI论文写作带数据图表网站小猪包333 写论文人工智能深度学习计算机视觉
在当今学术研究和写作领域，AI论文写作工具的出现极大地提高了写作效率和质量。这些工具不仅能够帮助研究人员快速生成论文草稿，还能进行内容优化、查重和排版等操作。以下是五款推荐的AI论文写作工具，包括千笔-AIPassPaper。千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文写作助手，旨在帮助用户快速生成高质量的论文内容。AI论文，免费大纲，10分钟3万字https:
AI论文题目生成器怎么用？9款论文写作网站简单3步搞定小猪包333 写论文人工智能深度学习计算机视觉
在当今信息爆炸的时代，AI写作工具的出现极大地提高了写作效率和质量。本文将详细介绍9款优秀的论文写作网站，并重点推荐千笔-AIPassPaper。一、千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文生成器，基于最新的自然语言处理技术，能够一键生成高质量的毕业论文、开题报告等文本内容。它不仅提供智能选题、文献推荐和论文润色等功能，还具有较高的用户评价。其文献综述生成功
毕业论文附录一般都写什么?大学生写论文是干嘛用的写个原创论文人工智能深度学习 AI写作 chatgpt 论文阅读
毕业论文的附录通常包含一些在正文中不便于展示或详细阐述的内容，但对理解论文整体又具有重要意义的资料。具体来说，附录可能包含以下内容：AI论文，免费大纲，10分钟3万字，查重高于15%退费，支持数据图表！！AIPaperPass-AI论文写作指导平台AIPaperPass是AI原创论文写作平台，免费千字大纲，5分钟生成3万字初稿，提供答辩汇报ppt、开题报告、任务书等，40篇真实中英文知网参考文献，
端到端的自动驾驶论文与代码整理大别山伧父自动驾驶
LearningbyCheatinggithubcodearxivpaperconferenceonrobotlearning最新进展(May2021)Checkoutourlatestfollow-upwork:WorldonRails(2020)Checkoutoursubmissiontothe2020CARLAChallenge!pass
EP6 同一组件通过传递不同属性展示不同效果京城五 uniapp壁纸小程序项目实践前端学习脚步 css 前端 html
文件路径：E:/homework/uniappv3tswallpaper/pages/index/index.vue公告文字内容文字内容文字内容文字内容文字内容文字内容文字内容文字内容文字内容文字内容文字内容文字内容文字内容文字内容文字内容文字内容每日推荐专题精选More+.homeLayout{.banner{width:750rpx;padding:30rpx0;swiper{width:10
EP7 底部tab切换页面标签京城五 uniapp壁纸小程序项目实践前端知识杂合前端 uniapp 小程序
文件路径：E:/homework/uniappv3tswallpaper/pages/classify/classify.vue.classify{padding:30rpx;display:grid;grid-template-columns:repeat(3,1fr);gap:15rpx;}文件路径：E:/homework/uniappv3tswallpaper/pages/user/user
探索任务的隐秘世界：推荐Task2Vec 邓越浪Henry
探索任务的隐秘世界：推荐Task2Vecaws-cv-task2vecOfficialcodeforthepaper"Task2Vec:TaskEmbeddingforMeta-Learning"(https://arxiv.org/abs/1902.03545,ICCV2019)项目地址:https://gitcode.com/gh_mirrors/aw/aws-cv-task2vec在机器学习
Coding and Paper Letter（十四） G小调的Qing歌
资源整理。1Coding:1.R语言包ungeviz，ggplot2的拓展包，专门用来作不确定性的可视化。ungeviz2.计算机图形学相关开源项目。计算机图形学光线追踪开源项目C++源码。computergraphicsraytracing计算机图形学格网开源项目C++源码。computergraphicsmeshes计算机图形学介绍开源项目。computergraphics3.R语言包GLMM
05-树9 Huffman Codes（C） L_glonar c语言数据结构
日常，这一次，耗费我三天，其实第二天时便已经将对整个框架有清晰的了解了，（看了解析了），但是一步步排除，确实让我学到了很多。In1953,DavidA.Huffmanpublishedhispaper"AMethodfortheConstructionofMinimum-RedundancyCodes",andhenceprintedhisnameinthehistoryofcomputersci
线性代数|机器学习-P33卷积神经网络ImageNet和卷积规则取个名字真难呐算法机器学习矩阵人工智能线性代数
文章目录1.ImageNet2.卷积计算2.1两个多项式卷积2.2函数卷积2.3循环卷积3.周期循环矩阵和非周期循环矩阵4.循环卷积特征值4.1卷积计算的分解4.2运算量4.3二维卷积公式5.KroneckerProduct1.ImageNetImageNet的论文paper链接如下：详细请直接阅读相关论文即可通过网盘分享的文件：imagenet_cvpr09.pdf链接:https://pan.
IJCAI2024 无脑敲代码，bug漫天飞会议
CallforPapers–IJCAI2024重要日期(所有时间都是地球上的任何地方，UTC-12)摘要提交截止日期:2024年1月10日作者信息截止日期:2024年1月16日论文全文截止日期:2024年1月17日附录和重新提交信息截止日期:2024年1月24日简易拒绝通知:2024年2月22日作者回复时间:2024年3月18日至21日书面通知:2024年4月16日会议:2024年8月3日星期六至
2019-01-12 q若水
Youcan'trewriteyourpast,butyoucangrabacleansheetofpaperandwriteyourfuture.你不能重写过去，但是你可以用一张干净的纸去书写你的未来。
第66期 | GPTSecurity周报云起无垠 GPTSecurity AIGC gpt
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.利用高级大语言模型
Bilingual engineering 201707 No.360 Alyee AlyeeBonnie
GamesandDailylife:Makealittlemousewithher.Steps1.Useorangepapertomakeacone2.Maketworoundearsandalongtailwiththeorangepaper3.Cutasmallpieceofblackpapertomakethemouseswhiskers4.Pasteallthepartstogether5
IROS2023 马少爷学术人工智能自然语言处理
1、论文要求论文征集提交给IROS会议文件审查委员会作为同行评审的档案出版物，所有被接受的论文都将在IEEEXplore上托管。邀请潜在作者提交代表原创作品的高质量论文。欢迎就主题以及智能机器人和应用的所有领域提交意见。请通过传统的PaperPlaza流程提交论文。格式指南LaTex模板MSWord模板论文长度应为六页（美国字母大小），最多可多出两页（每多出一页收费205美元，应在验收后付款）。页
探索智能边缘计算：Game-Theoretic-Deep-Reinforcement-Learning 瞿旺晟
探索智能边缘计算：Game-Theoretic-Deep-Reinforcement-LearningGame-Theoretic-Deep-Reinforcement-LearningCodeofPaper"JointTaskOffloadingandResourceOptimizationinNOMA-basedVehicularEdgeComputing:AGame-TheoreticDRL
乡村振兴战略下传统村落文化旅游设计 Paperback – Aug. 1 2022 Chinese edition by XU SHAO HUI (Author) 光明理论旅游人工智能媒体生活科技产品运营内容运营
乡村振兴战略下传统村落文化旅游设计Paperback–Aug.12022ChineseeditionbyXUSHAOHUI(Author)Language:Chinese.paperback.PubDate:2022-08-01.publisher:ChinaBuildingIndustryPress.description:Paperback.PubDate:2022-08-01Pages:20
第65期 | GPTSecurity周报云起无垠 GPTSecurity 人工智能网络安全语言模型
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.基于第一性原理的大
特征点提取与匹配原文论文下载长沙有肥鱼视觉SLAM十四讲计算机视觉
ORB原文下载链接：(PDF)ORB:anefficientalternativetoSIFTorSURFSIFT原文下载链接：https://www.cs.ubc.ca/~lowe/papers/ijcv04.pdfSURF原文下载链接:https://www.cs.jhu.edu/~misha/ReadingSeminar/Papers/Bay08.pdfORB和AKAZE对比论文下载链接：h
后端JOIN、LEFT JOIN、RIGHT JOIN的理解 I like Code? java 后端
SELECTf_exam_record.*,f_exam_paper.PaperName,f_exam_paper.PaperTime,exam_class.classnameFROMf_exam_recordJOINf_exam_paperONf_exam_record.PaperId=f_exam_paper.PaperIdLEFTJOINexam_classonf_exam_record.c
仿华为车机功能之--修改Launcher3,增加横向滑动桌面空白处切换壁纸的功能 Kwanvin Android Launcher3深度定制开发华为 java android
本功能基于Android13Launcher3需求：模仿华为问界车机，实现横向滑动桌面空白处，切换壁纸功能（本质只是切换背景，没有切换壁纸）。实现效果：实现思路：第一步首先得增加手势识别第二步切换底图，不切换壁纸是因为切换壁纸动作太大，需要调用到WallpaperManager,耗时且会触发应用activity重启原生系统有识别上滑与下滑的动作，那我们应该增加一个左滑和右滑的动作识别禁止上滑出所有
开源的即时聊天解决方案Papercups 辣码甄源精品开源应用分享开源 github 信息与通信
Papercups：让聊天支持变得简单、私密、实时。-精选真开源，释放新价值。概览Papercups是一款开源的实时客户支持工具，它使用Elixir语言构建，为注重客户数据隐私和安全性的公司提供了一个自托管的解决方案。这款工具的设计理念是简化客户与企业之间的沟通流程，通过一个直观的聊天小部件嵌入到企业的网站中，实现无缝的实时交流。Papercups的聊天小部件不仅易于集成，还提供了丰富的自定义选项
今日欧美圈：Sam Smith专辑改期，The Box狂揽B榜十周冠胡萝卜音乐
新一期Billboard单曲榜上，《TheBox》狂揽十周冠，DuaLipa热单《Don'tStartNow》升至亚军，LilUziVert有三首歌曲进入前十。SamSmith新专辑《ToDieFor》发行日期推迟到6月5日。新单要来啦！LaurenJauregui宣布新单《Lento》将在3月20日发行。HarryStyles登上BeautyPapers写真释出！在《冰雪奇缘2》中为Honeym
Vblog#1 English learning for science research 一粒咖啡
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档Englishlearningforscienceresearchintroduction一、GOALsin1month二、PlanseverydaySummeryintroductionIstartedtowritepaperinEnglishinordertoimproveabilityofEnglishandunderstand
AIGC：Kolors: Effective Training of Diffusion Model for Photorealistic Text-to-Image Synthesis 微风❤水墨 AIGC
代码：GitHub-Kwai-Kolors/Kolors:KolorsTeam论文：Kolors/imgs/Kolors_paper.pdfatmaster·Kwai-Kolors/Kolors·GitHub模型：huaggingface:https://huggingface.co/Kwai-Kolors/Kolors-diffusersmodelscope:https://modelscope
PaperWeekly sapienst Papers PaperwithCode General ML
1.Python软件包解决DL在未见过的数据分布下性能差的问题：（1）神经网络和损失分离的模块化设计（2）强大便捷的基准测试能力（3）易于使用但难以修改（4）github:https://github.com/marrlab/domainlabTrainer和Models之间是什么关系Trainer和Models是DomainLab中的两个核心概念。Trainer是一个用于指导数据流向模型并计算S
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl