Arielwyy

论文理解——Audio Adversarial Examples:Targeted Attacks on Speech-to-Text

0-Abstract

本文构建了有关语音识别的定向语音对抗样本，给定任意音频波形，可以产生99.9%相似的另一个音频波形，且可以转录为所选择的任何短语。作者将基于白盒迭代优化攻击应用于DeepSpeech模型（端到端语音识别），实验显示，它具有100%的成功率。

1-Introduction

1.1Existing work

当前对对抗样本的研究大多基于图像空间，包括图像分类、图像生成模型、图像分割、面部检测等，而在音频空间研究较少，其中最常见的是自动语音识别。其中最先进的定向语音识别攻击是一种名为Houdini的新型方法，它只能构建和语音对抗样本语音相似的短语

1.2Contributions

在本文中，作者通过攻击DeepSpeech模型证明了定向对抗样本攻击存在于音频空间。通过给定任意自然波形x，能够构造几乎听不见的扰动δ，但是x +δ被识别为任何期望的短语。由任意声波开始，通过把语音嵌入不被识别为语音的音频中，通过选择silence作为目标，可以实现隐藏音频到语音to文本系统中

2-Background

2.1Neural Network & Speech Recogniton

将音频视为N维向量x，每个元素xi是一个有符号的16位值，MFC将音频分为50帧每秒，并且将每帧映射到频域。

标准的神经网络分类模型采用一输入并在所有输出标签上产生一个概率密度输出，而语音to文本系统中，有指数级可能的标签，这是计算上不可行的。因此，语音识别系统通常使用递归神经网络，将音频声波映射到单个字符概率分布序列，而不是整个短语。

2.2Connectionist Temporal Classication

Connectionist Temporal Classication是在输入和输出序列之间的比对未知时训练序列到序列神经网络的方法。

X：输入域——单帧的输入

Y：范围（字母a-z，空格，ε）

f：神经网络 f:X^N-->[0,1]^(N·|Y|）以N帧x∈X的序列作为输入，并在每个帧的输出域上返回概率分布。

：xi∈X，其标签j属于Y的概率

p:代表一个短语，一系列的字符，其中pi属于Y

定义：

1）去除所有连续重复的字母

2）去除所有的ε

e.g. 序列 a a b ε ε b将被处理为 a b b

同时，我们可以得到

从而，

用于训练网络的损失函数是所需短语的负对数概率：

最后，为了将矢量y解码为短语p，我们搜索最适合y的短语p：

即找到一个p使Pr(p|y)最大。

而由于要运算C(x)需要搜索指数级的空间，它通常按照以下两种方式被估算：

（1）Greedy Decoding。它搜索最可能的对齐，并减少这个对齐从而获取转录的短语。

（2）Beam Search Decoding。它同时评估多个对齐的概率，然后选择最可能的短语p

2.3Adversarial Examples

对于任意一个x，它产生一个和x相似的x'，但C(x)≠C(x')

2.4Targeted Adversarial Examples

定向对抗样本攻击是一种更有力的攻击方式：不仅x和x'的分类结果不同，神经网络还必须选择一个特定的标签（由对手确定的）给x'。

3-Audio Adversarial Examples

3.1Threat Model & Evaluation Benchmark

3.1.1Theat Model

给定音频波形x和目标转录y，我们的任务是构造另一个音频波形x'=x+δ，使得x和x'听起来相似，但实际上C(x')=y。只有当神经网络的输出和目标短语完全匹配才算成功。

在之前的研究中，我们假定了一个白盒测试，其对手完全了解它的模型和参数。在之后的研究中，我们尝试将攻击延展到黑盒攻击中。同时，我们假定对抗样本是被直接分类而没有引入任何噪声。

3.1.2Distortion Metric

应该如何量化引入扰动后的失真呢？

用分贝来测量失真：一个对数指标，用于测量音频样本的相对响度：

可以简化为：

因为引入的扰动比原始信号更安静，所以失真是负数，其值越小表示越安静的失真。

3.1.3Evaluation Benchmark

为了评估攻击的有效性，作者在Mozilla Common Voice数据集的前100个测试实例上构建了有针对性的音频对抗样本。对于每个样本，针对10个不同的不正确转录，随机选择，使得（a）转录不正确，以及（b）理论上可以达到该目标。

3.2An Initial Formulation

这里将构建对抗性样本的问题表达为一个优化问题：给出一个自然的例子x和任何目标短语t，我们只需要求得一个最小的dBx(δ)，使得：

在之前的工作中，已经将该式转化为，其损失函数被构造称 l(x'.t)≤0 <==>C(x')=t，参数c协调了对抗性和保持接近原始样本的相对重要性。

两个问题：

（1）使用CTC损失函数：l(x',t)=CTC-Loss(x',t)。对于这个损失函数，某个方向可能成立（ l(x',t)≤0 => C(x')=t )但反之不然。但这也意味着结果也是对抗性的，只是可能不是最小的扰动。

（2）当使用l∞ 作为失真的尺度时，优化过程通常在结果附近摆动而不集中。我们将转化为求，其中τ足够大。当获得了部分结果δ*后，减小τ，恢复最小化，重复上述过程知道找不到结果。

最后，通过使用Adam 优化器，设置学习率为10，最大迭代次数为5000，解决了最小化问题。

3.2.1Evaluation

我们能够生成有定向对抗样本，每个源 - 目标对成功100％，平均扰动为-31dB，它大致是在一个安静环境下周围的声音和一个人说话的声音的对比。

同时，目标短语越长，定向的难度越大：每个额外的字符大约会增加0.1dB的扰动；源短语越长，越容易成为给定转录的目标。这两者之间可以相互抵消。

3.3Improved Loss Function

以下内容针对于Greedy decoding：

为了最小化CTC损失，优化器使转录短语的每个方面都更类似于目标短语。尽管已经具有该标签，但是将物品分类为更强烈的物品作为所需标签的效果导致设计更有效的损失函数：

一旦y的概率大于任何其他东西，优化器就不再通过使用该标签对其进行更强烈的分类来减少损失。

将该损失函数应用到音频域：

由于某些字符转录识别困难，为了使它们也被转录，选择一个足够大的c，它必须比所需的更大。

因此将上式转换为

其中，Li(x,πi) = l(f(x)^i,πi)

为了计算这个损失函数，需要选择一个对齐π ，采用以下两步攻击：

（1）x0：使用CTC损失的对抗样本。提取由x0引起的对齐π （通过运算π = arg maxi f(x0)^i)用于第二步

（2）固定对齐π ，使用上述改进了的损失函数产生一个较小失真的对抗样本x'，采用梯度下降的方式，δ=x0-x进行运算。

3.3.1Evaluation

生成的对抗性示例现在只能保证对Greedy decoder有效

（视觉无法区分）

3.4Audio Information Density

3.5Starting from Non-Speech

我们不仅可以将一个人的语音转录为不正确的文本，也能将任意非语音音频样本转换为任意目标短语。

为了评估这种攻击的有效性，采用来自不包含语音的古典音乐的五秒剪辑和Common Voice数据集中包含的目标短语。但这种攻击需要更多的计算工作（我们执行20,000次迭代下降迭代），总失真略大，平均为-20dB

3.6Targeting Silence

增加DeepSpeech无法转录的对抗性噪声来隐藏语音。

虽然执行此攻击而不进行修改（仅通过空短语）是有效的，但如果我们将silence定义为仅重复空格字符的任意长度序列，则可以略微改进。

为了获取这个silence，我们让：

我们发现定位silence比定位目标短语更容易：当失真小于原始信号低于-45dB，我们可以将任何短语变为静音。这也解释了为什么音频越长，构建对抗样本更容易：长的短语包括耕读的声音，对手可以使不需要的声音silence，从而获得与目标几乎匹配的子序列，而短的则需要合成以前不存在的新字符。

4-Audio Adversarial Example Properties

4.1 Evaluating Single-Step Methods

Goodfellow等人认为，由于神经网络的局部线性特性，对抗性的例子在很大程度上是有效的。

FGSM证明它在图像空间是适用的。FGSM在损失函数的梯度方向上采用：给定具有损失函数l的网络F，通过计算对抗性样本。对于图像中的每个像素，此攻击询问“我们应该在哪个方向上修改此像素以最大限度地减少损失？”然后同时在每个像素的该方向上迈出一小步。此攻击可以直接应用于音频，更改单个样本而不是像素。

然而，由于计算MFCC时引入的固有非线性，以及多轮LSTM的深度，在输出中引入了很大程度的非线性，我们发现这种单步攻击的方式在音频对抗样本领域却并不是高效的。

在图3中，我们比较了在已知对抗性示例的方向上行进时CTC损失的值与在快速梯度符号方向上行进相比的值。虽然最初（靠近源音频样本），快速梯度方向在减少损失函数方面更有效，但它快速平稳并且之后不会减小。另一方面，使用基于迭代优化的攻击找到最终导致对抗性示例的方向。（只有当CTC损失低于10时，该短语才能正确转录。）

4.2Robustnss of Adversarial Examples

构建对各种形式的噪声具有鲁棒性的对抗样本是可能的。

4.2.1Robustness to pointwise noise

给定对抗样本x0，将逐点随机噪声σ添加到x0并返回C（x +σ）将导致x0失去其对抗性标记，即使失真σ足够小以允许正常示例保留其分类。

我们生成一个高置信度的对抗性样本x0，并利用Expectation over Transforms生成一个对抗这个合成-30dB噪声的对抗性样本，当我们这样做时，对抗性扰动增加大约10dB。

4.2.2Robustness to MP3 compression

我们利用straight-through estimator来构建对MP3压缩具有鲁棒性的对抗样本。假设MP3压缩的梯度是恒等函数，通过计算CTC-Loss的梯度，我们生成对抗样本x0，使得C（MP3（x 0））被分类为目标标签。虽然单个梯度步骤可能不正确，但总体而言，梯度平均值变得有用。这使我们能够生成具有大约15dB较大失真的对抗性示例，这些失真对于MP3压缩仍然很稳健。

5-Open Questions

Can these attacks be played over-the-air?

本文中构建的音频对抗性示例在通过空中播放后不会保持对抗性，因此存在有限的现实世界威胁

Do universal adversarial perturbations exist?

在图像的空间上，可以构造单个扰动δ，当应用于任意图像x时，将使其分类不正确。这些攻击在音频上会很强大，并且会对应于可以播放的扰动，以使任何其他波形识别为目标短语。

Are audio adversarial examples transferable?

给定音频样本x，是否可以生成单个扰动δ，使得对于多个分类器fi，fi（x +δ）= y。
可转移性被认为是神经网络的基本属性[34]，使构建强大的防御变得非常复杂，并且允许攻击者进行黑盒攻击。

Which existing defenses can be applied audio?

对抗性样本的所有现有防御仅在图像域上进行了评估。如果防御者的目标是产生一个强大的神经网络，那么它应该提高对所有领域的对抗性例子的抵抗力，而不仅仅是对图像的抵抗力。

6-Conclusion

证明了定向音频对抗样本在自动语音识别方面是有效的。通过基于优化的攻击被应用到端到端，我们能够通过仅添加轻微失真将任何音频波形转换为任何目标转录，并获得100％的成功。同时，可以使音频每秒最多转录50个字符（理论上的最大值），使音乐转录为任意语音，并隐藏语音不被转录。

我们提出初步证据表明音频对抗性示例与图像上的对象具有不同的属性，表明线性不适用于音频域。

论文学习笔记 VMamba: Visual State Space Model Wils0nEdwards 学习笔记
概览这篇论文的动机源于在计算机视觉领域设计计算高效的网络架构的持续需求。当前的视觉模型如卷积神经网络（CNNs）和视觉Transformer（ViTs）在处理大规模视觉任务时展现出良好的表现，但都存在各自的局限性。特别是，ViTs尽管在处理大规模数据上具有优势，但其自注意力机制的二次复杂度对高分辨率图像处理时的计算成本极高。因此，研究者希望通过引入新的架构来降低这种复杂度，并提高视觉任务的效率。现
论文学习1----理解深度学习需要重新思考泛化Understanding deep learning requires rethinking generalization 夏洛的网机器学习深度学习论文深度学习神经网络
——论文地址：Understandingdeeplearningrequiresrethinkinggeneralization1、有关新闻1.1新闻一：参考1：机器之心尽管深度人工神经网络规模庞大，但它们的训练表现和测试表现之间可以表现出非常小的差异。传统的思考是将小的泛化误差要么归结为模型族的特性，要么就认为与训练过程中的正则化技术有关。通过广泛的系统性实验，我们表明这些传统的方法并不能解释大
半监督语义分割论文学习记录西瓜真的很皮啊半监督语义分割深度学习机器学习人工智能
Semi-SupervisedSemanticSegmentationwithCross-ConsistencyTraining1.1motivation一致性训练的目的是在应用于输入的小扰动上增强模型预测的不变性。因此，学习的模型将对这样的小变化具有鲁棒性。一致性训练的有效性在很大程度上取决于数据分布的行为，即集群假设，其中类必须由低密度区域分隔。在语义分割中，在输入中，我们没有观察到低密度区域
2019-1-27晨间日记紫薇忘了水葫芦
在柳州的第二天起床：八点半左右天气：晴心情：好像很复杂，一会儿开心一会儿不开心纪念日：参加了晗大姐的婚礼任务清单昨日完成的任务，最重要的三件事：⒈把之前的论文题目整理了一遍⒉参加了婚礼⒊送了礼物改进：要静下来多看些书做些运动，多思考。习惯养成：早睡早起，饮食清淡周目标·完成进度开始读论文学习·信息·阅读阅读健康·饮食·锻炼饮食清淡，多锻炼人际·家人·朋友多联系工作·思考怎么把自己的工作做得更好最美
语义分割系列之FCN、DeeplabV1、V2、V3、V3Plus论文学习 Diros1g 学习深度学习计算机视觉
FCNFullyConvolutionalNetworks论文：FullyConvolutionalNetworksforSemanticSegmentation地址:https://openaccess.thecvf.com/content_cvpr_2015/papers/Long_Fully_Convolutional_Networks_2015_CVPR_paper.pdf特点：用全卷积替
论文学习笔记 POSEIDON: Privacy-Preserving Federated Neural Network Learning JiangChSo 论文学习深度学习机器学习神经网络算法分布式
论文学习笔记POSEIDON:Privacy-PreservingFederatedNeuralNetworkLearningNDSS2021录用文章目录论文学习笔记POSEIDON:Privacy-PreservingFederatedNeuralNetworkLearning一、机器学习1.机器学习(ML)中的挑战2.隐私保护机器学习(PPML)二、POSEIDON方案1.系统和威胁模型2.方
论文学习——Vector Quantized Diffusion Model for Text-to-Image Synthesis 客院载论音频生成学习
文章目录引言正文Abstract文章的核心VQ潜在空间适合文本转图片生成VQDiffusion的比起自回归和GAN的其他模型的成果IntroductionNLP的成功给图片生成的启发自回归模型的单向误差解释预测误差累积VQDiffusion能够解决预测误差累计和单向误差两个问题解决单向误差的方式——每一次预测都是考虑所有token的上下文信息解决错误累积的方式——使用基于掩码和替换的扩散策略模型测
Python论文学习 -- 第二章 --- Python基础知识 Metallic Cat 学习
1.cmd命令器中如果想终止命令的话可以在终止行输入exit()函数调用停止命令一.字面量二.注释---对代码进行解释说明1.在print函数中：print(a,"asd",c)输出的结果为a变量对应的值+asd+c变量对应的值如：则输出的结果为：往type()函数中输入数据，它会返回数据的类型给我们，然后我们可以用print()函数将数据类型打出来1.值得注意的是变量本身是没有类型的，它只是一个
论文学习笔记：PoseFix: Model-agnostic General Human Pose Refinement Network wangyc1208 姿态估计
论文：https://arxiv.org/abs/1812.03595代码：https://github.com/mks0601/PoseFix_RELEASE—————————————————————————————————————————————————目标：多人姿态估计：本篇论文主要工作是利用一个人体姿势优化网络，从输入图像和姿势中对人体姿态进行优化。大概的效果如下图：———————————
2021-9-23晨间日记言二yaner
今天是什么日子起床：7：40就寝：23：00天气：美好心情：美好纪念日：无任务清单昨日完成的任务，最重要的三件事：投稿改进：想到就做到习惯养成：专注自己，提升自己周目标·完成进度准备再写一篇论文学习·信息·阅读多阅读，多学习健康·饮食·锻炼早饭：小米粥，鸡蛋，烧麦中饭：真味卤，杨枝甘露晚饭：黑米粥锻炼：一小时左右人际·家人·朋友一切都是最好的安排，虽然没有过去，但也有属于自己的收获工作·思考凡事早
论文学习记录之Deep-learning seismic full-waveform inversion for realistic structuralmodels 摘星星的屋顶论文深度学习人工智能
一、ABSTRACT—摘要标题：Deep-learningseismicfull-waveforminversionforrealisticstructuralmodels（用于真实结构模型的深度学习地震全波形反演）作者：BinLiu1,SenlinYang2,YuxiaoRen2,XinjiXu3,PengJiang2,andYangkangChen4（和SeisInvNet有共同作者，应该是同
论文学习记录之SeisInvNet（Deep-Learning Inversion of Seismic Data）摘星星的屋顶论文人工智能
目录1INTRODUCTION—介绍2RELATEDWORKS—相关作品3METHODOLOGYANDIMPLEMENTATION—方法和执行3.1方法3.2执行4EXPERIMENTS—实验4.1数据集准备4.2实验设置4.3基线模型4.4定向比较4.5定量比较4.6机理研究5CONCLUSION—结论1INTRODUCTION—介绍地震勘探是根据地震波在大地中的传播规律来确定地下地层结构的一种
基于变长频带选择的JPEG图像可逆数据隐藏-文献学习凌峰的博客学习算法计算机视觉
论文学习原文题目：ReversibleDataHidingofJPEGImageBasedonAdaptiveFrequencyBandLength发表期刊：TCSVT2023（中科院1区）作者：NingxiongMao,HongjieHe,FanChen,YuanYuan,LingfengQu摘要JPEG图像在互联网上被广泛使用。基于quantifieddiscretecosinetransfo
BASNet：Boundary-aware salient object detection Kun Li 应用算法目标检测计算机视觉
CVPR2019开源论文|BASNet：关注边界的显著性检测本文提出一种基于深度监督学习的前景提取构架BASNet，其在边缘感知上有优异的表现。https://mp.weixin.qq.com/s/fjq4UyDMN9Z9lvNZ7aNLWABASNet:Boundary-AwareSalientObjectDetection论文学习_basnet:boundary-awaresalientobj
Nerf-Wild神经辐射场论文学习笔记 Neural Radiance Fields for Unconstrained Photo Collections 出门吃三碗饭 Nerf学习记录三维重建学习笔记
前言：本文为记录自己在Nerf学习道路的一些笔记，包括对论文以及其代码的思考内容。公众号：AI知识物语B站后续同步更新讲解本篇文章主要针对其数学公式来学习其内容，欢迎批评指正！！！（代码下篇出）1：摘要提出基于学习（learning-based）方法，使用野外照片的非结构化集合（unstructuredcollectionsofin-the-wildphotographs）来合成复杂场景。之前的N
GroupMixFormer：Advancing Vision Transformers with Group-Mix Attention论文学习笔记 athrunsunny Transformer 学习笔记深度学习计算机视觉 transformer
论文地址：https://arxiv.org/pdf/2311.15157.pdf代码地址：https://github.com/AILab-CVC/GroupMixFormer摘要：ViT已被证明可以通过使用多头自注意力（MHSA）对远程依赖关系进行建模来增强视觉识别，这通常被表述为Query-Key-Value计算。但是，从“Query”和“Key”生成的注意力图仅捕获单个粒度的token-t
论文学习——基于查询的workload预测（CMU） _zhj 机器学习数据库
一、简介论文题目：Query-basedWorkloadForecastingforSelf-DrivingDatabaseManagementSystems发表在2018SIGMOD，来自cmu的数据库组（这个组真的很厉害）这篇论文主要讲数据库workload预测的问题。因为要实现数据库self-driving（如选择合适的时机在合适的列上自动创建索引），应该根据将要到来的查询对数据库进行优化，
第六十八周周报童、一周报深度学习
学习目标：项目论文学习时间：2023.12.23-2023.12.29学习产出：一、项目这周后两天在根据吉安方面的需求优化SQL，提升性能二、论文这周周六在杨老师的带领下仔细改了论文前两段，后面几天自己把剩下的改完了，目前还在给杨老师看。实验方面，由于LSUN一直跑不出好的效果，已经转为STL10和CelebA，预计得下周才能出结果。其他时间都在搞开题报告的东西。
DN-DETR论文学习彭祥. DETR系列学习深度学习计算机视觉
摘要本文提出了一种新颖的去噪训练方法，以加快DETR（DEtectionTRansformer）训练，并加深了对类DETR方法的慢收敛问题的理解。我们表明，缓慢收敛是由于二分图匹配的不稳定性导致早期训练阶段的优化目标不一致。为了解决这个问题，除了匈牙利损失之外，我们的方法还向Transformer解码器馈送了带有噪声的GT边界框，并训练模型重建原始框，从而有效地降低了二分图匹配难度，并加快了收敛速
MS-DETR: Efficient DETR Training with Mixed Supervision论文学习笔记 athrunsunny Transformer 学习笔记 transformer 深度学习算法
论文地址：https://arxiv.org/pdf/2401.03989.pdf代码地址（中稿后开源）：GitHub-Atten4Vis/MS-DETR:Theofficialimplementationfor"MS-DETR:EfficientDETRTrainingwithMixedSupervision"摘要DETR通过迭代生成多个基于图像特征的目标候选者，并为每个真实目标分配一个候选者，
经典论文学习：Attention Is All You Need（Transformer）才能我浪费 AI应用深度学习机器学习人工智能
1，概述《AttentionIsAllYouNeed》是一篇由GoogleDeepMind团队在2017年发表的论文，该论文提出了一种新的神经网络模型，称为Transformer模型，用于自然语言处理任务。该模型的创新点在于使用了一种称为“自注意力机制（self-attentionmechanism）”的技术，以取代传统的循环神经网络（RNN）和卷积神经网络（CNN）等结构，这使得模型在处理序列数
2022-6-17晨间日记七翎
今天是什么日子起床：7.30(因为今天考科四，好困啊！！！)就寝：科四成功考过，熬个小夜(嘻嘻)天气：昨天下雨了，今天超凉快！心情：开心更多一点纪念日：纪念我拿上驾照的日子任务清单昨日完成的任务，最重要的三件事：刷完10套科四卷子✔习惯养成：早睡早起(尽量吧)周目标·完成进度1.完成编程课程2.看完导师论文学习·信息·阅读看了网文(嘻嘻)放纵一下健康·饮食·锻炼吃了很多不健康的食物，但很快乐！人际
ChatGPT可以帮你做什么？ SiKi学院 chatgpt 人工智能
学习利用ChatGPT学习有很多，比如：语言学习、编程学习、论文学习拆解、推荐学习资源等，使用方法大同小异，这里以语言学习为例。在开始前先给GPT充分的信息：（举例）【角色】充当一名有丰富经验的英语老师【背景】我是一名英语雅思备考的学生，想进行英语相关学习（这里最好说明是帮助你做什么练习，如口语）【任务】你要和我进行对话，根据我输入的内容，去进行讲解和说明【要求】我希望你首先可以列举出雅思备
【论文学习】SOLVING INVERSE PROBLEMS IN MEDICAL IMAGING WITH SCORE-BASED GENERATIVE MODELS Lyrig~ 神经网络图像修复（Image Restoration）学习机器学习算法
【论文学习】SOLVINGINVERSEPROBLEMSINMEDICALIMAGINGWITHSCORE-BASEDGENERATIVEMODELS前言相关概念线性逆问题基于分数的生成模型扰动过程逆过程采样利用基于分数的生成模型求解逆问题一种简便的线性测量过程形式将给定的观测结果融合进无条件采样过程前言好不容易写完了这么长的一篇，整体看来，这篇文章更像是对去噪过程的一个改进。通过在不同时间步引入
论文学习使用基于NeRF的精炼特征从3D感知Diffusion模型下实现单视点下的人工重建 Lyrig~ 学习 3d 人工智能
论文学习使用基于NeRF的精炼特征从3D感知Diffusion模型下实现单视点下的人工重建论文连接前言摘要介绍相关工作2.13D生成的扩散模型2.2单视点下的新视点生成神经场（NeRF）以外的方法基于神经场（NeRF）的方法背景3.1图片条件NeRF3.2无几何视图合成NerfDiff论文连接NerfDiff:Single-imageViewSynthesiswithNeRF-guidedDist
【论文学习】InstructGPT：Training language models to follow instructions with human feedback Shackles Lay 学习语言模型自然语言处理
前言：语言模型的输出依赖于预训练的数据集，研究者想要探索无监督领域的模型，使其仅仅依赖无标签的数据就可以实现不错的效果，为了让模型的泛化性能尽可能的强，研究者会提供尽可能大的数据集。但这样的训练方法存在两个问题：一、有效性。模型的性能依赖于训练时使用的文本，但是研究者并不知道无标签的大批量的数据集是否可以使模型学习到解决指定任务的能力，可能对于特定领域来说，模型根本没见过这样的数据；二、安全性，模
畸变矫正-深度学习相关论文学习六个核桃Lu 畸变矫正深度学习学习人工智能
目录DocTr:DocumentImageTransformerforGeometricUnwarpingandIlluminationCorrectionSimFIR:ASimpleFrameworkforFisheyeImageRectificationwithSelf-supervisedRepresentationLearningModel-FreeDistortionRectificat
A Fast Learning Algorithm for Deep Belief Nets - 论文学习 Mr，yu 论文笔记论文笔记 Machine Learning DeepLearning
文章目录摘要介绍互补先验一个带约束权的无限有向模型限制玻尔兹曼机和对比散度学习一种转换表示的贪婪学习算法SomeIdeasBasedonDBNNonlinearDimensionalityReductionLearningSemanticAddressSpace(SAS)forFastDocumentRetrievalLearningNonlinearEmbeddings参考文献摘要explain
周四 2020-03-12 07:15 - 24:00 晴 06h54m 么得感情的日更机器
概述早上6点20被闹钟搞醒，关了接着睡，7:14醒听听力、背单词、学习强国，练字，8:00下楼吃饭，8:30上楼读口语、做日计划。上午从9:00开始锁机学习相应SLAM论文综述，中间锻炼五分钟，跳的我腿好疼。11:00-11:35，对论文学习内容进行总结，编写论文记录文档。下午13:00-14:30看动漫，14:30-16:20整理计算机基本知识的文档。晚上看着手机发呆，然后讨论论文的事情，总
smpl-x论文学习-部分翻译 ipv-tao 图形学三维重构
论文地址：ExpressiveBodyCapture:3DHands,Face,andBodyfromaSingleImage知乎大佬的讲解：https://zhuanlan.zhihu.com/p/137235901另一位大佬的讲解：https://posts.careerengine.us/p/5f23a5898988c12b4302afb61.定性结果和SMPL，SMPL-H相比，表现能力明
关于旗正规则引擎规则中的上传和下载问题何必如此文件下载压缩 jsp 文件上传
文件的上传下载都是数据流的输入输出，大致流程都是一样的。一、文件打包下载 1.文件写入压缩包 string mainPath="D:\upload\"; 下载路径 string tmpfileName=jar.zip; &n
【Spark九十九】Spark Streaming的batch interval时间内的数据流转源码分析 bit1129 Stream
以如下代码为例（SocketInputDStream）： Spark Streaming从Socket读取数据的代码是在SocketReceiver的receive方法中，撇开异常情况不谈(Receiver有重连机制，restart方法，默认情况下在Receiver挂了之后，间隔两秒钟重新建立Socket连接)，读取到的数据通过调用store(textRead)方法进行存储。数据
spark master web ui 端口8080被占用解决方法 daizj 8080 端口占用 spark master web ui
spark master web ui 默认端口为8080，当系统有其它程序也在使用该接口时，启动master时也不会报错，spark自己会改用其它端口，自动端口号加1，但为了可以控制到指定的端口，我们可以自行设置，修改方法： 1、cd SPARK_HOME/sbin 2、vi start-master.sh 3、定位到下面部分
oracle_执行计划_谓词信息和数据获取周凡杨 oracle 执行计划
oracle_执行计划_谓词信息和数据获取(上) 一：简要说明在查看执行计划的信息中，经常会看到两个谓词filter和access，它们的区别是什么，理解了这两个词对我们解读Oracle的执行计划信息会有所帮助。简单说，执行计划如果显示是access，就表示这个谓词条件的值将会影响数据的访问路径（表还是索引），而filter表示谓词条件的值并不会影响数据访问路径，只起到
spring中datasource配置 g21121 dataSource
datasource配置有很多种，我介绍的一种是采用c3p0的，它的百科地址是： http://baike.baidu.com/view/920062.htm  <bean name="propertiesConfig" class="org.springframework.b
web报表工具FineReport使用中遇到的常见报错及解决办法（三）老A不折腾 finereport FAQ 报表软件
这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、repeated column width is largerthan paper width：这个看这段话应该是很好理解的。比如做的模板页面宽度只能放
mysql 用户管理墙头上一根草 linux mysql user
1.新建用户 //登录MYSQL@>mysql -u root -p@>密码//创建用户mysql> insert into mysql.user(Host,User,Password) values(‘localhost’,'jeecn’,password(‘jeecn’));//刷新系统权限表mysql>flush privileges;这样就创建了一个名为：
关于使用Spring导致c3p0数据库死锁问题 aijuans spring Spring 入门 Spring 实例 Spring3 Spring 教程
这个问题我实在是为整个 springsource 的员工蒙羞如果大家使用 spring 控制事务，使用 Open Session In View 模式， com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.
百度词库联想 annan211 百度
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <title>RunJS</title&g
int数据与byte之间的相互转换实现代码百合不是茶位移 int转byte byte转int 基本数据类型的实现
在BMP文件和文件压缩时需要用到的int与byte转换,现将理解的贴出来; 主要是要理解;位移等概念 http://baihe747.iteye.com/blog/2078029 int转byte; byte转int; /** * 字节转成int,int转成字节 * @author Administrator *
简单模拟实现数据库连接池 bijian1013 java thread java多线程简单模拟实现数据库连接池
简单模拟实现数据库连接池实例1： package com.bijian.thread; public class DB { //private static final int MAX_COUNT = 10; private static final DB instance = new DB(); private int count = 0; private i
一种基于Weblogic容器的鉴权设计 bijian1013 java weblogic
服务器对请求的鉴权可以在请求头中加Authorization之类的key，将用户名、密码保存到此key对应的value中，当然对于用户名、密码这种高机密的信息，应该对其进行加砂加密等，最简单的方法如下： String vuser_id = "weblogic"; String vuse
【RPC框架Hessian二】Hessian 对象序列化和反序列化 bit1129 hessian
任何一个对象从一个JVM传输到另一个JVM，都要经过序列化为二进制数据(或者字符串等其他格式，比如JSON)，然后在反序列化为Java对象，这最后都是通过二进制的数据在不同的JVM之间传输(一般是通过Socket和二进制的数据传输)，本文定义一个比较符合工作中。 1. 定义三个POJO Person类 package com.tom.hes
【Hadoop十四】Hadoop提供的脚本的功能 bit1129 hadoop
1. hadoop-daemon.sh 1.1 启动HDFS ./hadoop-daemon.sh start namenode ./hadoop-daemon.sh start datanode 通过这种逐步启动的方式，比start-all.sh方式少了一个SecondaryNameNode进程，这不影响Hadoop的使用，其实在 Hadoop2.0中，SecondaryNa
中国互联网走在“灰度”上 ronin47 管理灰度
中国互联网走在“灰度”上（转）文/孕峰第一次听说灰度这个词，是任正非说新型管理者所需要的素质。第二次听说是来自马化腾。似乎其他人包括马云也用不同的语言说过类似的意思。灰度这个词所包含的意义和视野是广远的。要理解这个词，可能同样要用“灰度”的心态。灰度的反面，是规规矩矩，清清楚楚，泾渭分明，严谨条理，是决不妥协，不转弯，认死理。黑白分明不是灰度，像彩虹那样
java-51-输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。 bylijinnan java
public class PrintMatrixClockwisely { /** * Q51.输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。例如：如果输入如下矩阵： 1 2 3 4 5 6 7 8 9
mongoDB 用户管理开窍的石头 mongoDB用户管理
1:添加用户第一次设置用户需要进入admin数据库下设置超级用户（use admin） db.addUsr({user:'useName',pwd:'111111',roles:[readWrite,dbAdmin]}); 第一个参数用户的名字第二个参数
[游戏与生活]玩暗黑破坏神3的一些问题 comsci 生活
暗黑破坏神3是有史以来最让人激动的游戏。。。。但是有几个问题需要我们注意玩这个游戏的时间，每天不要超过一个小时，且每次玩游戏最好在白天结束游戏之后，最好在太阳下面来晒一下身上的暗黑气息，让自己恢复人的生气 &nb
java 二维数组如何存入数据库 cuiyadll java
using System; using System.Linq; using System.Text; using System.Windows.Forms; using System.Xml; using System.Xml.Serialization; using System.IO; namespace WindowsFormsApplication1 {
本地事务和全局事务Local Transaction and Global Transaction(JTA) darrenzhu java spring local global transaction
Configuring Spring and JTA without full Java EE http://spring.io/blog/2011/08/15/configuring-spring-and-jta-without-full-java-ee/ Spring doc -Transaction Management http://docs.spring.io/spri
Linux命令之alias - 设置命令的别名，让 Linux 命令更简练 dcj3sjt126com linux alias
用途说明设置命令的别名。在linux系统中如果命令太长又不符合用户的习惯，那么我们可以为它指定一个别名。虽然可以为命令建立“链接”解决长文件名的问题，但对于带命令行参数的命令，链接就无能为力了。而指定别名则可以解决此类所有问题【1】。常用别名来简化ssh登录【见示例三】，使长命令变短，使常用的长命令行变短，强制执行命令时询问等。常用参数格式：alias 格式：ali
yii2 restful web服务[格式响应] dcj3sjt126com PHP yii2
响应格式当处理一个 RESTful API 请求时，一个应用程序通常需要如下步骤来处理响应格式：确定可能影响响应格式的各种因素，例如媒介类型，语言，版本，等等。这个过程也被称为 content negotiation。资源对象转换为数组，如在 Resources 部分中所描述的。通过 [[yii\rest\Serializer]]
MongoDB索引调优（2）——[十] eksliang mongodb MongoDB索引优化
转载请出自出处：http://eksliang.iteye.com/blog/2178555 一、概述上一篇文档中也说明了，MongoDB的索引几乎与关系型数据库的索引一模一样，优化关系型数据库的技巧通用适合MongoDB，所有这里只讲MongoDB需要注意的地方二、索引内嵌文档可以在嵌套文档的键上建立索引，方式与正常
当滑动到顶部和底部时，实现Item的分离效果的ListView gundumw100 android
拉动ListView，Item之间的间距会变大，释放后恢复原样； package cn.tangdada.tangbang.widget; import android.annotation.TargetApi; import android.content.Context; import android.content.res.TypedArray; import andr
程序员用HTML5制作的爱心树表白动画 ini JavaScript jquery Web html5 css
体验效果：http://keleyi.com/keleyi/phtml/html5/31.htmHTML代码如下： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"><head><meta charset="UTF-8" > <ti
预装windows 8 系统GPT模式的ThinkPad T440改装64位 windows 7旗舰版 kakajw ThinkPad 预装改装 windows 7 windows 8
该教程具有普遍参考性，特别适用于联想的机器，其他品牌机器的处理过程也大同小异。该教程是个人多次尝试和总结的结果，实用性强，推荐给需要的人！缘由小弟最近入手笔记本ThinkPad T440，但是特别不能习惯笔记本出厂预装的Windows 8系统，而且厂商自作聪明地预装了一堆没用的应用软件，消耗不少的系统资源（本本的内存为4G，系统启动完成时，物理内存占用比
Nginx学习笔记 mcj8089 nginx
一、安装nginx 1、在nginx官方网站下载一个包，下载地址是： http://nginx.org/download/nginx-1.4.2.tar.gz 2、WinSCP(ftp上传工
mongodb 聚合查询每天论坛链接点击次数 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 18 */ { "_id" : ObjectId("5596414cbe4d73a327e50274"), "msgType" : "text", "sendTime" : ISODate("2015-07-03T08:01:16.000Z"
java术语（PO/POJO/VO/BO/DAO/DTO） Luob. DAO POJO DTO po VO BO
PO(persistant object) 持久对象在o/r 映射的时候出现的概念,如果没有o/r映射,就没有这个概念存在了.通常对应数据模型(数据库),本身还有部分业务逻辑的处理.可以看成是与数据库中的表相映射的java对象.最简单的PO就是对应数据库中某个表中的一条记录,多个记录可以用PO的集合.PO中应该不包含任何对数据库的操作. VO(value object) 值对象通
算法复杂度 Wuaner Algorithm
Time Complexity & Big-O： http://stackoverflow.com/questions/487258/plain-english-explanation-of-big-o http://bigocheatsheet.com/ http://www.sitepoint.com/time-complexity-algorithms/