WhyNot_Zero

[论文笔记]Delving into Transferable Adversarial Examples and Black-box Attacks(ICLR2017)

这篇文章的主要成果：
1.提出了一种集合方法来生成对抗样本（感觉并不是本文的主要贡献，也不是特别有新意，就是把集合思想融入进了对抗样本）
2.正如论文的标题，作者深入分析了对抗样本的迁移性，并做了几何特性的分析，得出了一些比较有意思、且有点反直觉的结论。（几何部分真的太难懂了，人都看晕了）

注：这篇笔记中，蓝框里的是我对原文的一个简单的翻译，其余部分是我对文章的一些小的总结。

0 摘要
1 简介
2 对抗深度学习及迁移性
- 2.1对抗深度学习问题
- 2.2：生成对抗样本的方法
- - 2.2.1无目标方法
  - 2.2.2有目标方法
- 2.3评估方法
3.无目标对抗样本
- 3.1 基于优化的方法
- 3.2快速梯度方法
- 3.3 加入随机扰动进行比较
4.有目标攻击
5.基于集合的方法
6.不同模型的几何特性

0 摘要

DNN的一个有趣的性质是对抗样本的存在，其可以在不同结构的模型中迁移。这些可迁移的对抗样本会严重阻碍DNN应用。过去的工作通常只利用小规模数据集研究迁移性。本文中，我们首次利用大规模数据集及大型模型来进行拓展研究，我们还是首个研究有目标对抗样本与其目标标签的迁移性。我们同时研究无目标攻击和有目标攻击，结果显示可迁移的无目标对抗样本很容易找，有目标攻击很难带着目标标签迁移。因此，我们提出了基于集成的方法来生成可迁移的对抗样本。利用这个方法，有很大比例的对抗样本可以带着目标标签迁移。我们还展示了一些几何学研究来帮助理解可迁移对抗样本。最后，我们展示了基于集成的方法能成功进行黑盒攻击。

1 简介

这章就是介绍了一下什么是对抗样本，现在大家研究的怎么样，哪些没人研究过，然后这篇文章就研究了这些。然后前半部分长篇大论的就没翻，只列了最后总结性的部分

Contributions and organization:
Section2:背景知识及实验设置
Section3:阐述了现有的能生成无目标可迁移对抗样本的方法
Section4:几乎没有现有的方法能够生成可迁移的有目标对抗样本
Section5:提出了一种新颖的基于集合的方法生成对抗样本，是首个能使大部分有目标对抗样本能够在多个模型间迁移的方法。
Section6：首个对ImageNet上训练出的大型模型进行几何特性分析，揭示了一些有趣的发现，例如不同模型的梯度方向是相互正交的。
Section7：首个展示能够在黑盒环境下进行有目标迁移的对抗样本，该对抗样本是利用在ImageNet上训练出的模型制造出来的，并且更值得一提的是，目标模型是Clarifai.com，其标签集与ImageNet的大不相同。

相关工作：对抗样本的迁移性2013年在 Intriguing properties of neural networks.上由Szegedy等人首次提出，其研究了同一数据集上训练出来的不同模型的迁移性以及一个数据集的不相交子集上训练出的不同模型的迁移性。
后续2014年Goodfellow在Explaining and harnessing adversarial examples.上提出将传递性归因于对抗扰动于模型的权重向量高度平行，该假设是在MNIST和CIFAR-10上验证的，本文证实了该假设对于ImageNet上训练的模型无效。
2016年Papernot在a： Transferability in machine learning: from phenomena to black-box attacks using adversarial samples.和b： Practical black-box attacks against deep learning systems using adversarial examples.提出构建一个替代模型来进行黑盒攻击，为了训练该模型，他们开发了一个技术，就是综合一个训练集，并通过查询目标模型来给其进行标签标注。后续，他们研究了深度神经网络与其他决策树、knn等模型间的迁移性。
我们的工作在三方面与Papernot等人不同：第一，在他们的研究中，只有模型和训练过程是黑盒的，训练集和测试集是攻击者掌握的，而本文攻击的模型，训练集，训练过程，测试集都是未知的。第二：这些研究都是基于MNIST和GTSRB等小规模数据集，而本文研究的是大模型及ImageNet等大数据集。第三：我们不通过查询目标系统来构建替代模型。
Moosavi-Dezfooli等人有一个同行且独立的研究，展示了一种能够在各个模型间迁移的“普适性扰动”，利用这种扰动生成的对抗图片可以在ImageNet上的各种模型间迁移。但他们只研究了无目标迁移性，然而我们的工作同时研究了ImageNet上的无目标和有目标攻击。

2 对抗深度学习及迁移性

2.1对抗深度学习问题

这一节就是定义了一下对抗样本问题

2.2：生成对抗样本的方法

本文考虑三类生成方法：基于优化的方法，快速梯度方法，及快速梯度符号方法。每类都分别有无目标和有目标版本。

其实我感觉就是分成了基于优化和基于梯度两类，梯度和梯度符号这两种方法就差了个sign函数。而基于优化的方法其实还是利用了梯度的，只不过是迭代的去利用梯度来生成对抗样本，而快速梯度符号方法（FGSM）只利用了一次梯度（所以叫快速嘛），所以本质上就是基于迭代和非迭代的方法，但是下面还是按作者的叫法，称为基于优化和基于梯度。

2.2.1无目标方法

一切无目标攻击都可形式化为寻找满足以下条件的x*：

基于优化的方法：近似出以下优化问题的最优解（具体见C&W方法）：
快速梯度符号方法（FGSM）：仅计算一次梯度，故称为“快速”（对应迭代方法，需多次计算梯度）。利用sign函数，生成的对抗图像满足∞范数约束。形式化：

其中，clip为裁剪函数，保证生成的图片各像素还在[0-255]范围内，sign为符号函数。
快速梯度方法（FG）：类似FGSM，但不沿梯度符号方向，而是直接沿着梯度方向。

这一节主要就是介绍了一下三种方法，不了解的话可以直接看一下原文或者相关博客。

2.2.2有目标方法

类似于无目标攻击，但第一个约束条件改为：
这一段感觉也没什么好说的，就是描述了一下有目标版本的三种方法。

2.3评估方法

这一节详细叙述了所研究的模型、训练集及所用的度量方法，作者讲述的比较复杂，我这里挑了几个比较值得关注的列一下：

Models. 一共五个：RestNet-50，ResNet-101， ResNet-152，GoogLeNet and VGG-16。
Dataset. 从ILSVRC2012验证集中选择100张能够被5个模型正确分类的图片作为测试集。
Measuring transferability. 这个很绕！划重点！！看仔细了，不然看后面的图表看不懂。这部分就是说怎么衡量一个对抗方法的好坏，分两种情况，一个是有目标，一个是无目标。对于无目标攻击，计算目标模型能够将对抗样本正确分类的概率；对于有目标攻击，计算目标模型错误分类，且输出结果为攻击者选定的目标标签的概率。所以说后面实验的表格中，如果是无目标攻击，则百分比越小说明攻击效果越好，而有目标攻击则是百分比越大说明效果越好。
Distortion. 利用均方根差衡量对抗样本与原图片的差异。

3.无目标对抗样本

本章研究了各种生成无目标对抗图片的方法。

3.1 基于优化的方法

采用Adam优化器来优化上一章提到的优化问题。作者发现，可以通过调整Adam的学习率来调节均方根差（也就是图像扰动的大小），只要将学习率设置的很小，就能使对抗样本的均方根差很小，无论λ取何值。因此作者干脆将λ设为0。然后发现这些对抗样本虽然扰动很小，也能成功欺骗目标模型，但迁移性很差。
增加学习率，即增加扰动大小后，损失值在100次迭代后开始收敛。这样的对抗样本几乎都能百分百欺骗目标模型，且大部分可迁移。值得注意的使，虽然不同的ResNet模型结构相似，只有超参数不同，但他们生成的对抗样本不一定能相互迁移，但总体上比迁移到非RestNet模型上要容易。

这个是实验结果，Panel A是优化方法的，Panel B是下面的快速梯度方法的，都是单模型无目标的，作者给出了以下几个结论：

对角线都是0，说明用某一模型生成的对抗样本可以百分百迁移到同类（比如都是ResNet-152）的黑盒模型上
大部分基于优化生成的无目标对抗样本都可以迁移到别的（非同类）模型上去。
虽然三个ResNet模型只有超参数不一样，但是它们三个之间的迁移不见得比迁移到别的模型上容易，比如第一列的3、4两格，RestNet-50迁移到RestNet-152准确率有23%，而VGG16迁移上去只有22%。

3.2快速梯度方法

这部分没仔细看。。。。。感觉没什么意思，不是本文的重点

3.3 加入随机扰动进行比较

就是对原图像加入随机的高斯噪声，然后测试模型的准确率，然后测试结果就是果然没有上面两个方法好。这个感觉过分了啊，这不是废话吗，，，感觉看不起这两个方法。

4.有目标攻击

这部分也没仔细看，也不是重点，结果总归就是有目标攻击成功率比无目标低。后面的集合攻击和几何分析才是全文的重点。

这是实验结果，注意，有目标攻击的实验结果百分百越大说明实验效果越好，这个和无目标的是相反的，具体原因看上面2.3里面Measuring transferability. 里说的。

5.基于集合的方法

作者提出了这样一个假设：如果一个对抗图片能够对多个模型保持对抗性，则他也更有可能能够迁移到别的模型上。因此，他提出了一个利用多个模型生成对抗样本的技术。
基本思路：就是利用一个模型集合来生成对抗图片。
形式化问题：给定k个白盒模型及其softmax输出J1,J2,…Jk，原始图片x及其真实标签y，y*为目标标签，则基于集合方法即为解决如下优化问题：
注：这里的优化问题是直接套用的C&W论文里面的结论，也就是把L(u,v)=log(1-u·v)直接带入到2.2.1的那个优化问题里，然后因为上述的是有目标攻击，所以就变成了log(u·v)。
然后作者将3、4章介绍的单个模型的攻击方法与本章所述的基于集合的方法相结合，形成了利用集合模型的攻击方法。
以下是对集合模型版的优化方法与梯度方法的评估：
Optimization-based approach. 利用Adam，计算四个模型的更新值并求和，然后加到图片上。同样在100次迭代后收敛了。制作出来的对抗样本普遍具有迁移性，不过并不能百分百欺骗集合中的模型。作者的解释是：在搜索集合模型的对抗样本的时候，并不会直接去误导集合中的某个单个的模型的预测值。
上述的是有目标攻击的结构，迁移后成功误导的几率大概百分之三四十（具体看表），而无目标部分效果就更好了，迁移后模型的准确率低于6%，且扰动大小也比单个模型的攻击要小。
下面是实验结果，第一个是有目标，数据越大说明效果越好，第二个是无目标的，数据越小说明效果越好。

Fast gradient-based approach. 作用不大，无目标部分，目标模型的正确率能达到20%，而有目标部分就更惨了，目标模型分到目标标签的成功率就1%。至于原因，作者的猜想是集合中的不同模型的梯度方向是相互正交的，这样一来集合模型的梯度方向就几乎和其中的单个模型的梯度方向正交了，因此就需要特别大的扰动才能有对抗性，具体分析在第六章。
下面是实验结果，第一个是无目标，第二个是有目标。

总结一下，就是作者提出将多个模型的softmax层的输出进行加权求和，然后将这个和看成是这几个模型组成的集合模型的softmax输出，然后再按传统的攻击方法来攻击。然后实验结果就是，对基于优化的方法提升很明显，而对基于梯度的方法几乎没什么提升。

接下来就是作者对于迁移性的一个深入分析，我感觉是这篇文章最重要的部分。

6.不同模型的几何特性

本章展示了模型的一些几何特性来试图更好的理解可迁移对抗样本。前人也做过相关工作，本文测试在大数据集上训练的，有1000个标签的大型模型，其几何特性并未被测试过。
结论一：在我们的评估中，不同模型的梯度方向几乎是相互正交的。 作者想研究不同模型的对抗方向是否相互一致。他计算了不同模型的梯度方向间夹角的余弦值（通过余弦值就可以反应夹角了嘛），发现任何两个模型的夹角的余弦值都接近于0，这表明对于大多数图像来说，他们关于不同模型的梯度方向是相互正交的。

这一段话是啥意思呢，说白了，从直觉上说，既然有迁移攻击这个东西，那不同模型的梯度方向应该是差不多的，这样你攻击了一个模型，这个对抗样本也就能攻击别的模型了嘛。作者就是想证实一下，结果发现不仅不是差不多，还几乎是垂直的（高维上叫正交）。这就很奇怪了，既然两个模型的梯度方向几乎是正交的，那你沿这个模型的梯度方向加扰动，拿去给别的模型用，按理说应该是百分百没用呀。然后作者就在后面做了进一步的研究。

结论二：单个模型的无目标方法的决策边界。作者希望通过研究不同模型的决策边界来理解为什么对抗样本能迁移。他选择了两个正交方向σ1σ2，一个是VGG16的梯度方向，另一个是随机选择的。每个点（u，v）对应了图片x+uσ1+vσ2，其中x是原始图片的像素值向量。对于每个模型，我们绘制每个点对应图片的标签，并利用图2的图片获得了图3。

作者这是要干啥呢，我的理解是：因为上面结论一说了，按照直觉不同模型的梯度应该是差不多的，这样才会出现迁移这个东西，但是作者一实验发现是两两正交的。这就奇了怪了，那为什么对抗样本还能迁移呢？所以作者就想搞明白这个，所以就先给图片加沿着梯度方向的扰动，从小到大开始加，看看什么时候模型开始出现错误，也就是碰到所谓的决策边界嘛。然后再给图片加正交于梯度方向的扰动，从小到大开始加，看看是什么情况，会不会出现误判，啥时候会出现。想到这儿，作者干脆就不光做这两个方向的实验，他把这两个方向进行线性组合，也就是文中说的u，v，然后u和v都取-20到20的所有值，测试一下模型的输出标签，然后不同的标签用不同的颜色表示，就形成了文章里的Figure3.

再后面是作者对这张图的观察和分析，我做一下提炼和总结（顺便提一下，Figure3上下两部分，一个Zoom-in一个Zoom-out只是放大缩小而已，是同一个东西）：

1.每个模型都只有中间一小块可以保证正确分类（也就是所谓的决策边界嘛）
2.一个很有趣的现象：三个RestNet模型在沿着梯度方向，也就是沿x轴往左往右，第一个错误分类的类别是一样的，都是变成了亮绿色，其实就是都错误分类为了“橘子”。不过随着扰动进一步增大，错误分类的类别就五花八门了。
3.作者还统计了每个模型所出现的所有误判的类别，也就是随着扰动增大，各个模型一共对抗样本一共出现了几种错误结果，然后统计在了Table5.结果发现所有的模型加起来一共才出现了21种，但这个数据集一共有1000个类别，只有2.1%。这就解释了为什么梯度方法难以进行有目标攻击，因为你不管沿着梯度方向还是沿着正交方向，它一共只会出现这21种结果，你如果目标定成另外几百个标签中的一个，根本就不可能制造出这样的对抗样本。

然后作者把每个模型的决策边界画在同一张图里面，形成了Figure4，然后又有了一些发现：

4.每个模型的决策边界都差不多，这就是为什么无目标攻击是很好迁移的。
5.沿梯度方向的直径比沿随机的正交方向的直径要小，这个也很容易理解，因为沿梯度方向也就是扰动更有针对性嘛，模型自然更容易误判。
6.又一个很有趣且很反直觉的发现：沿着x轴向右，就是沿着梯度方向加入扰动，出现了误判，这很好理解，就是增大了正确标签的损失值嘛。但是向左移动，是在减小损失，相当于增加正确标签的概率，但是模型还是出现了误判。这就很奇怪了，作者的解释是这是由于损失函数的非线性导致的，扰动增大后，梯度方向也在剧烈变化，原本的梯度方向可能也就不再是减小损失的方向了。
7.这个点也挺有意思的，就是仔细看VGG-16的zoom-in的那张图，蓝色区域里面有一个橙色的小区域，蓝色区域就是模型分类正确的情况，橙色就是分类成别的东西了。作者用这个点来解释小扰动的无目标攻击不能百分百迁移，说是因为对于VGG来说，这个小区域内的扰动很小，也能导致VGG出错，但是他是VGG里面的一个特例，拿去攻击别的模型就不行，所以小扰动的无目标攻击不能百分百迁移。不过感觉这个解释也没啥必要，因为VGG16的决策边界本来就参差不齐的，随便哪里凹进来的一块，拿来攻击别的模型，也会导致迁移失败的。

结论三：有目标集合方法的决策边界。 然后作者又取了有目标攻击的集合模型的梯度方向及其垂直方向，然后和上面一样线性组合加在原图上，从而画出各个模型的决策边界。作者把五个模型的决策边界画在一张图里，也就是Figure5，然后这张图里面虚线画的四个模型就是集合模型的集合里面的四个模型，然后实线画出来的VGG不在集合里面。然后可以很明显的看出来集合里有的模型，攻击范围相对大一点，集合里没有的就要小很多。但是无论如何，他们的中心点还是差不多重合的。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
神经网络-损失函数红米煮粥神经网络人工智能深度学习
文章目录一、回归问题的损失函数1.均方误差（MeanSquaredError,MSE）2.平均绝对误差（MeanAbsoluteError,MAE）二、分类问题的损失函数1.0-1损失函数（Zero-OneLossFunction）2.交叉熵损失（Cross-EntropyLoss）3.合页损失（HingeLoss）三、总结在神经网络中，损失函数（LossFunction）扮演着至关重要的角色，它
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
BP神经网络的传递函数大胜归来19 MATLAB
BP网络一般都是用三层的，四层及以上的都比较少用；传输函数的选择，这个怎么说，假设你想预测的结果是几个固定值，如1,0等，满足某个条件输出1，不满足则0的话，首先想到的是hardlim函数，阈值型的，当然也可以考虑其他的；然后，假如网络是用来表达某种线性关系时，用purelin---线性传输函数；若是非线性关系的话，用别的非线性传递函数，多层网络时，每层不一定要用相同的传递函数，可以是三种配合，可
神经网络传递函数sigmoid,神经网络传递函数作用快乐的小荣荣神经网络机器学习深度学习人工智能
神经网络传递函数选取不同会有特别大差别嘛？只是最后一层，但前面层是非线性，那么可能存在区别不大的情况。线性函数f(a*input)=af(input),一般来说，input为向量，最简化情况下，可以假设input的各个维度，a1=a2=a3。。。意味着你线性层只是简单的对输入做了scale~而神经网络能起作用的原因，在于通过足够复杂的非线性函数，来模拟任何的分布。所以，神经网络必须要用非线性函数。
机器学习-------数据标准化罔闻_spider 数据分析算法机器学习人工智能
什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb