supergxt

异常检测(Out-of-distribution detection\ anomaly detection)相关论文阅读

Learning Confidence for Out-of-Distribution detection in Neural Network

作者 Terrance DeVries 、Graham W. Taylor
论文原地址：https://arxiv.org/abs/1802.04865

OOD : where a network must determine whether or not an input is outside of the set on which it is expected to safely perform

提到任何事物都有认知局限性，认识到这种局限性才可以最小化潜在风险

proposed：

1 train NN classifiers to output confidence estimates for input, and differeniate the in and out-of distribution examples.

2 misclassified in-distribution examples can be used as a proxy when calibrating ood detectors

motivation:

以学生回答问题作为motivation。当学生回答问题时，对于不太确定的问题，可以申请hints，但是会受到penalty。对于high confidence的问题，不需要hints，对于low confidence的问题，需要hints，当所有问题回答完之后，根据一共申请了多少hints（或者是受到多生penalty），确定这个模型的置信度程度

model：

$异常检测(Out-of-distribution detection\ anomaly detection)相关论文阅读_第1张图片$
在倒数第二层之后添加一个 confidence estimation branch，original模型有prediction branch and confidence branch.分别输出prediction probabilities p和confidence estimate c
$p_i, c ∈ [0, 1],\sum_{i=1}^Mpi = 1.$
上述motivation中提到的hints，通过interpolate between original predictions and target probability
$p_i^{'} = c * p_i + (1-c)*y_i$
这个式子还是蛮有意思的，通过置信度C，如果模型对该输入的预测置信度为1，则预测就是模型的预测，如果模型对该输入的预测置信度为零，就是模型完全不可信，则预测就是真实的标签，通过c的大小，来决定调整预测值有多少来自hints。

像传统的softmax loss一样，不过是adjusted prediction propability. 但是只用这样的loss会有一个问题就是模型会把c学的特别低，这样输出都是真实的标签，loss也就越来越小，所以必须要对c有一个限制，添加一个log penalty，confidence loss
$L_s = -\sum_{i=1}^Mlog(p_i^{'})y_i$
$L_C = -log(c)$
$L_s + \lambda Lc$

具体训练

三个关键点：

1 对于模型超参数lambda的选择

在训练过程中，很容易所有的样本的c都会收敛到1，这样子就不会考虑hints了，也就和普通的softmax没有区别了，而理想应该是预测正确的样本 c -> 1,预测错误的样本 c-> 0.

提出一个beta，作为预置参数，表示置信度惩罚项的最大值，具体实施:当Lc > beta, 就增加lambda，将Lc降下来；当Lc < beta，就减小lambda，总之就是让Lc维持在一个目标beta附近。

2 避免过度正则化

confidence learning可以看作一个很强的正则化，这在某些任务中可以看作是很强的抗过拟合方法，但是也有风险导致欠拟合（就是模型不去学复杂的decision boundry），因此该模型选择每个batch中一半的数据用之前的loss，另一半的数据还是只用传统softmax（也就是只有部分数据可以得到hints）

3 保留错误分类的training example

当多参数模型遇到小量数据集时，会将训练集过拟合，也就是在训练过程中所有样本都被判断正确，但是在该模型中，判断错误的样本同样重要，因为他们会很大程度影响c。因此在训练过程中用了一些数据增强的方法。

一些操作

1 数据预处理

作者希望数据在输入前就可以增加 in-distribution 和 out-distribution之间的差异性。论文中参考Fast Gradient Sign Method FGSM（GAN）通过对输入数据增加一些pertubation，使得模型更有几率进行错误分类。对图像进行干扰，使得模型能对in-distribution data输出更大置信度。

we observe that in-distribution examples increase in confidence more than out-of-distribution examples using this procedure, resulting in an easier separation of the two distributions

实验数据

in-distribution-dataset: SVHN, CIFAR-10

out-distribution-dataset: TinyImageNet, LSUN, iSUN, Uniform Noise, Gaussian Noise

Enhancing The Reliability of Out-of-distribution Image Detection in Neural Networks（2018 ICLR）

问题提出：

1 开篇同样是介绍OOD， However, when deploying neural networks in real-world
applications, there is often very little control over the testing data distribution. Recent works have shown that neural networks tend to make high confidence predictions even for completely unrecognizable or irrelevant inputs（对很能识别的或者完全无关的类输入也会产生高置信度。这里给予的还是最基础的OOD方法，根据置信度判断）

$异常检测(Out-of-distribution detection\ anomaly detection)相关论文阅读_第2张图片$

看到论文提到的这一点，联想到之前看李宏毅老师讲OOD的时候一个例子（不得不说李老师讲课真的好），他在做一个关于辛普森家族的分类任务时，输入一个其他动漫的角色，最大softmax输出达到了0.99，也就是模型对于这个样本的置信度很高，但其实这个数据应该是一个Out of distribution的，这就是上述提到问题的一个鲜明的例子。

2 2018年之前的工作training set都还需要包含一些ood data（很难获得），同时也提到如果想同时保证id data的效果和ood data的效果，那么需要一个大的网络框架。

方法基础：

1 论文“ A baseline for detecting misclassified and out-of-distribution examples in neural networks” 中提出不需要重新训练模型，一个well-trained neural networks tends to assign higher softmax score to id examples

2 使用temperature scaling 和 small controlled perturbations可以提升id 和 ood之间的 softmax score gap

3 只需要用pretrain模型 + 上面两个手段就可以提升效果

方法核心：

1 temperature scaling

具体参考：

Calibration of Modern Neural Networks

首先学习一下temperature scaling的作用，在这之前需要了解一下knowledge distillation and calibrated（校准）。论文提出temperature scaling可以区分ID和OOD的最大softmax分数。那么什么是模型校准呢？

通常模型的输出是一个对应最大softmax的索引，也就是输出预测类，但是如果我们希望模型可以输出预测的置信度(confidence)是多少，那么这个confidence就是calibrated的。譬如：进行一个分类任务，将模型预测判断为某一类A且confidence score为90%的所有样本统计在一起，总数为N；并对着N个样本进行真实类别统计，如果有90%的样本都为A类，则说明该模型是calibrated的。

$异常检测(Out-of-distribution detection\ anomaly detection)相关论文阅读_第3张图片$

如上图所示，横纵坐标分别是confidence和acc，蓝色图代表的模型输出，灰色线代表calibration。那么该模型就是较自信的（输出的confidence大于实际acc）譬如在confidence为0.8的这些输出中，期望的是有80%的应该分类正确，但实际只有60%分类正确，那么也就是“网络过于自信了”，输出的置信度具体式子如下：
$\hat{y} = \frac{exp(z_i/T)}{\sum exp(z_j/T)}$
如果没有参数T，那么置信度就是softmax对应最大值
$\hat{y} = \frac{exp(z_i)}{\sum exp(z_j)}$
T的作用可以这样理解：公式 $T->\infty$ 时， $\hat{y} = \frac{1}{K}$ 其中K是类别数，也就时confidence score为1/K，那就是说模型完全的不确定是否判断正确（模型说”我是瞎猜的“），当 $T - > 0$ 时， $\hat{y}=1$ ，也就是置信度为1(模型说”我预测的就是对的")，具体推导：
$异常检测(Out-of-distribution detection\ anomaly detection)相关论文阅读_第4张图片$

那么根据之前讲的直接用argmax softmax作为置信度分数有些过于自信了，我们就可以设置参数T，调整他的置信度。注意的是，调整需要用valid set进行调整，训练后利用NLL调整参数T的值。

论文中是直接给定T，经过实验和推导证明T越大，检测效果越好

2 input preprocess

论文里提到对输入增加一个小扰动，其motivation是利用对抗样本，强迫模型输出错误的结果以及对应真实类别的低softmax score。但是论文里是相反的，希望利用一种扰动，使得输出的softmax score可以更高，the perturbation can have stronger effect on the in distribution images than that on out-of-distribution images, making them more separable。

实验

模型结构： DenseNet(Dense-BC), Wide ResNet

数据：训练集 CIFAR-10/ CIFAR-100 测试集 CIFAR-10/ CIFAR-100(ID) + TinyImageNet/LSUN/Uniform/Gaussian(OOD)

Unsupervised Anomaly Detection via Deep Metric Learning with End-to-End Optimization（2020）

proposed

1 无监督的异常检测（就是只有单标签正常训练数据）（标签信息难以获取，也有可能出现训练集没有出现过的异常类别，因此无监督的异常检测方法是更为合理的存在）

2 当前针对large-scale, high-dimension的数据往往都是两阶段的：先用降维方法投影到低维空间，再使用异常检测模型进行建模，问题是在第一步的时候其实并没有考虑“异常检测”这个任务，所以投影的空间一般是suboptimal的。

3 hard normal mining。我们知道DML中一个很好的trick是 hard negative mining 用来选择真正有效的负样本。本文参考了硬正常样本挖掘(Smart mining for deep metric learning CVPR 2017)，只对离数据中心点最远的数据进行学习。

4 论文证明了传统的contrastive loss如果只有一个类别的样本时，损失函数存在一个恒等式：
$L_{contrastive} = \frac{1}{|M|^2}\sum_{i=1}^{|M|-1}\sum_{j=i+1}^{|M|} \left \| f(x_i)-f(x_j) \right \|_2^2 \\ = \frac{1}{|M|}\sum_{i=1}^{|M|}\left \| f(x_i)-\mu \right \|_2^2 = L_{center}$
其中$ \mu $是所有数据的均值。也就是说当所有数据为一个类别时，对比损失函数转化为所有数据与均值点之间的距离。

5 anomaly scoring function的计算。论文对异常样本的检测还是沿用传统的思路：提出一个anomaly score和threshold 如果score 大于 threshold 判断为异常样本，反之就为正常样本。论文先是说既然传统的损失函数计算的其实就是一个样本与所有其他样本的距离的均值的期望也就是最小化：
$E_{X_t\in M}[\frac{1}{M} \sum_{x_j\in M}\left\| f(x_t) - f(x_j)\right \|_2^2]$
那么自然就可以把待测样本与所有训练数据的距离均值作为anomaly score, 但是存在一个问题，这个计算复杂度是O(n)的，效率不高。根据第四点恒等式的存在，那么就可以通过构造待测样本与训练样本映射空间的均值的距离作为分数也就是
$S(x_t) = \left\| f(x_t) - \mu\right\|_2^2$
因为 $\mu$ 不变，所以计算起来只有O(1)的复杂度。

model

$异常检测(Out-of-distribution detection\ anomaly detection)相关论文阅读_第5张图片$

模型其实很简单，特征映射部分只用了简单的全连接层，论文的创新点全部集中后图的右半部分。体现如下：

1 前面提到的 $L_{contrastive}$ 和 $L_{center}$ 和设计的anomaly score $S_{center}$ 在图中有所体现。

2 图中的 $\tau$ ，在下面会介绍，就是规定的训练数据的范围。

highlight

1 data distillation

论文提到在训练过程中，并不是所有的训练数据都是完全正常的（Anomaly detection methods often assume nearly all the training data as normal and provide good performance when the assumption holds and their performance significantly deteriorates if this assumption in wrong ）。所以作者采用在每个epoch开始之前，先把训练数据筛选一遍，譬如当前epoch模型参数为 $f (.)$ ，那么就用这个模型对所有训练数据求anomaly score，根据score选择训练集
$\{x_i | \left\| f(x_i) - \mu\right\|_2 < \tau\} \\ F = \{\left\| f(x_i) - \mu\right\|\}x_i \in M \\ \tau = max(SmallestK(F,K=\rho*|M| ))\rho \in (0,1]$
P就是蒸馏出来的训练集子集，这一个epoch只用这些数据训练，\tau怎么确定呢，取前 $M*\rho$ 个最小的F值对应的训练数据，这些最小的F值中最大的是 $\tau$ 。也就是在这个epoch训练中，限制了一个region，只有这个region内的数据参与训练。

**论文进一步提到这一个trick里面的超参数其实是 $\rho$ ,而不是直接规定这个范围的大小。这样做的好处是增加可解释性以及不需要为每一个数据集特定选择 $\tau$ 。**这一点倒是一个很好的点，因为在本人实际利用DML的时候，往往要尝试很多margin超参数。

2 minibatch

在利用 distillation之后，论文提到用mini-batch进行训练。这个没什么太多可解释的，论文里主要是介绍一下一个batch的loss怎么计算。

2 hard normal mining

硬挖掘是通过选择训练数据中那些对模型来说具有挑战性的数据进行学习，而不是去拟合所有的数据，因为很多数据模型学起来很简单，就会出现过拟合的现象。具体的挖掘过程如下：

(1) 所有训练数据经过蒸馏，获得一个子训练集

(2) 对子训练集进行mini batch构建

(3) 在每一个batch里面选择 $\rho$ 个最难例样本，难例样本的判断还是根据之前计算的距离，距离越大，就越难。

2020 ICLR CLASSIFICATION-BASED ANOMALY DETECTION FOR GENERAL DATA

Motivation

1 论文提出当前无监督异常检测的方法可以分为三大方向：Reconstruction-based, Distribution-based 和 Classification-based，分别从重构误差、概率密度和one-class分类三个角度优化模型，并且提到三者的缺点分别是：

“Reconstruction-based 常用深度模型是GAN网络，而GAN网络容易模式崩溃，并且在2018 DAGMM中也提到，Reconstruction-based model往往存在一些重构误差很低的异常点”

“Distribution-based 模型提到概率模型往往基于一个较强的概率假设，当然公认比较好的DAGMM，在我个人实验的过程中，发现GMM的数量，以及模型的结构设计都是有一定难度的”

“Classification-based 模型从OC-SVM, SVDD 发展到 Deep SVDD，最大的问题就是因为只有单类，怎么从训练样本中提取具有高辨别性的特征是比较困难的问题，现在基于图像的异常检测往往可以通过自监督以及辅助任务进行改进，但是怎么运用到general data上是一个待解决的问题。”

2 论文主要参考了2018年NIPS的一篇利用几何变换进行anomaly detection的工作(Geometric-transformation classification GEOM)。利用几何变换包括(rotation, reflection, translation)等将训练集中的图片 $x$ 映射到 $T (x, 1) . . . T (x, M)$ 其中M是变换的数量，利用变换后的数据可以构造一个分类模型，用来区分每个转换图像对应的转换类型，即标签m。最终模型预测条件概率：

假设原始数据数据分布所在区域为 $X$ , 即 $\in X$ , 经过几何变换后的区域为 $X_m$ ，即$T(x_m) \in X_m $。则异常数据$ X_a \in R - X $，在经过 m 变换后，图像应该不会落在$ X_m$中，即 $ P(m|T(x_a, m)) $是一个很小的值。

GEOM模型利用测试集上
$P (m ∣ T (x, m))$
作为异常分数。

Model

提出的GOAD方法结合了one-class的思想和transformation-based的思想。同样将 $X$ 经过m个几何变换投影到不同的区域（同一维度下），通过训练一个neural network，将这些变换过后的数据映射到新的样本空间。在OC的思想下将每个几何变换子空间 $X_M$ 映射到一个sphere中，中心是 $c_m$ . 则变化样本点属于某个变化的概率为
$\in X_m') = \frac{1}{z}e^{-(f(T(x,m) - c_m'))^2}$
则归一化后每一类的输出概率为
$\frac{e^{-||f(T(x,m)) - c_{m'}||^2}}{\sum e^{-||f(T(x,m)) - c_{m}||^2}}$
利用center triplet loss进行优化

公式表明希望一个样本的m变化 $f(T(x_i,m))$ 与这种变化对应的中心之间的距离要小于该变化样本与其他所有变化对应中心的最小距离，并且之间的距离差要大于一个margin，通过这种方式将每个变化的样本压缩到一个很小的sphere中。

源码中loss是 Tripletcenterloss 和 softmaxloss的加权和

经过这样一个损失的优化之后，模型的后验概率应该有一个较好的表现，但是文章提到，当数据远离分布的时候(仍然是normal data)，距离会很大，”A small difference in distance will make the classifier unreasonably certain of a particular transformation” 。这句话我的理解是：**当一个在原始分布就离分布中心较远的数据，在经过几何变换后，肯定也会离变换中心 $c_m$ 较远，则在这种情况，如果发生了一点小小的变化，分类器就会将模型分错了（本身样本点就在类别边界处，稍微有一个扰动，分类器就分类错了。 **因此就在分类模型上添加一个常数约束项
$\frac{e^{-||f(T(x,m)) - c_{m'}||^2}+\epsilon }{\sum e^{-||f(T(x,m)) - c_{m}||^2}+M*\epsilon}$
这个式子有什么用呢？可以简单设想一下：
$\frac{a}{b} > \frac{a + \epsilon}{b + M\epsilon}$
当 $a M > b$ 时，恒成立，结合原式，当判断真实类别概率时 $P (m ∣ T (x, m))$ ，因为对应概率最大（也就是 $a M > b$ 恒成立了），所以就是把正确分类的概率减小一点。那么为什么要小一点呢？ 因为这个值越小，对应的的异常分数就越高。也就是希望判别模型可以把不太确定的样本认为是异常的。（提升异常样本召回率）最终确定了一个异常分数：
$-log\prod P(m|T(x,m)) = -\sum logP(m|T(x,m))$
也就是每个变换对应正确类的概率密度对数和的负数，越大则约异常。

Deep One-Class Classfication(Deep-SVDD) 2018 ICML

参考链接：2018 ICML Deep One-Class Classfication(Deep-SVDD) 论文阅读&源码分析 (Anomaly Detection)

Explainable Deep One-Class Classfication 2021 ICLR

参考链接: 2021 ICLR Explainable Deep One-Class Classfication论文阅读总结

Memorizing Normality to Detect Anomaly: Memory-augmented Deep Autoencoder for Unsupervised 2019 ICCV

参考链接：2019 ICCV Memorizing Normality to Detect Anomaly: Memory-augmented Deep Autoencoder for Unsupervised论文阅读总结

Entropy Maximization and Meta Classification for Out-of-Distribution Detection in Semantic Segmentation 2021 ICCV

参考链接: Entropy Maximization and Meta Classification for Out-of-Distribution Detection in Semantic Segmentation

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
机器学习-------数据标准化罔闻_spider 数据分析算法机器学习人工智能
什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性 aehrutktrjk 人工智能 easyui 前端 python
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性引言在机器学习和自然语言处理领域，选择合适的训练示例对模型性能至关重要。最大边际相关性(MaximalMarginalRelevance,MMR)是一种优秀的示例选择方法，它不仅考虑了示例与输入的相关性，还注重保持所选示例之间的多样性。本文将深入探讨如何使用MMR来选择示例，以提高AI模型的性能和泛化能力。什么是最大边际相关性(MM
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方