chang_rj

Data Augmentation--数据增强解决你有限的数据集

参考来源–感兴趣请戳我戳我.
author是Bharath Raj。
以下是翻译内容，有部分删减，感兴趣的可以读原文，该blog仅供学习。笔耕不易，互相交流。

can my “state-of-the-art” neural network perform well with the meagre amount of data I have?

Yes.我们的优化目的，是当参数沿着正确的方向调整时，模型的loss可以达到最低。

How do I get more data, if I don’t have “more data”?

因此，为了获得更多数据，我们只需要对现有数据集进行微小改动。轻微更改，例如翻转或翻译或轮换。无论如何，我们的神经网络会认为这些是不同的图像。

卷积神经网络CNN，对放置在不同方向的对象，也能进行稳健的分类，即具有不变性的属性。更具体地，CNN对于平移，不同视角，尺度大小或光照等（或上述的组合）可以是不变的。
这基本上是数据增加的前提。在实际场景中，我们可能会在一组有限的条件下获取图像数据集。但是，我们的目标应用可能存在于各种条件下，例如不同的方向，位置，比例，亮度等。我们通过使用额外的合成对数据进行修改，并训练我们的神经网络来解释这些情况。

Can augmentation help even if I have lots of data?

是。它有助于增加数据集中的相关数据量。这与神经网络学习的方式有关。
Your neural network is only as good as the data you feed it.

Where do we augment data in our ML pipeline?

答案似乎很明显;我们在将数据提供给模型之前进行扩充吗？是的，但你有两个选择。一种选择是事先执行所有必要的转换，从根本上增加数据集的大小。另一种选择是在将小批量送到机器学习模型之前，在小批量上执行这些转换。
第一个选项称为离线扩充。对于相对较小的数据集，此方法是首选，因为您最终会将数据集的大小增加一个等于您执行的转换次数的因子（例如，通过翻转我的所有图像，我会增加数据集的大小系数为2）。
第二个选项称为在线增强，或即时增强。对于较大的数据集，此方法是首选，因为您无法承受大小的爆炸式增长。相反，您将对要提供给模型的迷你批次执行转换。一些机器学习框架支持在线增强，可以在GPU上加速。

Popular Augmentation Techniques

在本节中，我们将介绍一些常用但基本但功能强大的增强技术。在我们探索这些技术之前，为简单起见，让我们做一个假设。假设是，我们不需要考虑图像边界之外的东西。我们将使用以下技术，以便我们的假设是有效的。如果我们使用一种技术迫使我们猜出图像边界之外的东西，会发生什么？在这种情况下，我们需要插入一些信息。在我们介绍了增强类型之后，我们将详细讨论这个问题。对于这些技术中的每一种，我们还指定了数据集大小增加的因子（也称为数据增强因子）。

1、Flip

给你个图像自己体会！！！

# NumPy.'img' = A single image.
flip_1 = np.fliplr(img)
# TensorFlow. 'x' = A placeholder for an image.
shape = [height, width, channels]
x = tf.placeholder(dtype = tf.float32, shape = shape)
flip_2 = tf.image.flip_up_down(x)
flip_3 = tf.image.flip_left_right(x)
flip_4 = tf.image.random_flip_up_down(x)
flip_5 = tf.image.random_flip_left_right(x)

2、Rotation

关于此操作需要注意的一件事是旋转后图像尺寸可能无法保留。如果您的图像是正方形，则以直角旋转它将保留图像大小。如果它是一个矩形，旋转180度将保持大小。以更精细的角度旋转图像也会改变最终的图像尺寸。我们将在下一节中看到我们如何处理这个问题。以下是以直角旋转的方形图像的示例。

您可以使用您喜欢的包中的任何以下命令执行旋转。数据增强因子= 2到4倍

# Placeholders: 'x' = A single image, 'y' = A batch of images
# 'k' denotes the number of 90 degree anticlockwise rotations
shape = [height, width, channels]
x = tf.placeholder(dtype = tf.float32, shape = shape)
rot_90 = tf.image.rot90(img, k=1)
rot_180 = tf.image.rot90(img, k=2)
# To rotate in any angle. In the example below, 'angles' is in radians
shape = [batch, height, width, 3]
y = tf.placeholder(dtype = tf.float32, shape = shape)
rot_tf_180 = tf.contrib.image.rotate(y, angles=3.1415)
# Scikit-Image. 'angle' = Degrees. 'img' = Input Image
# For details about 'mode', checkout the interpolation section below.
rot = skimage.transform.rotate(img, angle=45, mode='reflect')

3、Scale

图像可以向外或向内缩放。向外缩放时，最终图像尺寸将大于原始图像尺寸。大多数图像框架从新图像中剪切出一个部分，其大小等于原始图像。我们将在下一节中处理向内缩放，因为它会缩小图像大小，迫使我们对超出边界的内容做出假设。以下是缩放的示例或图像。

您可以使用scikit-image使用以下命令执行缩放。数据增强因子=任意。

# Scikit Image. 'img' = Input Image, 'scale' = Scale factor
# For details about 'mode', checkout the interpolation section below.
scale_out = skimage.transform.rescale(img, scale=2.0, mode='constant')
scale_in = skimage.transform.rescale(img, scale=0.5, mode='constant')
# Don't forget to crop the images back to the original size (for 
# scale_out)

4、Crop

与缩放不同，我们只是从原始图像中随机抽样一个部分。
然后，我们将此部分的大小调整为原始图像大小。
这种方法通常称为随机裁剪。
以下是随机裁剪的示例。
仔细观察，您会发现此方法与缩放之间的区别。

您可以使用以下任何TensorFlow命令执行随机裁剪。数据增强因子=任意。

# TensorFlow. 'x' = A placeholder for an image.
original_size = [height, width, channels]
x = tf.placeholder(dtype = tf.float32, shape = original_size)
# Use the following commands to perform random crops
crop_size = [new_height, new_width, channels]
seed = np.random.randint(1234)
x = tf.random_crop(x, size = crop_size, seed = seed)
output = tf.images.resize_images(x, size = original_size)

5、Translation

翻译只涉及沿X或Y方向（或两者）移动图像。在下面的示例中，我们假设图像在其边界之外具有黑色背景，并且被适当地翻译。这种增强方法非常有用，因为大多数对象几乎可以位于图像的任何位置。这迫使你的卷积神经网络无处不在。

您可以使用以下命令在TensorFlow中执行转换。
数据增强因子=任意

# pad_left, pad_right, pad_top, pad_bottom denote the pixel 
# displacement. Set one of them to the desired value and rest to 0
shape = [batch, height, width, channels]
x = tf.placeholder(dtype = tf.float32, shape = shape)
# We use two functions to get our desired augmentation
x = tf.image.pad_to_bounding_box(x, pad_top, pad_left, height + pad_bottom + pad_top, width + pad_right + pad_left)
output = tf.image.crop_to_bounding_box(x, pad_bottom, pad_right, height, width)

6、Gaussion Noise

当您的神经网络试图学习可能无用的高频特征（大量出现的模式）时，通常会发生过度拟合。具有零均值的高斯噪声基本上在所有频率中具有数据点，从而有效地扭曲高频特征。这也意味着较低频率的组件（通常是您的预期数据）也会失真，但您的神经网络可以学会超越它。添加适量的噪音可以增强学习能力。一个色调较低的版本是盐和胡椒噪音，它表现为随机的黑白像素在图像中传播。这类似于通过向图像添加高斯噪声而产生的效果，但可能具有较低的信息失真水平。

您可以在TensorFlow上使用以下命令为图像添加高斯噪声。数据增强因子= 2x。

#TensorFlow. 'x' = A placeholder for an image.
shape = [height, width, channels]
x = tf.placeholder(dtype = tf.float32, shape = shape)
# Adding Gaussian noise
noise = tf.random_normal(shape=tf.shape(x), mean=0.0, stddev=1.0,
dtype=tf.float32)
output = tf.add(x, noise)

Advanced Augmentation Techniques高级增强技术

现实世界中，原始数据仍然可以存在于上述简单方法无法解释的各种条件下。例如，识别照片中景观（山水）。景观可以是任何东西：冰苔原，草原，森林等。听起来像一个非常直接的分类任务吧？除了一件事，你是对的。我们忽略了影响表演的照片中的一个重要特征 - 拍摄照片的季节。
如果我们的神经网络不了解某些景观可以在各种条件下（雪，潮湿，明亮等）存在的事实，它可能会将冰冻的湖岸错误地标记为冰川或将湿地标记为沼泽。
缓解这种情况的一种方法是添加更多图片，以便我们考虑所有季节性变化。但这是一项艰巨的任务。扩展我们的数据增强概念，想象一下人工生成不同季节的效果有多酷？

GAN来拯救你

在没有加入细节的情况下，条件GAN可以将图像从一个域转换为图像到另一个域。如果你认为这听起来太模糊，No；这就是这个神经网络的强大功能！以下是用于将夏季风景照片转换为冬季风景的条件GAN的示例。

Changing seasons using a CycleGAN (Source)
上述方法是稳健的，但计算密集。更便宜的替代品将被称为神经风格转移。它抓取一个图像（又称“风格”）的纹理/氛围/外观，并将其与另一个图像的内容混合。使用这种强大的技术，我们产生类似于条件GAN的效果（事实上，这种方法是在cGAN发明之前引入的！）。
这种方法的唯一缺点是，输出看起来更具艺术性而非现实性。但是，有一些进步，如下面显示的深度照片风格转移，有令人印象深刻的结果。

深度照片风格转移。请注意我们如何在数据集上生成我们想要的效果。（来源）
我们没有深入探索这些技术，因为我们并不关心它们的内在工作。我们可以使用现有的训练模型，以及转移学习的魔力，将其用于增强。

A brief note on interpolation关于插值的简要说明

如果您想要翻译不具有黑色背景的图像，该怎么办？如果你想向内扩展怎么办？或者以更精细的角度旋转？在我们执行这些转换后，我们需要保留原始图像大小。由于我们的图像没有关于其边界之外的任何信息，我们需要做出一些假设。通常，假设图像边界之外的空间在每个点都是常数0。因此，当您进行这些转换时，会得到一个未定义图像的黑色区域。

从左侧开始，图像逆时针旋转45度，图像向右旋转，图像向内缩放。
**但这是正确的假设吗？**在现实世界的情况下，大多数不是。图像处理和ML框架有一些标准方法，您可以使用它们来决定如何填充未知空间。它们的定义如下。

从左边开始，我们有constant, edge, reflect, symmetric and wrap模式。

1、Constant

最简单的插值方法是用一些常数值填充未知区域。这可能不适用于自然图像，但可以用于在单色背景下拍摄的图像。

2、Edge

在边界之后扩展图像的边缘值。此方法适用于温和的translations。

3、Relect

图像像素值沿图像边界反射。此方法适用于包含树木，山脉等的连续或自然背景。

4、Symmetric对称

该方法类似于反射，除了在反射边界处制作边缘像素的副本的事实。通常，反射和对称可以互换使用，但在处理非常小的图像或图案时会出现差异。

5、Wrap

图像只是重复超出其边界，就好像它正在平铺一样。这种方法并不像其他方法那样普遍使用，因为它对很多场景都没有意义。
除此之外，您可以设计自己的方法来处理未定义的空间，但通常这些方法对大多数分类问题都可以。

So, if I use ALL of these techniques, my ML algorithm would be robust right?

如果你以正确的方式使用它，那么是的！你问的正确方法是什么？好吧，有时并非所有的增强技术都对数据集有意义。再考虑我们的汽车示例。以下是一些修改图像的方法。

第一幅图像（左起）是原始图像，第二张图像是水平翻转，第三张图像旋转180度，最后一张图像旋转90度（顺时针）。
当然，它们是同一辆车的照片，但您的目标应用可能永远不会看到以这些方向呈现的汽车。
例如，如果您只是想在路上对随机汽车进行分类，那么只有第二张图像才能在数据集上进行分类。但是，如果你拥有一家处理车祸的保险公司，并且你想要确定倒车，破车的车型，那么第三张图片就有意义了。对于上述两种情况，最后一张图像可能没有意义。
关键是，在使用增强技术时，我们必须确保不增加不相关的数据。

Is it really worth the effort?

你可能期待一些结果来激励你走得更远。很公平;我也有这个问题。让我用玩具示例证明增强确实有效。您可以复制此实验以进行验证。
让我们创建两个神经网络，将数据分类为四类中的一类：猫，狮子，老虎或豹子。问题是，一个不会使用数据增加，而另一个则不会。您可以从此处下载数据集link。(ps：需要，打不开的可留邮箱给我)
如果你已经检查了数据集，你会发现每个类只有50个图像用于训练和测试。显然，我们不能对其中一个分类器使用扩充。为了使赔率更公平，我们使用 Transfer Learning为模型提供了更少的数据量。

对于没有增强的那个，让我们使用VGG19网络。我在这里写了一个TensorFlow实现，它基于here这个实现。一旦你克隆了我的仓库，就可以从这里(同上data)获取数据集，并从这里获取vgg19.npy（用于转移学习）。您现在可以运行模型来验证性能。
我同意，编写额外的数据扩充代码确实是一种努力。所以，为了建立我们的第二个模型，我转向Nanonets。他们在内部使用转移学习和数据扩充，以使用最少的数据提供最佳结果。您需要做的就是在他们的网站上传数据，并等待它们在他们的服务器上训练（通常大约30分钟）。你知道什么，它对我们的比较实验来说是完美的。
完成培训后，您可以请求调用其API来计算测试准确度。查看我的仓库以获取示例代码段（不要忘记在代码段中插入您的模型ID）。

Results
VGG19 (No Augmentation)- 76% Test Accuracy (Highest)
Nanonets (With Augmentation) - 94.5% Test Accuracy

令人印象深刻的不是它。事实上，大多数模型在更多数据的情况下表现良好。所以为了提供一个具体的证明，我已经提到了下表。它显示了Cifar 10（C10）和Cifar 100（C100）数据集上流行神经网络的错误率。C10 +和C100 +列是数据增加的错误率。

原作者电子邮件（[email protected]）。

汽车智能驾驶算法汇总芊言芊语汽车算法
汽车智能驾驶算法是自动驾驶技术的核心，它们集成了多个学科的知识，包括计算机视觉、机器学习、控制理论、路径规划等。以下是对汽车智能驾驶算法的一个详细汇总，内容分为几个关键部分进行阐述。一、计算机视觉算法计算机视觉是智能驾驶算法中用于识别和理解环境的关键技术。它主要包括图像处理、特征提取和对象识别等步骤。图像处理：通过摄像头等设备获取车辆前方的图像，然后进行预处理，如灰度化、二值化、滤波等操作，以提高
算法题汇总 lin-lins 面试与算法算法前端 javascript
算法汇总环形链表https://leetcode.cn/problems/linked-list-cycle/反转链表https://leetcode.cn/problems/reverse-linked-list/28环形链表IIhttps://leetcode.cn/problems/linked-list-cycle-ii/快乐数https://leetcode.cn/problems/ha
Open3D mesh 拉普拉斯laplacian滤波白葵新 3d 算法 python 计算机视觉人工智能
目录一、概述1.1原理1.2实现步骤1.3应用场景二、代码实现2.1关键函数参数详解返回值2.2完整代码三、实现效果3.1加入噪点的mesh3.2迭代10次3.3迭代100次Open3D点云算法汇总及实战案例汇总的目录地址：Open3D点云算法与点云深度学习案例汇总（长期更新）-CSDN博客一、概述拉普拉斯滤波（LaplacianSmoothing）是一种常用的网格平滑技术，通过对网格顶点的位置进
C++常见的十种常见排序算法汇总 LQS2020 c++算法开发语言
C++实现的十大常见排序算法，包括冒泡排序、选择排序、插入排序、希尔排序、归并排序、快速排序、堆排序、计数排序、基数排序和桶排序。每种排序算法都有其特点和适用场景。实现代码免费下载链接1.冒泡排序(BubbleSort)#include#includevoidbubbleSort(std::vector&arr){intn=arr.size();for(inti=0;iarr[j+1]){std:
Open3D mesh 裁剪白葵新 3d 算法 python 计算机视觉
目录一、概述1.1常用裁剪方法1.2应用场景二、代码实现2.1轴对齐包围盒(AABB)裁剪2.2有向包围盒(OBB)裁剪2.3平面裁剪Open3D点云算法汇总及实战案例汇总的目录地址：Open3D点云算法与点云深度学习案例汇总（长期更新）-CSDN博客一、概述在三维图形处理中，裁剪是指从一个更大的网格中提取出感兴趣的部分。Open3D提供了多种方法来对三角网格进行裁剪，例如使用轴对齐包围盒（AAB
排序算法汇总旭氏美术馆 js 排序算法 javascript 算法
选择排序简单选择排序复杂的插入排序时间.O（n2）空间O（1）functionsort(arr){for(i=0;iarr[j]){lettp=arr[i]arr[i]=arr[j]arr[j]=tp}}}}letarr=[2,1,3,8,4,6]sort(arr)console.log(arr)堆排序复杂的插入排序时间.O（nlog2n）空间O（1）functionheapAdjust(arr,
机器学习各种算法汇总模板怎么菜成这样机器学习机器学习 python 算法随机森林支持向量机
机器学习算法模板包含了KNN，线性回归，逻辑回归，朴素贝叶斯，决策树，支持向量机，随机森林，kmeans，集成算法各种算法，特征工程，评估方式任你选择！！！#导包fromsklearn.neighborsimportKNeighborsClassifierfromsklearn.linear_modelimportLinearRegressionfromsklearn.naive_bayesimp
基于BP神经网络粒子群优化BP神经网络 CNN卷积神经网络 LSTM 长短期记忆神经网络 chBbzEkkf 开发语言
基于BP神经网络粒子群优化BP神经网络CNN卷积神经网络LSTM长短期记忆神经网络ELMAN递归神经网络BiLSTM双向长短期记忆遗传算法神经网络七种神经网络回归预测算法汇总（基于Matlab实现）特殊要求：Matlab版本较高MATLAB代码，多输入单输出，换数据直接用，附样本供实验。代码运行无误，直接更换Excel数据即可实现。神经网络回归预测算法在工业、经济、自然科学等领域都有广泛的应用。其
仿真机器人-深度学习CV和激光雷达感知(项目2)day8【作业2与答案2】辰chen 考研 #复试项目机器人 ROS 深度学习 CV 考研项目 launch
文章目录前言作业2答案2代码详解前言你好，我是辰chen，本文旨在准备考研复试或就业本文内容是我为复试准备的第二个项目欢迎大家的关注，我的博客主要关注于考研408以及AIoT的内容预置知识：基本Python语法，基本linux命令行使用以下的几个专栏是本人比较满意的专栏(大部分专栏仍在持续更新)，欢迎大家的关注：ACM-ICPC算法汇总【基础篇】ACM-ICPC算法汇总【提高篇】AIoT(人工智能
常用直线检测算法勤奋的学渣算法代码块算法 python
概述在计算机视觉领域，我们经常需要做一些特殊的任务，而这些任务中经常会用到直线检测算法，比如车道线检测、长度测量等。–资料直线检测算法汇总_技术挖掘者的博客-CSDN博客_直线检测算法直线检测算法博文中缺失的几个源码(Hough_line、LSD、FLD、EDlines、LSWMS、CannyLines、MCMLSD、LSM)_昊虹AI笔记的博客-CSDN博客_lsm直线检测算法Hough_lin
仿真机器人-深度学习CV和激光雷达感知(项目2)day5【作业1与答案1】辰chen 考研 #复试项目机器人考研深度学习 ROS CV 项目智能驾驶
文章目录前言作业1答案1前言你好，我是辰chen，本文旨在准备考研复试或就业本文内容是我为复试准备的第二个项目欢迎大家的关注，我的博客主要关注于考研408以及AIoT的内容预置知识：基本Python语法，基本linux命令行使用以下的几个专栏是本人比较满意的专栏(大部分专栏仍在持续更新)，欢迎大家的关注：ACM-ICPC算法汇总【基础篇】ACM-ICPC算法汇总【提高篇】AIoT(人工智能+物联网
机器学习算法汇总：人工神经网络、深度学习及其它 AI小白龙* 机器学习算法深度学习人工智能 pytorch jupyter python
根据数据类型的不同，对一个问题的建模有不同的方式。在机器学习或者人工智能领域，人们首先会考虑算法的学习方式。在机器学习领域，有几种主要的学习方式。将算法按照学习方式分类是一个不错的想法，这样可以让人们在建模和算法选择的时候考虑能根据输入数据来选择最合适的算法来获得最好的结果。监督式学习：在监督式学习下，输入数据被称为“训练数据”，每组训练数据有一个明确的标识或结果，如对防垃圾邮件系统中“垃圾邮件”
Python激光点云数据处理-new jadesl13 python 开发语言
点云侠-python点云处理算法汇总(长期更新版)_点云侠1open3dC++版点云处理PCL常用python函数与工具(二)_python计算点云密度-CSDN博客Python点云处理_Auto工程师的博客-CSDN博客Python编写点云处理可视化软件_Auto工程师open3d点云处理_NNNNNathan的博客三维数据处理_JoannaJuanCV的博客-CSDN博客Python点云处理基
常用排序算法汇总韩顺平的小迷弟左神一周刷爆LeetCode 排序算法算法数据结构
1.排序算法的稳定性及其汇总同样值的个体之间，如果不因为排序而改变相对次序，就是这个排序是有稳定性的；否则就没有。不具备稳定性的排序：选择排序、快速排序、堆排序具备稳定性的排序：冒泡排序、插入排序、归并排序、一切桶排序思想下的排序时间复杂度:排序算法时间复杂度选择排序O(n^2)冒泡排序O(n^2)插入排序O(n^2)快速排序O(n*logn)归并排序O(n*logn)堆排序O(n*logn)选择
仿真机器人-深度学习CV和激光雷达感知(项目2)day01 辰chen 考研 #复试项目机器人深度学习人工智能 CV 激光雷达感知 python
文章目录前言项目介绍功能与技术简介硬件要求环境配置虚拟机运行项目demo前言你好，我是辰chen，本文旨在准备考研复试或就业本文内容是我为复试准备的第二个项目欢迎大家的关注，我的博客主要关注于考研408以及AIoT的内容预置知识：基本Python语法，基本linux命令行使用以下的几个专栏是本人比较满意的专栏(大部分专栏仍在持续更新)，欢迎大家的关注：ACM-ICPC算法汇总【基础篇】ACM-IC
408重要数据结构+算法汇总——C语言手搓版（全）一碗姜汤 cs算法数据结构算法数据结构 c语言
该套代码，大学期间跟着网课一遍一遍打下来的，408大概就这些了，别的杂七杂八其实还有很多，遗憾的是，一直没有整理和归纳。导致一遍遍地学一遍遍地忘记。大四就快毕业了，研也考了。这里做个整理，算是给408一个小小的胶带吧。后续如果有缺漏还会弥补。目录：线性表链表栈队列链栈链队二叉树线索二叉树堆堆排序并查集（quickfind、quickunion、w-qickunion、路径压缩）AVL树红黑树B树拓
强化学习的数学原理学习笔记 - 时序差分学习（Temporal Difference） Green Lv 机器学习笔记强化学习人工智能机器学习深度学习时序差分
文章目录概览：RL方法分类时序差分学习（TemporalDifference，TD）TDforstatevaluesBasicTDTDvs.MCSarsa(TDforactionvalues)BasicSarsa变体1：ExpectedSarsa变体2：n-stepSarsaQ-learing(TDforoptimalactionvalues)TD算法汇总*随机近似（SA）&随机梯度下降（SGD）
复试 || 就业day08(2024.01.03)算法篇辰chen 考研 #机试力扣(LeetCode)算法考研机试哈希 cpp 模拟力扣
文章目录前言亲密字符串两句话中的不常见单词公平的糖果交换卡牌分组独特的电子邮件地址前言你好，我是辰chen，本文旨在准备考研复试或就业文章题目大多来自于leetcode，当然也可能来自洛谷或其他刷题平台欢迎大家的关注，我的博客主要关注于考研408以及AIoT的内容仅给出C++版代码以下的几个专栏是本人比较满意的专栏(大部分专栏仍在持续更新)，欢迎大家的关注：ACM-ICPC算法汇总【基础篇】ACM
复试 || 就业day03(2023.12.29)算法篇辰chen 考研 #机试力扣(LeetCode)算法考研哈希表力扣机试
文章目录前言同构字符串存在重复元素有效的字母异位词丢失的数字单词规律前言你好，我是辰chen，本文旨在准备考研复试或就业文章题目大多来自于leetcode，当然也可能来自洛谷或其他刷题平台欢迎大家的关注，我的博客主要关注于考研408以及AIoT的内容仅给出C++版代码以下的几个专栏是本人比较满意的专栏(大部分专栏仍在持续更新)，欢迎大家的关注：ACM-ICPC算法汇总【基础篇】ACM-ICPC算法
复试 || 就业day05(2023.12.31)算法篇辰chen 考研 #机试力扣(LeetCode)算法考研机试力扣哈希 c++
文章目录前言找不同最长回文串找到所有数组中消失的数字下一个更大元素I键盘行前言你好，我是辰chen，本文旨在准备考研复试或就业文章题目大多来自于leetcode，当然也可能来自洛谷或其他刷题平台欢迎大家的关注，我的博客主要关注于考研408以及AIoT的内容仅给出C++版代码以下的几个专栏是本人比较满意的专栏(大部分专栏仍在持续更新)，欢迎大家的关注：ACM-ICPC算法汇总【基础篇】ACM-ICP
复试 || 就业day04(2023.12.30)算法篇辰chen 考研 #机试力扣(LeetCode)考研数据结构机试算法哈希 C++力扣
文章目录前言两个数组的交集两个数组的交集II赎金信字符串中的第一个唯一字符前言你好，我是辰chen，本文旨在准备考研复试或就业文章题目大多来自于leetcode，当然也可能来自洛谷或其他刷题平台欢迎大家的关注，我的博客主要关注于考研408以及AIoT的内容仅给出C++版代码以下的几个专栏是本人比较满意的专栏(大部分专栏仍在持续更新)，欢迎大家的关注：ACM-ICPC算法汇总【基础篇】ACM-ICP
复试 || 就业day02(2023.12.28)算法篇辰chen 考研 #机试力扣(LeetCode)算法考研数据结构力扣哈希
文章目录前言罗马数字转整数环形链表相交链表多数元素快乐数前言你好，我是辰chen，本文旨在准备考研复试或就业文章题目大多来自于leetcode，当然也可能来自洛谷或其他刷题平台欢迎大家的关注，我的博客主要关注于考研408以及AIoT的内容仅给出C++版代码以下的几个专栏是本人比较满意的专栏(大部分专栏仍在持续更新)，欢迎大家的关注：ACM-ICPC算法汇总【基础篇】ACM-ICPC算法汇总【提高篇
【算法】【动规】双数组系列问题 TTang-sq 算法动态规划
文章目录跳转汇总链接4.1最长公共子序列4.2不相交的线4.3不同的子序列(hard)跳转汇总链接动态规划算法汇总链接4.1最长公共子序列题目链接给定两个字符串text1和text2，返回这两个字符串的最长公共子序列的长度。如果不存在公共子序列，返回0。一个字符串的子序列是指这样一个新的字符串：它是由原字符串在不改变字符的相对顺序的情况下删除某些字符（也可以不删除任何字符）后组成的新字符串。例如，
【算法】【动规】最长斐波那契子序列的长度 TTang-sq 算法算法动态规划
跳转汇总链接动态规划算法汇总链接2.6最长的斐波那契子序列的长度题目链接如果序列X_1,X_2,…,X_n满足下列条件，就说它是斐波那契式的：n>=3对于所有i+2，作为绑定，存在哈希表中。初始化dp[][]里都初始化为2。填表顺序下标从小到大依次填写。返回值dp表里的最大值，如果是2的话返回0。classSolution{public:intlenLongestFibSubseq(vector&
【算法】【动规】最长等差数列 TTang-sq 算法算法哈希算法动态规划
跳转汇总链接动态规划算法汇总链接2.7最长等差数列题目链接给你一个整数数组nums，返回nums中最长等差子序列的长度。回想一下，nums的子序列是一个列表nums[i1],nums[i2],…,nums[ik]，且0，如果出现这个元素出现的次数接近n，kij统统遍历后，复杂度就是n3了。所以肯定不能这样写。状态表示考虑到两个连续数字才能推导出这一组等差数，又需要我们以“一个位置为子序列的结尾”这
【算法】【动规】最长定差子序列，大数组优化！！ TTang-sq 算法算法动态规划
跳转汇总链接动态规划算法汇总链接优化在后面！2.5最长定差子序列题目链接给你一个整数数组arr和一个整数difference，请你找出并返回arr中最长等差子序列的长度，该子序列中相邻元素之间的差等于difference。子序列是指在不改变其余元素顺序的情况下，通过删除一些元素或不删除任何元素而从arr派生出来的序列。状态表示dp[i]表示，以i位置元素为结尾的所有子序列中，最长子序列的长度状态转
【算法】【动规】回文串系列问题 TTang-sq 算法算法动态规划
文章目录跳转汇总链接子串部分3.1回文子串3.2最长回文子串3.3分割回文串IV3.4分割回文串II(hard)子序列部分3.5最长回文子序列3.6让字符串成为回文串的最少插入次数跳转汇总链接动态规划算法汇总链接子串部分3.1回文子串题目链接给定一个字符串s，请计算这个字符串中有多少个回文子字符串。具有不同开始位置或结束位置的子串，即使是由相同的字符组成，也会被视作不同的子串。状态表示dp[i][
复试 || 就业day01(2023.12.27)算法篇辰chen 考研 #机试力扣(LeetCode)算法考研数据结构机试力扣
文章目录前言两数之和存在重复元素II好数对的数目总持续时间可被60整除的歌曲前言你好，我是辰chen，本文旨在准备考研复试或就业文章题目大多来自于leetcode，当然也可能来自洛谷或其他刷题平台欢迎大家的关注，我的博客主要关注于考研408以及AIoT的内容仅给出C++版代码以下的几个专栏是本人比较满意的专栏(大部分专栏仍在持续更新)，欢迎大家的关注：ACM-ICPC算法汇总【基础篇】ACM-IC
机器学习中的降维算法汇总归纳阿尔法旺旺
最近看了降维的各类算法，想简单做个回顾和小结，先上图一、浅谈协方差矩阵1.1、统计学的基本概念均值：x¯=∑ni=1xinx¯=∑i=1nxin方差：var(x)=∑ni=1(xi−x¯)2n−1var(x)=∑i=1n(xi−x¯)2n−1标准差：var(x)−−−−−√var(x)均值描述的是样本集合的中间点，它告诉我们的信息是有限的，而标准差给我们描述的是样本集合的各个样本点到均值的距离之平
sklearn中常用的分类算法汇总及svm分类模型 ZhangX銮 sklearn
转载!转载!转载！非原创，此博客仅用于学习。sklearn中常用的分类算法（模块名–函数名–算法名)：（1)linear_modelLogisticRegression逻辑回归>>>fromsklearn.linear_modelimportLogisticRegression>>>clf_l1_LR=LogisticRegression(C=C,penalty='l1',tol=0.01)>>>
[星球大战]阿纳金的背叛 comsci
本来杰迪圣殿的长老是不同意让阿纳金接受训练的......... 但是由于政治原因,长老会妥协了...这给邪恶的力量带来了机会所以......现代的地球联邦接受了这个教训...绝对不让某些年轻人进入学院
看懂它，你就可以任性的玩耍了！ aijuans JavaScript
javascript作为前端开发的标配技能，如果不掌握好它的三大特点：1.原型 2.作用域 3. 闭包 ,又怎么可以说你学好了这门语言呢？如果标配的技能都没有撑握好，怎么可以任性的玩耍呢？怎么验证自己学好了以上三个基本点呢，我找到一段不错的代码，稍加改动，如果能够读懂它，那么你就可以任性了。 function jClass(b
Java常用工具包 Jodd Kai_Ge java jodd
Jodd 是一个开源的 Java 工具集，包含一些实用的工具类和小型框架。简单，却很强大！写道 Jodd = Tools + IoC + MVC + DB + AOP + TX + JSON + HTML < 1.5 Mb Jodd 被分成众多模块，按需选择，其中工具类模块有： jodd-core &nb
SpringMvc下载 120153216 springMVC
@RequestMapping(value = WebUrlConstant.DOWNLOAD) public void download(HttpServletRequest request,HttpServletResponse response,String fileName) { OutputStream os = null; InputStream is = null;
Python 标准异常总结 2002wmj python
Python标准异常总结 AssertionError 断言语句（assert）失败 AttributeError 尝试访问未知的对象属性 EOFError 用户输入文件末尾标志EOF（Ctrl+d） FloatingPointError 浮点计算错误 GeneratorExit generator.close()方法被调用的时候 ImportError 导入模块失
SQL函数返回临时表结构的数据用于查询 357029540 SQL Server
这两天在做一个查询的SQL，这个SQL的一个条件是通过游标实现另外两张表查询出一个多条数据，这些数据都是INT类型，然后用IN条件进行查询，并且查询这两张表需要通过外部传入参数才能查询出所需数据，于是想到了用SQL函数返回值，并且也这样做了，由于是返回多条数据，所以把查询出来的INT类型值都拼接为了字符串，这时就遇到问题了，在查询SQL中因为条件是INT值，SQL函数的CAST和CONVERST都
java 时间格式化 | 比较大小| 时区个人笔记 7454103 java eclipse tomcat c MyEclipse
个人总结！不当之处多多包含！引用 1.0 如何设置 tomcat 的时区：位置：(catalina.bat---JAVA_OPTS 下面加上) set JAVA_OPT
时间获取Clander的用法 adminjun Clander 时间
/** * 得到几天前的时间 * @param d * @param day * @return */ public static Date getDateBefore(Date d,int day){ Calend
JVM初探与设置 aijuans java
JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以在多种平台
SQL中ON和WHERE的区别 avords
SQL中ON和WHERE的区别数据库在通过连接两张或多张表来返回记录时，都会生成一张中间的临时表，然后再将这张临时表返回给用户。 www.2cto.com 在使用left jion时，on和where条件的区别如下： 1、 on条件是在生成临时表时使用的条件，它不管on中的条件是否为真，都会返回左边表中的记录。
说说自信 houxinyou 工作生活
自信的来源分为两种,一种是源于实力,一种源于头脑.实力是一个综合的评定,有自身的能力,能利用的资源等.比如我想去月亮上,要身体素质过硬,还要有飞船等等一系列的东西.这些都属于实力的一部分.而头脑不同,只要你头脑够简单就可以了!同样要上月亮上,你想,我一跳,1米,我多跳几下,跳个几年,应该就到了!什么?你说我会往下掉?你笨呀你!找个东西踩一下不就行了吗? 无论工作还
WEBLOGIC事务超时设置 bijian1013 weblogic jta 事务超时
系统中统计数据，由于调用统计过程，执行时间超过了weblogic设置的时间，提示如下错误：统计数据出错! 原因：The transaction is no longer active - status: 'Rolling Back. [Reason=weblogic.transaction.internal
两年已过去，再看该如何快速融入新团队 bingyingao java 互联网融入架构新团队
偶得的空闲，翻到了两年前的帖子该如何快速融入一个新团队，有所感触，就记下来，为下一个两年后的今天做参考。时隔两年半之后的今天，再来看当初的这个博客，别有一番滋味。而我已经于今年三月份离开了当初所在的团队，加入另外的一个项目组，2011年的这篇博客之后的时光，我很好的融入了那个团队，而直到现在和同事们关系都特别好。大家在短短一年半的时间离一起经历了一
【Spark七十七】Spark分析Nginx和Apache的access.log bit1129 apache
Spark分析Nginx和Apache的access.log，第一个问题是要对Nginx和Apache的access.log文件进行按行解析，按行解析就的方法是正则表达式： Nginx的access.log解析正则表达式 val PATTERN = """([^ ]*) ([^ ]*) ([^ ]*) (\\[.*\\]) (\&q
Erlang patch bookjovi erlang
Totally five patchs committed to erlang otp, just small patchs. IMO, erlang really is a interesting programming language, I really like its concurrency feature. but the functional programming style
log4j日志路径中加入日期 bro_feng java log4j
要用log4j使用记录日志，日志路径有每日的日期，文件大小5M新增文件。实现方式 log4j: <appender name="serviceLog" class="org.apache.log4j.RollingFileAppender"> <param name="Encoding" v
读《研磨设计模式》-代码笔记-桥接模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 个人觉得关于桥接模式的例子，蜡笔和毛笔这个例子是最贴切的：http://www.cnblogs.com/zhenyulu/articles/67016.html * 笔和颜色是可分离的，蜡笔把两者耦合在一起了：一支蜡笔只有一种
windows7下SVN和Eclipse插件安装 chenyu19891124 eclipse插件
今天花了一天时间弄SVN和Eclipse插件的安装，今天弄好了。svn插件和Eclipse整合有两种方式，一种是直接下载插件包，二种是通过Eclipse在线更新。由于之前Eclipse版本和svn插件版本有差别，始终是没装上。最后在网上找到了适合的版本。所用的环境系统：windows7JDK：1.7svn插件包版本：1.8.16Eclipse：3.7.2工具下载地址：Eclipse下在地址：htt
[转帖]工作流引擎设计思路 comsci 设计模式工作应用服务器 workflow 企业应用
作为国内的同行，我非常希望在流程设计方面和大家交流，刚发现篇好文(那么好的文章，现在才发现，可惜)，关于流程设计的一些原理，个人觉得本文站得高，看得远，比俺的文章有深度，转载如下 ================================================================================= 自开博以来不断有朋友来探讨工作流引擎该如何
Linux 查看内存，CPU及硬盘大小的方法 daizj linux cpu 内存硬盘大小
一、查看CPU信息的命令 [root@R4 ~]# cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id" model name : Intel(R) Xeon(R) CPU X5450 @ 3.00GHz model name :
linux 踢出在线用户 dongwei_6688 linux
两个步骤： 1.用w命令找到要踢出的用户，比如下面： [root@localhost ~]# w 18:16:55 up 39 days, 8:27, 3 users, load average: 0.03, 0.03, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
放手吧,就像不曾拥有过一样 dcj3sjt126com
内容提要：静悠悠编著的《放手吧就像不曾拥有过一样》集结“全球华语世界最舒缓心灵”的精华故事，触碰生命最深层次的感动，献给全世界亿万读者。《放手吧就像不曾拥有过一样》的作者衷心地祝愿每一位读者都给自己一个重新出发的理由，将那些令你痛苦的、扛起的、背负的，一并都放下吧！把憔悴的面容换做一种清淡的微笑，把沉重的步伐调节成春天五线谱上的音符，让自己踏着轻快的节奏，在人生的海面上悠然漂荡，享受宁静与
php二进制安全的含义 dcj3sjt126com PHP
PHP里，有string的概念。 string里，每个字符的大小为byte（与PHP相比，Java的每个字符为Character，是UTF8字符，C语言的每个字符可以在编译时选择）。 byte里，有ASCII代码的字符，例如ABC，123，abc，也有一些特殊字符，例如回车，退格之类的。特殊字符很多是不能显示的。或者说，他们的显示方式没有标准，例如编码65到哪儿都是字母A，编码97到哪儿都是字符
Linux下禁用T440s，X240的一体化触摸板(touchpad) gashero linux ThinkPad 触摸板
自打1月买了Thinkpad T440s就一直很火大，其中最让人恼火的莫过于触摸板。 Thinkpad的经典就包括用了小红点(TrackPoint)。但是小红点只能定位，还是需要鼠标的左右键的。但是自打T440s等开始启用了一体化触摸板，不再有实体的按键了。问题是要是好用也行。实际使用中，触摸板一堆问题，比如定位有抖动，以及按键时会有飘逸。这就导致了单击经常就
graph_dfs hcx2013 Graph
package edu.xidian.graph; class MyStack { private final int SIZE = 20; private int[] st; private int top; public MyStack() { st = new int[SIZE]; top = -1; } public void push(i
Spring4.1新特性——Spring核心部分及其他 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
配置HiveServer2的安全策略之自定义用户名密码验证 liyonghui160com
具体从网上看 http://doc.mapr.com/display/MapR/Using+HiveServer2#UsingHiveServer2-ConfiguringCustomAuthentication LDAP Authentication using OpenLDAP Setting
一位30多的程序员生涯经验总结 pda158 编程工作生活咨询
1.客户在接触到产品之后，才会真正明白自己的需求。　　这是我在我的第一份工作上面学来的。只有当我们给客户展示产品的时候，他们才会意识到哪些是必须的。给出一个功能性原型设计远远比一张长长的文字表格要好。 2.只要有充足的时间，所有安全防御系统都将失败。　　安全防御现如今是全世界都在关注的大课题、大挑战。我们必须时时刻刻积极完善它，因为黑客只要有一次成功，就可以彻底打败你。 3.
分布式web服务架构的演变自由的奴隶 linux Web 应用服务器互联网
最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易
初探Druid连接池之二——慢SQL日志记录 xingsan_zhang 日志连接池 druid 慢SQL
由于工作原因，这里先不说连接数据库部分的配置，后面会补上，直接进入慢SQL日志记录。 1.applicationContext.xml中增加如下配置： <bean abstract="true" id="mysql_database" class="com.alibaba.druid.pool.DruidDataSourc