啥都学不会

基于人脸的抗欺骗检测：Deep Tree Learning for Zero-shot Face Anti-Spoofing

首先介绍一下作者：Yaojie Liu，a fourth-year Ph.D. student at the Department of Computer Science and Engineering, Michigan State University. I’m a current member of Computer Vision Lab (CVLAB), advised by Dr. Xiaoming Liu. he is a member of Computational Biology and Cognitive Science Lab (CBCSL).

His research is on CV/ML, with particular interests in face representation & analysis, including face anti-spoofing, 2D/3D large pose face alignment, 3D face reconstruction, audio-visual modeling.

他的主页链接：https://yaojieliu.github.io/

下面是Deep Tree Learning for Zero-shot Face Anti-Spoofing的论文翻译，全是机翻，大家可以适当调整。

摘要

Face anti-spoofing旨在防止面部识别系统将假面部识别为真正的用户。虽然开发了先进的面部反欺骗方法，但也正在创建新类型的欺骗攻击，并对所有现有系统构成威胁。我们将未知欺骗攻击的检测定义为零次学习的面部抗欺骗检测（ZSFA）。以前的ZSFA只能研究12种类型的恶搞攻击，例如打印/重放，这限制了这个问题的洞察力。在这项工作中，我们调查了13种类型的欺骗攻击中的ZSFA问题，包括打印，重放，3D掩码等。提出了一种新颖的深度树网络（DTN），用于以无人监督的方式将欺骗样本划分为语义子群。当数据样本到达时，知道或未知的攻击，DTN将其路由到最相似的欺骗群集，并做出二元决策。此外，为了能够研究ZSFA，我们引入了包含各种类型的欺骗攻击的第一面防反欺骗数据库。实验表明，我们提出的方法达到了ZSFA多种测试协议的最新技术水平。

1.简介

面部是最流行的生物识别模式之一，因为其使用方便，例如访问控制，电话解锁。尽管识别准确度高，但是人脸识别系统不能区分真实人脸和假人脸，例如照片，屏幕。因此，他们容易遭受面部欺骗攻击，这会欺骗系统识别为另一个人。为了安全地使用面部识别，需要面部反间谍技术来在执行识别之前检测欺骗攻击。
攻击者可以利用各种媒介来发动欺骗攻击。最常见的是在数字屏幕上重放视频/图像，即重放攻击和打印的照片，即打印攻击。基于传统方法的特征[7,35,38]或基于CNN的特征，提出了不同的方法来处理重放和打印攻击
tures [4,18,20,32]。最近，高质量3D定制面具也用于攻击，即3D面具攻击。在[29-31]中，发现用于检测打印/重放攻击的方法对于这种新的欺骗不太有效，因此作者利用远程光电容积描记法（r-PPG）来检测心率脉冲作为间接提示。此外，面部化妆也可能影响识别的结果，即化妆攻击[12]。许多作品[11-13]研究面部化妆，尽管不是一个反间谍问题。

所有上述方法都针对已知的欺骗攻击提供算法解决方案，其中模型在相同类型的欺骗攻击上被训练和测试。但是，在实际应用程序中，攻击者还可以发起我们（算法设计者）不知道的欺骗攻击，称为未知欺骗攻击1。研究人员越来越关注反间谍模型的概括，即他们能够检测到在培训期间从未见过的恶搞攻击的程度如何？我们定义了概率1 1）看不见的攻击，算法设计者已知的攻击类型，以便算法可以为他们量身定制，但他们的数据在训练期间是看不见的; 2）未知的攻击，攻击类型既不是设计者所知，也不是在训练中看到的。我们不区分这两种情况，并将两种未知攻击都称为。
检测未知面部恶搞攻击的范围为零次学习的面部抗欺骗检测（ZSFA）。尽管面对已知攻击的成功反面，但另一方面，ZSFA对社区来说是一个新的未解决的挑战。
对ZSFA的第一次尝试是[3,45]。它们在打印和重放攻击之间解决ZSFA问题，并将其视为实时人脸（例如真实人脸）的异常检测问题。通过手工制作的功能，现场面部通过标准生成模型建模，例如GMM，自动编码器。在测试期间，如果它位于估计的实时分布之外，则会检测到未知攻击。这些ZSFA工作有三个缺点：
缺乏恶搞类型：先前的型号是由w.r.t.仅打印和重放攻击。相应的功能设计可能不适用于不同的未知攻击。
没有恶搞知识：以前的模型只使用实时面部，而不利用可用的已知欺骗数据。虽然未知攻击是不同的，但已知的欺骗攻击仍然可以提供有价值的信息来学习模型。
特征选择的局限性：他们使用手工制作的特征（如LBP）来表现实况面部，这对于已知的欺骗检测效果较差[27,32,37,48]。最近的深度学习模型[20,32]显示了CNN模型在面部反间谍方面的优势
这项工作旨在解决所有三个缺点。由于一个ZSFA模型在未知欺骗攻击不同时可能会有不同的表现，因此应该对各种未知攻击类型进行评估。在这项工作中，我们将ZSFA的研究从2种类型的恶搞攻击扩展到13种类型。除了打印和重放攻击外，我们还包括5种类型的3D模板攻击，3种类型的化妆攻击和3种部分攻击。这些攻击包括模仿假冒，即尝试以其他人身份进行身份验证，以及模糊处理，即试图覆盖攻击者自己的身份。我们收集了包含这些不同恶搞攻击的第一面反欺骗数据库，在具有多种攻击类型的野外数据库中称为欺骗（SiW-M）。
为了解决更广泛的ZSFA，我们提出了深层树网络（DTN）。假设在每种欺骗类型中存在不同欺骗类型和不同特征之间的同构特征，树状模型非常适合处理这种情况：学习早期树节点中的同构特征和后面树节点中的不同特征。在没有任何恶意类型的辅助标签的情况下，DTN学会以无人监督的方式对数据进行分区。在每个树节点处，沿着最大数据变化的方向执行分区。最后，它将数据聚集到叶级别的几个子组中，并学会独立检测每个子组的欺骗攻击，如图1所示。在测试期间，数据样本被路由到最相似的叶节点以产生实时与欺骗的二元决策。
总之，我们在这项工作中的贡献包括：•对13种不同类型的恶搞攻击进行零射击反面防范的广泛研究; •提出深层树网络（DTN）以分层次学习功能并检测未知的欺骗攻击; •为ZSFA收集新数据库，并在多个测试协议上实现最先进的性能。

2.前期工作

面部反间谍基于图像的面部反间谍技术是指面部反间谍技术，它只将RGB图像作为输入而无需额外的信息，如深度或热量。在早年，研究人员利用活力线索（例如眨眼和头部运动）来检测打印攻击[24,36,37,39]。然而，当遇到未知的攻击时，例如具有眼部切割的photograh和视频重放，这些方法遭受完全失败。之后，研究转向更一般的纹理分析并解决打印和重放攻击。研究人员主要利用手工制作的特征，例如LBP [7,16,17,35]，HoG [25,47]，SIFT [38]和SURF [8]，用传统的分类器，例如SVM和LDA，制作二进制决策。这些方法在来自同一数据库的测试数据上表现良好。但是，在改变照明和背景等测试条件时，它们通常会有很大的性能下降，这可以被视为一个过度的问题。此外，它们在处理3D掩模攻击方面也显示出局限性，如[30]中所述。
To overcome the overﬁtting issue, researchers make various attempts. Boulkenafet
为了克服过度配置问题，研究人员进行了各种尝试。Boulkenafet等。提取HSV + YCbCR空间中的spoo fi ng功能[7]。[2,5,6,18,46]中的工作考虑了时域中的特征。最近的工作[2,4]通过使用图像补丁来增加数据，并将补丁中的分数融合到单个决策中。对于3D掩模攻击，估计心脏脉冲率以区分3D掩模与真实面部[28,30]。在深度学习时代，研究人员提出了一些优于传统方法的CNN作品[4,18,20,27,32,37,48]。

零次学习和未知欺骗攻击物体识别，或更一般地说，零次学习，旨在识别来自未知类[40]的物体，即在训练中看不到的物体类。总体思路是通过语义嵌入将已知和未知类相关联，其嵌入空间可以是属性[26]，单词向量[19]，文本描述[49]和人类凝视[22]。
面对反间谍数据库鉴于优质数据库的重要性，研究人员已经发布了几个面部反spoof数据库，如CASIAFASD [50]，Replay-Attack [15]，OULU-NPU [9]和SiW [32] ]用于打印/重放攻击，以及HKBU-MARs [30]用于3D面具攻击。诸如CASIAFASD和Replay-Attack [50]之类的早期数据库限制了主题种类，姿势/表达/光照变化和视频分辨率。最近的数据库[9,30,32]改进了这些方面，并且还建立了不同的评估协议。但是，到目前为止，所有数据库都专注于打印/重放攻击或3D掩码攻击。为了全面研究面部防反射，特别是具有挑战性的ZSFA，我们首次收集了具有各种类型的恶搞攻击的数据库，如Tab。 1.我们数据库的详细信息在Sec 4。

3. ZSFA的深树网络

DTN的主要目的有两个：发现已知欺骗的语义子组; 以分层方式学习功能。 DTN的体系结构如图2所示。每个树节点由卷积残差单元（CRU）和树路由单元（TRU）组成，而叶节点由CRU和监督特征学习（SFL）模块组成。CRU是一个具有卷积层和快捷连接的块。TRU定义节点路由功能以将数据样本路由到其中一个子节点。

路由功能沿着具有最大数据变化的方向划分所有访问数据。SFL模块连接分类监控和像素监控，以了解spoofing功能。

未知欺骗攻击的零次学习，即ZSFA，是一个具有独特属性的相对较新的主题。首先，与零次物体识别不同，ZSFA强调检测欺骗攻击，而不是识别特定的欺骗类型。其次，与具有丰富语义嵌入的通用对象不同，对于欺骗模式没有明确的定义语义嵌入[20]。如第二节所述。 1，之前的ZSFA工作[3,45]仅通过手工制作的功能和标准的生成模型对实时数据进行建模，但存在一些缺点。在这项工作中，我们提出了一个深层树网络，无意识地学习已知欺骗攻击的语义嵌入。数据的分区自然地将某些语义属性与子组相关联。在测试期间，未知攻击被投射到嵌入以找到欺骗检测的最接近属性。深层树网络树结构通常被发现有助于解决与语言相关的任务，例如解析和翻译[14]，这是由于单词和句子的内在关系。例如，树模型应用于联合视觉和语言问题，例如视觉问题推理[10]。树结构还具有分层学习特征的属性。面部对齐工作[23,41]利用回归树来估计从粗到细的面部标志。熊等人提出一个树CNN来处理大型姿势人脸识别[44]。在[21]中，Kaneko等人。提出具有决策树的GAN以学习分层可解释的表示。在我们的工作中，我们利用树形网络来学习ZSFA的潜在语义嵌入。

其中N，Nr,Nl，表示每组中的样本数。但是，在实践中，缩小Equ。 2可能无法带来满意的解决方案。首先，可以通过增加v或x的范数来最小化损失，这是一个简单的解决方案。其次，即使v，x的范数受到约束，Equ。 2受数据S密度的影响，并且可能对异常值敏感。换句话说，x）的零期望不一定导致数据S的平衡分区。当所有数据被分割到一侧时，可以实现局部最小值。在某些情况下，树可能会崩溃到几个（甚至一个）叶节点。
了更好地划分数据，我们提出了一种新的路由功能和无监督损失。无论τ如何，xT和v之间的点积可以被视为向v的方向投射x。我们设计v使得我们可以观察投影后的最大变化。受PCA概念的启发，最佳解决方案自然成为数据S的最大PCA基础。为实现这一目标，我们首先将v约束为规范1并重新制定Equ。 1作为：

3.1.2已知欺骗之树
使用路由功能，我们可以构建整个二叉树。图2示出了深度为4的二叉树，具有8个叶节点。如前所述。如图3所示，树被设计为从所有已知的恶搞中找到语义子组，并且被称为欺骗树。类似地，我们也可以仅使用实时面部训练实时树，以及具有实时数据和欺骗数据的一般数据树。与欺骗树相比，实时数据树和通用数据树有一些缺点。实时树不会为欺骗传达语义，并且在每个节点处学习的属性无法帮助路由和更好地检测欺骗;通用数据树可能导致不平衡的子组，其中一个类的样本数超过另一个类。
这种不平衡会导致下一阶段监督学习的偏见。

因此，当我们计算Equ时。 5学习路由功能，我们只考虑恶搞样本来构造XS。为了使每个叶子具有平衡的子组，我们将实时数据的响应抑制为零，以便可以将所有实时数据均匀地分区到子节点。同时，我们还抑制不访问此节点的欺骗数据的响应，以便每个节点模拟唯一欺骗子集的分布。

形式上，对于每个节点，我们最大化访问该节点的欺骗数据的路由功能响应（表示为S），同时最小化其他数据的响应（表示为），包括所有不访问的实时数据和欺骗数据该节点，即访问相邻节点。为实现这一目标，我们定义了以下损失：

3.2。监督特色学习
给定路由功能，数据样本将分配给其中一个叶节点。让我们首先将叶节点的特征输出定义为，为简单起见，缩写为。在每个叶节点，我们定义两个节点监督任务来学习判别特征：二进制分类驱动学习对现场与恶搞面孔的高层次理解，逐像素掩模回归将CNN的注意力吸引到低级别本地特色学习。
分类监控为了学习二进制分类器，如图2（d）所示，我们在上应用两个额外的卷积层和两个完全连接的层来生成特征向量。我们通过softmax交叉熵损失监督学习：

3.3。网络架构

深度树网络（DTN）DTN是所提出模型的主要框架。它以作为输入，其中6个通道是RGB + HSV颜色空间。我们将三个卷积层与40个通道和1个最大池层相连，并将它们组合为一个卷积残差单元（CRU）。由于网络中的动态批量大小，每个卷积层都配备了ReLU和组规范化层[43]。我们还为每个卷积层应用快捷连接。对于每个树节点，我们在TRU之前部署一个CRU。在叶节点处，DTN将输入I的特征表示产生为，然后使用一个卷积层来生成二进制掩码映射M.

树路由单元（TRU）TRU是将数据样本路由到其中一个子CRU的模块。如图3所示，它首先通过使用卷积层压缩特征，并在空间上调整响应大小。对于根节点，我们将CRU功能压缩为x ，对于以后的树节点，我们将CRU功能压缩为x 。将输入特征压缩为较小的尺寸有助于减少在Equ中计算和保存协方差矩阵的负担。 5。例如，第一个CRU的矢量化特征是x ，x的协方差矩阵可以在内存中占用 GB。但是，在压缩之后，矢量化特征是x ，并且x的协方差矩阵仅需要 GB的内存。

之后，我们对输出进行矢量化并应用路由函数 x）。计算Equ中的μ。 3，我们只是应用批量标准化层而不是缩放以保存每个小批量的移动平均值，而不是将其优化为网络的变量。最后，我们将压缩CRU响应投影到最大基础v并获得投影系数。然后我们将具有负系数的样本分配给左子CRU，并将具有正系数的样本分配给右子CRU。

实施细节随着Equ的整体亏损。 10，我们建议的网络以端到端的方式进行培训。所有损失均根据每个小批量计算。 DTN模块和TRU模块交替优化。在优化DTN的同时，我们保持TRU的参数固定，反之亦然。

4.具有多种攻击类型的野生数据库中的欺骗

为了针对未知攻击特定地针对面部反间谍方法，我们收集了具有多种攻击类型（SiW-M）的Wild数据库中的欺骗。与Tab中的先前数据库相比。 1，SiW-M在恶搞攻击，主体身份，环境和其他因素方面表现出很大的差异。

对于欺骗数据收集，我们考虑两个spoofing场景：模拟，需要使用欺骗被识别为其他人，以及混淆，这需要使用来删除攻击者自己的身份。总的来说，我们收集了968种视频，这些视频在图4中列出了13种类型的欺骗攻击。对于所有5种面具攻击，3种局部攻击，模糊化妆和化妆，我们录制1080P高清视频。对于模仿化妆，由于缺乏特殊的化妆师，我们从Youtube收集了720P视频。对于打印和重放攻击，我们打算从现有系统出现故障的较难案例中收集视频。因此，我们部署现成的面部反欺骗算法[32]并在算法预测实时时记录欺骗视频。
实验结果这里就不写了
直接写结论：本文解决了13种类型的恶搞攻击中的零射击反面问题。所提出的方法利用深树网络将未知攻击路由到最合适的叶节点以进行欺骗检测。以无人监督的方式训练树以找到具有最大变化的特征库以分割欺骗数据。我们收集的SiW-M包含比以前任何数据库更多的主题和欺骗类型。最后，我们通过实验证明了该方法的优越性能。
论文理解：接下来我们来详细说说零次学习（Zero-shot）
先举一个例子：
假设小明和他爸爸到了动物园，看到了马，然后爸爸告诉他，这就是马；之后，又看到了老虎，告诉他：“看，这种身上有条纹的动物就是老虎。”最后，又带他去看了熊猫，对他说：“你看这熊猫是黑白色的。”然后，爸爸给小明安排了一个任务，让他在动物园里找一种他从没见过的动物，叫斑马，并告诉了小明有关于斑马的信息：“斑马有着马的轮廓，身上有像老虎一样的条纹，而且它像熊猫一样是黑白色的。”最后，小明根据爸爸的提示，在动物园里找到了斑马。
上述例子中包含了一个人类的推理过程，就是利用过去的知识（马，老虎，熊猫和斑马的描述），在脑海中推理出新对象的具体形态，从而能对新对象进行辨认。如下图所示ZSL就是希望能够模仿人类的这个推理过程，使得计算机具有识别新事物的能力。

如今深度学习非常火热，使得纯监督学习在很多任务上都达到了让人惊叹的结果，但其限制是：往往需要足够多的样本才能训练出足够好的模型，并且利用猫狗训练出来的分类器，就只能对猫狗进行分类，其他的物种它都无法识别。这样的模型显然并不符合我们对人工智能的终极想象，我们希望机器能够像上文中的小明一样，具有通过推理，识别新类别的能力。

ZSL就是希望我们的模型能够对其从没见过的类别进行分类，让机器具有推理能力，实现真正的智能。其中零次（Zero-shot）是指对于要分类的类别对象，一次也不学习。这样的能力听上去很具有吸引力，那么到底是怎么实现的呢？

假设我们的模型已经能够识别马，老虎和熊猫了，现在需要该模型也识别斑马，那么我们需要像爸爸一样告诉模型，怎样的对象才是斑马，但是并不能直接让模型看见斑马。所以模型需要知道的信息是马的样本、老虎的样本、熊猫的样本和样本的标签，以及关于前三种动物和斑马的描述。
今天就写到这里，感谢大家的观看。

20.XLD轮廓 Echo`` Halcon系统化学习计算机视觉人工智能算法
目录1.xld概念2.画轮廓3.区域转轮廓4.边缘提取算子5.xld特征提取6.提取任意线条7.提取最长的线条8.xld分割10.xld合并11.xld拟合12.xld几何变换13.xld变换14.xld集合运算15.区域和轮廓精度16.轮廓的保存读取17.halcon操作CAD文件18.轮廓测量算子19.同心度计算1.xld概念*图像处理*1.处理对象HObject*1.图像-image*2.区
图像分割技术详解：从原理到实践 lanjieying
本文还有配套的精品资源，点击获取简介：图像分割是图像处理领域将图像分解为多个区域的过程，用于图像分析、特征提取等。文章介绍了图像分割的原理，并通过一个将图像划分为2*4子块的示例，展示了如何使用Python和matplotlib库中的tight_subplot函数进行图像分割和展示。文章还探讨了图像分割在不同领域的应用，以及如何在机器学习项目中作为数据预处理步骤。1.图像分割基本概念在图像处理领域
Pillow 安装使用教程小奇JAVA面试安装使用教程 pillow microsoft 深度学习
一、Pillow简介Pillow是Python图像处理库PIL（PythonImagingLibrary）的友好分支，是图像处理的事实标准。它支持打开、编辑、转换、保存多种图像格式，常用于图像批量处理、验证码识别、缩略图生成等应用场景。二、安装Pillow2.1使用pip安装（推荐）pipinstallPillow2.2验证安装importPILprint(PIL.__version__)若无报错
Coze智能体开发：如何批量生成和处理图片王国平 Coze AI Agent智能体开发语言模型人工智能开发语言智能体 Agent
在绘本制作、图片后期制作等场景中，往往需要使用模型来批量生成和处理图片。扣子提供了多个图像处理类节点，支持图像生成、添加水印、画质优化等多种常见的图片处理方式，你可以在批处理节点中嵌套图像生成等图像处理节点，实现图片的批量操作。本文档以绘本制作工作流为例，演示如何通过批处理节点和图像节点实现图像的批量生成和批量处理。效果演示通过绘本制作工作流，你可以批量生成类似以下风格的图片。搭建过程中你也可以根
OpenCV教程——图像模糊。均值模糊，高斯模糊，中值模糊，双边模糊，高斯分布
1.图像模糊图像模糊是图像处理中最简单和常用的操作之一。⚠️使用该操作的原因之一是为了给图像预处理时降低噪声。图像模糊操作背后是数学的卷积计算。卷积操作的原理：常用的图像模糊的方法：均值模糊高斯模糊中值模糊双边模糊这四种模糊方式有时也被称为：均值滤波、高斯滤波、中值滤波和双边滤波。因为模糊属于一种滤波操作，具体关系可参照下图：其中，均值滤波、高斯滤波和中值滤波属于线性滤波；而双边滤波属于非线性滤波
线性代数在图像处理中的应用 --- 纳尼? 2D的高斯核可以通过1D的高斯核直接生成？（秩为1的矩阵）松下J27 Linear Algebra 线性代数图像处理人工智能
二维高斯核，Rank秩等于一的矩阵之前，我在学习图像处理的时候，会经常用到Gaussianblur，也就是二维高斯低通滤波。当时用的都是Matlab中，现成的图像处理库。只需要输入sigma和kernelsize这些参数就行了，完全不需要考虑高斯核中的每个点长啥样。虽然教科书里面也会有一些配图，例如：直到后来，我学习高斯图像金字塔的时候发现，在别人的代码里面，他在生成二维高斯核的时候，并不是直接写
Apple SoC 图像 ISP 与 Neural Engine 联合优化案例分析：性能与质量平衡的实战经验观熵影像技术全景图谱：架构调优与实战接口隔离原则影像 Camera
AppleSoC图像ISP与NeuralEngine联合优化案例分析：性能与质量平衡的实战经验关键词：AppleSoC、ISP优化、NeuralEngine协同、图像处理性能、DeepFusion、SmartHDR、实时推理、多核异构计算、功耗管理摘要：随着图像计算复杂度的不断提升，AppleSoC中的ISP与NeuralEngine（NE）联合优化成为提升拍照性能和图像质量的关键路径。本文结合最
Chapter6: ISP架构和处理模块-之-ISP模块 ifuleyou1668 Camera QC android
高通（Qualcomm）图像信号处理器（ISP）是摄像头系统中的核心组件，用于实时处理从摄像头传感器获取的图像数据。高通ISP包含多个模块，每个模块负责一部分图像处理任务。以下是高通CameraISP中常见的一些关键模块：1.RawDataInputInterfaceSensorInterface:接受来自摄像头传感器的原始数据，一般通过MIPICSI-2接口。2.LensShadingCorre
内嵌式触摸显示器在工业视觉设备中的应用 Jwest2021 计算机外设
内嵌式触摸显示器在工业视觉设备中的应用日益广泛，其重要性不容忽视。以下是对内嵌式触摸显示器在工业视觉设备中应用的具体分析：一、应用背景工业视觉设备是智能制造的重要组成部分，它依赖于先进的图像处理和机器视觉技术，实现对生产线上产品质量的自动化检测和控制。随着工业4.0和智能制造的推进，工业视觉设备在生产线上的作用愈发关键。而内嵌式触摸显示器作为人机交互的重要界面，为工业视觉设备提供了直观、便捷的操作
用Python解锁图像处理之力：从基础到智能应用的深度探索熊猫钓鱼>_> python 图像处理开发语言
在像素构成的数字世界里，Python已成为解码图像奥秘的核心引擎。一、为何选择Python处理图像？超越工具的本质思考当人们谈论图像处理时，往往会陷入工具对比的漩涡（PythonvsMATLABvsC++）。但Python的真正价值在于其构建的完整生态闭环：科学计算基石：NumPy的ndarray结构完美对应图像的多维矩阵本质算法实现自由：从传统算子到深度学习模型的无缝衔接可视化即战力：Matpl
验证码破解的可能与不可能：用Python处理图片验证码的原理与限制程序员威哥 python 开发语言
前言验证码（CAPTCHA）是当前互联网防护机制中的重要组成部分，用于区分真人与自动程序。近年来，随着自动化技术发展，验证码破解成为自动化测试、爬虫及安全研究领域的热点。然而，从技术层面来看，验证码破解既有可行之处，也存在根本限制。本文将结合Python图像处理与机器学习技术，深度剖析图片验证码破解的原理、实践与瓶颈。一、验证码的分类及破解难点1.验证码类型字符型验证码纯数字、字母或混合，最常见。
数字图像处理学习笔记 andwhataboutit? 学习笔记
1-图像处理基础_哔哩哔哩_bilibili输出图像像素点需要将图象值要作类型转换，转成Int图像仿射变换线性变换+平移线性变换：1，变换前直线，变换后仍然直线2，直线比例不变3，直线到远点的距离不变仿射变换计算：常见变换：恒等变换：变换前后一致尺度变换：对尺寸作放大或缩小旋转变换：图像旋转但是尺寸不变平移：：位置移动尺寸不变偏移（垂直、水平）：垂直或者水平方向变化代码示例：importcv2im
数字图像处理第二次实验愚戏师数字图像处理 python 图像处理
实验三技术点分析根据实验要求，需要实现以下图像空间域滤波技术：噪声生成：高斯噪声椒盐噪声空间域滤波：均值滤波（3×3,5×5,7×7）中值滤波（3×3,5×5,7×7）最大值滤波最小值滤波图像处理流程：读取原始图像添加噪声（高斯/椒盐）应用各种滤波器可视化对比结果完整示例代码importcv2importnumpyasnpimportmatplotlib.pyplotaspltfrommatplo
FPGA实现JPEG编码器的完整项目指南
本文还有配套的精品资源，点击获取简介：JPEG编码是一种广泛使用的数字图像压缩技术，通过在FPGA上实现该编码器，可以为嵌入式系统提供高效的图像处理。FPGA的可编程逻辑单元使其成为实现JPEG编码的理想平台。实现过程包括颜色空间转换、分块、离散余弦变换（DCT）、量化和熵编码等关键步骤。此外，testbench仿真用于验证设计的功能和性能，而资源优化确保了设计的高效性和低功耗。该实现过程需要深入
python 中值滤波 search7 python
中值滤波是数字信号处理和数字图像处理领域使用较多的预处理技术，使用邻域内所有信号的中位数替换中心像素的值，可以在滤除异常值的情况下较好地保留纹理信息。该技术会在一定程度上造成图像模糊和失真，滤波窗口变大时会非常明显。importnumpyasnpfromPILimportImageimportscipy.signalassignalim=Image.open('lena.jpg')data=[]w
蚁群算法原理与应用详解
本文还有配套的精品资源，点击获取简介：蚁群算法是一种基于蚂蚁寻找食物路径行为的优化算法，它能够有效解决包括旅行商问题、网络路由和多目标优化在内的复杂问题。该算法模拟蚂蚁释放信息素来找到最短路径的过程，通过模拟蚂蚁的行为，算法逐步优化选择路径。蚁群算法具有并行性和全局优化能力，但也面临早熟收敛和参数调整的挑战。它已成功应用于物流优化、通信网络、任务调度、机器学习、图像处理和生物医学等众多领域。1.蚁
Python 开发证件照抠图程序：从零到完整应用 winfredzhang python regm 证件照背景图颜色
在这个数字化时代，证件照的需求无处不在——求职简历、证件申请、网站注册等都需要规范的证件照。传统的方法是去照相馆拍摄或使用复杂的图像处理软件，但作为程序员，我们可以开发一个简单易用的证件照抠图工具。本文将详细介绍如何使用Python的wxPython框架和AI抠图技术，开发一个功能完整的证件照处理程序。C:\pythoncode\new\compressedjpeg30times.py项目概述我们
从0到1掌握OpenCV！Python图像处理实战全解析（附代码+案例）小张在编程 Python学习 opencv python 图像处理
引言你有没有想过，手机里的美颜滤镜如何精准识别五官？监控摄像头如何在人流中锁定可疑目标？医学影像软件如何从CT片中快速标注病灶？这些“神奇操作”的背后，往往藏着一个低调的“图像处理神器”——OpenCV。作为Python生态中最受欢迎的计算机视觉库，它用一行行代码将抽象的像素点变成可操作的“数字画布”。今天，我们就从最基础的图像读写开始，手把手带你解锁OpenCV的“十八般武艺”，从图像处理小白变
2025系统架构师---管道/过滤器架构风格喜欢猪猪 java 开发语言
引言在分布式系统与数据密集型应用主导技术演进的今天，‌管道/过滤器架构风格‌（PipesandFiltersArchitectureStyle）凭借其‌数据流驱动‌、‌组件解耦‌与‌并行处理能力‌，成为处理复杂数据转换任务的核心范式。从Unix命令行工具到实时金融交易引擎，从图像处理流水线到物联网边缘计算，管道/过滤器架构通过将系统拆分为独立处理单元（过滤器）与数据传递通道（管道），实现了功能模块
Python机器学习实战——逻辑回归（附完整代码和结果）小白熊XBX 机器学习机器学习 python 逻辑回归
Python机器学习实战——逻辑回归（附完整代码和结果）关于作者作者：小白熊作者简介：精通c#、Halcon、Python、Matlab，擅长机器视觉、机器学习、深度学习、数字图像处理、工业检测识别定位、用户界面设计、目标检测、图像分类、姿态识别、人脸识别、语义分割、路径规划、智能优化算法、大数据分析、各类算法融合创新等等。联系邮箱：[email protected]科研辅导、知识付费答疑、个性化定制
MATLAB骨架化形态学运算专题详解
本文还有配套的精品资源，点击获取简介：骨架化是一种减少图像复杂度、提取主要结构的技术，在MATLAB中通过bwmorph函数进行。本专题涵盖了骨架化的基本原理、相关函数、实际应用以及如何通过形态学操作如膨胀、腐蚀、开闭运算来优化结果。骨架化在医学图像分析、工业检测和生物图像分析等领域有广泛应用。掌握骨架化技术有助于提升图像处理的效率和准确性。1.骨架化概念与重要性1.1骨架化的定义与基本概念在数字
OpenCV图像边缘检测慕婉0307 opencv基础 opencv 人工智能计算机视觉
一、边缘检测基础概念边缘检测是图像处理中最基本也是最重要的操作之一，它能识别图像中亮度或颜色急剧变化的区域，这些区域通常对应物体的边界。OpenCV提供了多种边缘检测方法，从传统的算子到基于深度学习的现代方法。1.1为什么需要边缘检测？数据降维：将图像转换为边缘表示可大幅减少数据量特征提取：边缘是图像最重要的视觉特征之一预处理步骤：为物体识别、图像分割等高级任务做准备噪声抑制：某些边缘检测方法具有
活体检测api集成方案-炫彩活体检测助力身份核验 wt_cs 发票识别科技 ocr 报关单识别接口数据库
现如今，随着人脸伪造技术的不断升级，传统身份核验方式面临严峻挑战，视频中的虚假人脸攻击防不胜防，用户隐私泄露、资金损失等风险如影随形。如何在便捷服务与安全防护之间找到平衡？视频活体检测接口给出了答案。视频活体检测接口，就像一位火眼金睛的安全卫士，能够对上传的视频进行精准检测，瞬间判断视频中的人物是否为真人。它有效抵御了视频中伪造的人脸攻击，一旦检测为真人，便会立即返回一张清晰的人脸照片，为下一步的
【人工智能】 AI的进化之路：大模型如何重塑技术格局蒙娜丽宁 Python杂谈人工智能人工智能 python
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界本文深入探讨了人工智能大模型的进化历程及其对技术格局的深远影响。从早期神经网络到现代大模型的突破，文章分析了关键技术进步，如Transformer架构、预训练机制和分布式计算。结合数学公式和代码示例，详细阐述了大模型的训练原理、优化方法及实际应用场景。文
Python读取红外图像 - 实现红外图像的读取和处理程序员杨弋 Python全栈工程师学习指南 python 计算机视觉 opencv
在许多工业、安防等领域中，红外图像无疑是一种不可或缺的重要资源，因此，能够快速、准确地读取和处理红外图像，对于工程师和科学家来说非常必要。Python作为一种强大的编程语言，提供了丰富的图像处理库，允许我们轻松地读取和处理红外图像，本文将介绍如何使用Python读取红外图像，并对其进行简单的处理。首先需要准备一个目标红外图像文件，这里我们以bmp格式的文件为例：importcv2img=cv2.i
JAI Core 1.1.3：Java 高级图像处理的利器顾润治
JAICore1.1.3：Java高级图像处理的利器javax.mediajai_core1.1.3如何下载项目地址:https://gitcode.com/Resource-Bundle-Collection/bda8b项目介绍JAICore1.1.3是JavaAdvancedImaging(JAI)库的核心组件，专为处理多媒体数据，特别是图像处理操作而设计。由SunMicrosystems（现
AI人工智能与OpenCV：实现智能图像编辑功能 AI智能探索者 AI Agent 智能体开发实战人工智能 opencv 计算机视觉 ai
AI人工智能与OpenCV：实现智能图像编辑功能关键词：人工智能、OpenCV、图像处理、计算机视觉、深度学习、智能编辑、图像增强摘要：本文深入探讨如何结合人工智能(AI)和OpenCV实现智能图像编辑功能。我们将从基础概念出发，详细介绍核心算法原理，展示实际代码实现，并分析典型应用场景。文章将涵盖从传统图像处理技术到深度学习方法的演进，重点讲解如何利用OpenCV和AI模型实现自动化的图像增强、
前端计算机视觉：使用 OpenCV.js 在浏览器中实现图像处理亿只小灿灿前端 OpenCV 前端计算机视觉 opencv
一、OpenCV.js简介与环境搭建OpenCV（OpenSourceComputerVisionLibrary）是一个强大的计算机视觉库，广泛应用于图像和视频处理领域。传统上，OpenCV主要在后端使用Python或C++等语言。但随着WebAssembly(Wasm)技术的发展，OpenCV也有了JavaScript版本——OpenCV.js，它可以直接在浏览器中高效运行，为前端开发者提供了前
Halcon 初步了解科学的发展-只不过是读大自然写的代码图形编程 c#视觉处理 Halcon
1.Halcon概述Halcon是德国MVTec公司开发的一套完善的机器视觉算法包，也是一款功能强大的视觉处理软件，为工业自动化领域提供了全面的解决方案。它拥有应用广泛的机器视觉集成开发环境，提供了一套丰富的图像处理和机器视觉算法，可以在各种工业应用中进行图像分析、目标检测、测量、定位、识别等任务。Halcon的核心功能包括图像处理、特征提取与匹配、3D视觉、深度学习、条码识别、OCR识别以及视觉
数字信号处理（DSP）全方位学习指南
本文还有配套的精品资源，点击获取简介：数字信号处理（DSP）是信息技术的关键部分，涉及多种数字信号的分析与处理技术，广泛应用于多个技术领域。本指南深入探索DSP的集成开发环境（IDE），基础概念，以及专业词汇，旨在帮助读者系统掌握DSP原理和实践技能。内容涵盖DSP集成开发环境CCS的使用、基础知识如傅里叶变换与滤波器设计，以及专业术语的学习。此外，还介绍了DSP在音频、图像处理和通信系统中的实际
linux系统服务器下jsp传参数乱码 3213213333332132 java jsp linux windows xml
在一次解决乱码问题中，发现jsp在windows下用js原生的方法进行编码没有问题，但是到了linux下就有问题， escape,encodeURI,encodeURIComponent等都解决不了问题但是我想了下既然原生的方法不行，我用el标签的方式对中文参数进行加密解密总该可以吧。于是用了java的java.net.URLDecoder,结果还是乱码，最后在绝望之际，用了下面的方法解决了
Spring 注解区别以及应用 BlueSkator spring
1. @Autowired @Autowired是根据类型进行自动装配的。如果当Spring上下文中存在不止一个UserDao类型的bean，或者不存在UserDao类型的bean，会抛出 BeanCreationException异常，这时可以通过在该属性上再加一个@Qualifier注解来声明唯一的id解决问题。 2. @Qualifier 当spring中存在至少一个匹
printf和sprintf的应用 dcj3sjt126com PHP sprintf printf
<?php printf('b: %b c: %c d: %d <bf>f: %f', 80,80, 80, 80); echo ' '; printf('%0.2f %+d %0.2f ', 8, 8, 1235.456); printf('th
config.getInitParameter 171815164 parameter
web.xml <servlet> <servlet-name>servlet1</servlet-name> <jsp-file>/index.jsp</jsp-file> <init-param> <param-name>str</param-name>
Ant标签详解--基础操作 g21121 ant
Ant的一些核心概念： build.xml：构建文件是以XML 文件来描述的，默认构建文件名为build.xml。 project：每个构建文
[简单]代码片段_数据合并 53873039oycg 代码
合并规则:删除家长phone为空的记录,若一个家长对应多个孩子,保留一条家长记录,家长id修改为phone,对应关系也要修改。代码如下:
java 通信技术云端月影 Java 远程通信技术
在分布式服务框架中，一个最基础的问题就是远程服务是怎么通讯的，在Java领域中有很多可实现远程通讯的技术，例如：RMI、MINA、ESB、Burlap、Hessian、SOAP、EJB和JMS等，这些名词之间到底是些什么关系呢，它们背后到底是基于什么原理实现的呢，了解这些是实现分布式服务框架的基础知识，而如果在性能上有高的要求的话，那深入了解这些技术背后的机制就是必须的了，在这篇blog中我们将来
string与StringBuilder 性能差距到底有多大 aijuans
之前也看过一些对string与StringBuilder的性能分析，总感觉这个应该对整体性能不会产生多大的影响，所以就一直没有关注这块！由于学程序初期最先接触的string拼接，所以就一直没改变过自己的习惯！
今天碰到 java.util.ConcurrentModificationException 异常 antonyup_2006 java 多线程工作 IBM
今天改bug，其中有个实现是要对map进行循环，然后有删除操作，代码如下： Iterator<ListItem> iter = ItemMap.keySet.iterator(); while(iter.hasNext()){ ListItem it = iter.next(); //...一些逻辑操作 ItemMap.remove(it); } 结果运行报Con
PL/SQL的类型和JDBC操作数据库百合不是茶 PL/SQL表标量类型游标 PL/SQL记录
PL/SQL的标量类型: 字符,数字,时间,布尔,%type五中类型的 --标量：数据库中预定义类型的变量 --定义一个变长字符串 v_ename varchar2(10); --定义一个小数,范围 -9999.99~9999.99 v_sal number(6,2); --定义一个小数并给一个初始值为5.4 :=是pl/sql的赋值号
Mockito：一个强大的用于 Java 开发的模拟测试框架实例 bijian1013 mockito 单元测试
Mockito框架： Mockito是一个基于MIT协议的开源java测试框架。 Mockito区别于其他模拟框架的地方主要是允许开发者在没有建立“预期”时验证被测系统的行为。对于mock对象的一个评价是测试系统的测
精通Oracle10编程SQL(10)处理例外 bijian1013 oracle 数据库 plsql
/* *处理例外 */ --例外简介 --处理例外-传递例外 declare v_ename emp.ename%TYPE; begin SELECT ename INTO v_ename FROM emp where empno=&no; dbms_output.put_line('雇员名：'||v_ename); exceptio
【Java】Java执行远程机器上Linux命令 bit1129 linux命令
Java使用ethz通过ssh2执行远程机器Linux上命令，封装定义Linux机器的环境信息 package com.tom; import java.io.File; public class Env { private String hostaddr; //Linux机器的IP地址 private Integer po
java通信之Socket通信基础白糖_ java socket 网络协议
正处于网络环境下的两个程序，它们之间通过一个交互的连接来实现数据通信。每一个连接的通信端叫做一个Socket。一个完整的Socket通信程序应该包含以下几个步骤： ①创建Socket； ②打开连接到Socket的输入输出流； ④按照一定的协议对Socket进行读写操作； ④关闭Socket。 Socket通信分两部分：服务器端和客户端。服务器端必须优先启动，然后等待soc
angular.bind boyitech AngularJS angular.bind AngularJS API bind
angular.bind 描述：上下文，函数以及参数动态绑定，返回值为绑定之后的函数. 其中args是可选的动态参数，self在fn中使用this调用。使用方法： angular.bind(se
java-13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 bylijinnan java
import java.util.ArrayList; import java.util.List; public class KickOutBadGuys { /** * 题目：13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 * Maybe you can find out
Redis.conf配置文件及相关项说明（自查备用） Kai_Ge redis
Redis.conf配置文件及相关项说明 # Redis configuration file example # Note on units: when memory size is needed, it is possible to specifiy # it in the usual form of 1k 5GB 4M and so forth: #
[强人工智能]实现大规模拓扑分析是实现强人工智能的前奏 comsci 人工智能
真不好意思,各位朋友...博客再次更新... 节点数量太少,网络的分析和处理能力肯定不足,在面对机器人控制的需求方面,显得力不从心.... 但是,节点数太多,对拓扑数据处理的要求又很高,设计目标也很高,实现起来难度颇大...
记录一些常用的函数 dai_lm java
public static String convertInputStreamToString(InputStream is) { StringBuilder result = new StringBuilder(); if (is != null) try { InputStreamReader inputReader = new InputStreamRead
Hadoop中小规模集群的并行计算缺陷 datamachine mapreduce hadoop 并行计算
注：写这篇文章的初衷是因为Hadoop炒得有点太热，很多用户现有数据规模并不适用于Hadoop，但迫于扩容压力和去IOE（Hadoop的廉价扩展的确非常有吸引力）而尝试。尝试永远是件正确的事儿，但有时候不用太突进，可以调优或调需求，发挥现有系统的最大效用为上策。 -----------------------------------------------------------------
小学4年级英语单词背诵第二课 dcj3sjt126com english word
egg 蛋 twenty 二十 any 任何 well 健康的，好 twelve 十二 farm 农场 every 每一个 back 向后，回 fast 快速的 whose 谁的 much 许多 flower 花 watch 手表 very 非常，很 sport 运动 Chinese 中国的
自己实践了github的webhooks, linux上面的权限需要注意 dcj3sjt126com github webhook
环境, 阿里云服务器 1. 本地创建项目, push到github服务器上面 2. 生成www用户的密钥 sudo -u www ssh-keygen -t rsa -C "[email protected]" 3. 将密钥添加到github帐号的SSH_KEYS里面 3. 用www用户执行克隆, 源使
Java冒泡排序蕃薯耀冒泡排序 Java冒泡排序 Java排序
冒泡排序 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 10:40:14 星期二 http://fanshuyao.iteye.com/
Excle读取数据转换为实体List【基于apache-poi】 hanqunfeng apache
1.依赖apache-poi 2.支持xls和xlsx 3.支持按属性名称绑定数据值 4.支持从指定行、列开始读取 5.支持同时读取多个sheet 6.具体使用方式参见org.cpframework.utils.excelreader.CP_ExcelReaderUtilTest.java 比如： Str
3个处于草稿阶段的Javascript API介绍 jackyrong JavaScript
原文： http://www.sitepoint.com/3-new-javascript-apis-may-want-follow/?utm_source=html5weekly&utm_medium=email 本文中，介绍3个仍然处于草稿阶段，但应该值得关注的Javascript API. 1) Web Alarm API &
6个创建Web应用程序的高效PHP框架 lampcy Web 框架 PHP
以下是创建Web应用程序的PHP框架，有coder bay网站整理推荐： 1. CakePHP CakePHP是一个PHP快速开发框架，它提供了一个用于开发、维护和部署应用程序的可扩展体系。CakePHP使用了众所周知的设计模式，如MVC和ORM，降低了开发成本，并减少了开发人员写代码的工作量。 2. CodeIgniter CodeIgniter是一个非常小且功能强大的PHP框架，适合需
评"救市后中国股市新乱象泛起"谣言 nannan408
首先来看百度百家一位易姓作者的新闻：三个多星期来股市持续暴跌，跌得投资者及上市公司都处于极度的恐慌和焦虑中，都要寻找自保及规避风险的方式。面对股市之危机，政府突然进入市场救市，希望以此来重建市场信心，以此来扭转股市持续暴跌的预期。而政府进入市场后，由于市场运作方式发生了巨大变化，投资者及上市公司为了自保及为了应对这种变化，中国股市新的乱象也自然产生。首先，中国股市这两天
页面全屏遮罩的实现方式 Rainbow702 html css 遮罩 mask
之前做了一个页面，在点击了某个按钮之后，要求页面出现一个全屏遮罩，一开始使用了position:absolute来实现的。当时因为画面大小是固定的，不可以resize的，所以，没有发现问题。最近用了同样的做法做了一个遮罩，但是画面是可以进行resize的，所以就发现了一个问题，当画面被reisze到浏览器出现了滚动条的时候，就发现，用absolute 的做法是有问题的。后来改成fixed定位就
关于angularjs的点滴 tntxia AngularJS
angular是一个新兴的JS框架，和以往的框架不同的事，Angularjs更注重于js的建模，管理，同时也提供大量的组件帮助用户组建商业化程序，是一种值得研究的JS框架。 Angularjs使我们可以使用MVC的模式来写JS。Angularjs现在由谷歌来维护。这里我们来简单的探讨一下它的应用。首先使用Angularjs我
Nutz--->>反复新建ioc容器的后果 xiaoxiao1992428 DAO mvc IOC nutz
问题： public class DaoZ { public static Dao dao() { // 每当需要使用dao的时候就取一次 Ioc ioc = new NutIoc(new JsonLoader("dao.js")); return ioc.get(