良言lyboy

经典计算机视觉论文笔记——DeepFace\DeepID\DeepID2\DeepID3\FaceNet\VGGFace汇总

1. DeepFace:Closing the Gap to Human-Level Performance in Face Verification

最早将深度学习用于人脸验证的开创性工作。Facebook AI实验室出品。动用了百万级的大规模数据库。典型的识别信号提特征+验证信号refine的两步走，对DeepID等后人的工作影响很大。

技术概括

关注了人脸验证流程中的人脸对齐步，采用了比较复杂的 3D 人脸建模技术和逐块的仿射变换进行人脸对齐。可以解决 non-planarity 对齐问题。提出了一个 9 层（其实是 8 层）的 CNN 进行特征提取。提出了一种针对对齐后人脸的的 locally connected layers ，无权值共享。用 CNN 提取的特征继续进行 metric learning ，包括卡方距离学习和 siamese network 两种方法。

一些值得反思的细节

CNN 的结构： conv-->pooling-->conv-->3 locally connected layers-->2 fc 。由于最后 5 层都没有权值共享，所以会造成参数膨胀，共有超过 1.2 亿个参数，其中 95% 都来源于最后 5 层。但 locally connected layers 相比原始的 conv 计算速度是一样的。因为动用了目前看来也是惊人的 4000 人的 400 百万幅图像，所以没有出现明显的过拟合。单个 CNN 最后提取的特征维数是 4096 。 3D 对齐的步骤是：找 6 个 landmarks--> 进行 2D 对齐 --> 重找 6 个 landmarks--> 重进行 2D 对齐 …… 直到收敛 --> 找 67 个 landmarks-->3D-2D 映射建模 --> 逐块仿射变换变成正脸。此处水很深，实现起来较复杂，而且后续的论文都没有再用如此复杂的对齐手段也能得到非常好的结果，不建议复现。但对比实验表明 3D 对齐的作用还是很大的，可能是和采用的算法有关系吧，比如针对 3D 对齐定制的 locally connected layers 。 pooling 只使用一次，担心信息损失太多。只对第一个 fc layer 采用了 dropout 。 CNN 提取完的特征还要进行两次归一化。第一次是每个分量除以训练集中的最大值，第二次是 l2 归一化。此步似乎多余，也没有足够的理论和实验支撑，又回到了人工特征的老路。归一化本身是一种降低特征之间差异的手段，不一定就可以增强 discriminative ability ，应该慎重使用。 CNN 学习出特征后，还需要用某种相似度来做验证。文中采用了两种比较简单的相似度：加权卡方距离和加权 L1 距离。权重分别通过 SVM 和 siamese network 学习到。这一步一般是进行迁移学习。相似度量学习到后，还要训练一个 SVM 对两两距离做 2 分类，判断是否是同一个人。数据库： 4030 个人，每人 800-1200 幅图像， 4 百 40 万幅图像。 10 种网络的距离结果 ensemble ，累加 kernel matrix ，再用 SVM 对距离做分类，判断是否是同一个人。通过牛逼的工程优化，在 2.2GHz 单 CPU 上可做到 CNN0.18 秒，对齐 0.05 秒，全部 0.33 秒。

2. Deep LearningFace Representation from Predicting 10,000 Classes

汤晓鸥团队DeepID系列的开创之作。也是典型的两步走策略。

技术概括

训练一个 9 层 CNN 对约 10000 个人（其实是 8700 个人）做人脸识别，中间有跨层连接和 locally connected layer 。倒数第二层的输出作为特征。多个人脸区域的特征进行连接作为总特征。用 CNN 学习出的特征再训练一个 joint bayesian 进行人脸验证。

一些值得反思的细节

单个 CNN 训练出的特征是 160 维，维度非常小，具有极强的压缩性质。明确提出识别信号的作用，强于只使用验证信号。 CNN 的结构： conv1-->pooling1-->conv2-->pooling2-->conv3-->pooling3-->conv4-->fc-->softmax 。其中 conv3 只在每个 2*2 局部区域权值共享， conv4 是 locally connected layer ，权值不共享。 fc 同时与 pooling3 与 conv4 全连接，是一种多分辨率策略。 CNN 输入会根据 patch 的不同而改变，后续的 feature maps 都会跟着改变。人脸对齐采用 3 个 landmarks 。根据 5 个 landmarks 采样 patches 。一共 10 regions*3 scales*1 RGB*1 gray=60 patches 。每个 patch 还要取 flip 。所以，最后要训练 60*2=120 个 CNN ！最后把每个 CNN 的 160 维特征连接成 160*2*60=19200 维特征。工作量有点大。用 CNN 学习出的特征训练了 joint bayesian 和一个验证用的神经网络。验证用神经网络只是一个三层的浅层网络，输入是成对的图像 patches ， 19200*2 维，输出层是 2 分类结果输出。对比结果显示这种神经网络没有 joint bayesian 效果好。训练 joint bayesian 前用 PCA 把 19200 维特征降维到 150 。数据库包括 10177 个人，共 202599 幅图像。

3. Deep LearningFace Representation by Joint Identification-Verification

超越人类水平（97.53%）。不过同是晓鸥团队的gaussian face是第一次超越人类。

技术概括

明确采用两种监督信号：识别信号用于增加类间距离，验证信号用于减少类内距离（肯定也是有利于增加类间距离的）。相比于 DeepID ， loss 层除了用于分类的 softmax loss ，还加入了 contrastive loss 。两种 loss 同时反向传播。相比于 DeepID ，从众多 patches 中挑选出了 25 个最佳 pathes ，减少计算负担和信息冗余。验证采用 joint bayesian 或直接用 L2 距离。

一些值得反思的细节

CNN 结构除了最后的 loss 层外与 DeepID 一样。输出是 8192 个人的分类结果。从 400 个 patches 中挑选了 25 个。训练 25 个 CNN ，最后连接成的特征向量是 25*160=4000 维。在训练 joint bayesian 之前，要通过 PCA 进一步降维到 180 维。因为加入了 contrasitive loss ， CNN 学习出的特征可以直接用于计算 L2 距离进行人脸验证，效果不会比 joint bayesian 差很多。最后通过选择不同的 patches ，训练了 7 个分类器做 ensemble 。

4. Deeply learnedface representations are sparse, selective, and robust

一半内容是理论分析。总体上两步走策略没变，只是CNN结构做了较大改变。

技术概括

增加隐含层的宽度，即 feature maps 个数。监督信息跨层连接。理论分析 DeepID2+ 的特征是 sparsity\selectiveness\robustness 。 sparsity 是指特征向量中有许多分量为 0 ，因此具有压缩能力。 selectiveness 是指某个分量对某个人的图像或某种属性的图像的激活响应程度和其他人或属性的程度不一样，因此具有判别能力。 robustness 是指图像特征在遮挡前后具有一定的不变性。利用 sparsity 进行特征二值化，可用于大规模图像检索。

一些值得反思的细节

训练集中没有特意加入遮挡样本，但学习出的特征也具有遮挡的鲁棒性。相比于 DeepID2 ， feature maps 的个数由 20 、 40 、 60 、 80 变为 128 、 128 、 128 、 128 。输出的特征维数由 160 变为 512 。相比于 DeepID2 ， 25 个 patches 还要再取一次 flip ，训练 50 个 CNN ，特征维数共 50*512=25600 维。数据库： 12000 个人， 290000 幅图像。 fc 和 loss 层连接到之前的每一个 pooling 层后面，也就是类似 googlenet 的策略，让监督信息直接作用到每一层。但 fc 层应该权值不共享。通过对人脸属性方面的分析，说明通过人脸识别与验证信号学习到某个神经元是对某种属性有更强的激活响应。所有这些神经元的组合代表了各种属性的特征组合，说明通过这些中层属性特征可以对高层的身份特征进行差别，与 kumar 的工作有异曲同工之妙。

5. DeepID3: FaceRecognition with Very Deep Neural Networks

针对CNN的结构做了较大改进，采用图像识别方面的最新网络结构，且层数加深。其他方面较前作没有变化。

技术概括

实现了两种更深层的 CNN 网络，一种是参考 VGG 对 conv 层的不断堆积，一种是参考 googlenet 对 inception 结构的不断堆积。继续采用 DeepID2+ 中的监督信号跨层连接策略。继续采用 DeepID2+ 中的 25 个 patches （加 flip ）特征组合策略。其中 VGG 和 googlenet 各训练一半。继续采用 DeepID2+ 中的 joint bayesian 用于验证的策略。

一些值得反思的细节

VGG 类 CNN 结构： conv1\2-->pooling1-->conv3\4-->pooling2-->conv5\6-->pooling3-->conv7\8-->pooling4-->lc9\10 ， fc 和 loss 连接到之前每一个 pooling 层后面。 googlenet 类 CNN 结构： conv1\2-->pooling1-->conv3\4-->pooling2-->inception5\6\7-->pooling3-->inception8\9-->pooling4 ， fc 和 loss 连接到之前每一个 pooling 层后面。 relu 用于除了 pooling 层之外的所有层。 dropout 用于最后的特征提取层。特征总长度大约 30000 维。 PCA 降维到 300 维。与 DeepID2+ 比起来，精度几乎没有提高。可能还是网络过浅，训练数据过少，没有完全发挥 VGG 和 googlenet 的效果。

6. FaceNet: AUnified Embedding for Face Recognition and Clustering

非两步式方法，end-to-end方法。在LFW的精度基本上到极限了，虽然后面还有百度等99.77%以上的精度，但从原理上没有创新，也是用了triplet loss等本文得出的技术。

技术概括

提出了一种 end-to-end 的网络结构，最后连接的是 triplet loss 。这样提取的特征可以直接用欧氏距离算相似度。提出了样本选择技术，找 hard triplets 。这一步至关重要，选不好可能会不收敛。

一些值得反思的细节

特征维度： 128 。可以二值化，效果也不错。 triplet loss 为什么比 contrastive loss 好没有解释得太清楚。两者都有 margin 的概念，而不是像本文所说的是其独有。 triplets 选择有两种方法。 1. 线下选择。用训练中途的网络去找一个样本集中的 hard triplets 。 2. 线上选择。也是本文最终所采用的方式。从当前 mini-batch 中选择。每个 mini-batch 取几千个（ 1800 个）样本，其中保证每人至少 40 个样本。负样本随机采样即可。所有正样本对都用，只选择负样本对。实际选择 hard negtives 的时候，松弛条件，只选择 semi-hard ，也就是负样本对的距离比正样本对的距离大，但距离小于 margin 即可。 margin:0.2 。设计了两种 CNN 结构。 1.VGG 类中加入了 1*1 kernel 。共 22 层。 1.4 亿个参数。 16 亿 FLOPS 。 2.googlenet 类基于 Inception 模型，其中两个小模型 NNS1 ： 26M 参数， 220M FLOPS ； NNS2 ： 4.3M 参数， 20M FLOPS 。三个大模型 NN3 与 NN4 和 NN2 结构一样，但输入变小了。 NN2 输入： 224×224 ， NN3 输入： 160×160 ， NN4 输入： 96×96 。采用了 l2 pooling ，没有用常规的 max pooling ，不知原委。数据库规模超大。 800 万人，共 2 亿幅图像。无需对齐。

7. Deep FaceRecognition

精度上并没有超越前人，但网络结构较易实现，而且提出了一些有很强实践性的工作流程。

技术概括

提出了一个低成本的图像标注流程。用最朴素的 conv 层不断堆积建造了一个 38 层（另外还有 40 层、 43 层）的 CNN 做 2622 个人的分类，学习识别信号，最后用 triplet loss 学习验证信号，将特征映射到一个欧氏距离空间用 L2 距离作为相似度。

一些值得反思的细节

数据库： 2600 人， 260 万幅图像。大约每人 1000 幅。标注团队： 200 人。图像标注流程如下。 1. 建立人名列表和初步爬图。主要集中于名人，便于从网上获取大量样本，共 5000 人，男女各半。再进行过滤，过滤掉样本太少的、与 lfw 有重合的、按人名爬取的图像不准确的。最后剩下 2622 人，每人 200 幅。 2. 收集更多的图像。从其他搜索引擎、关键词加 “ 演员 ” 等附加词，扩充到每人 2000 幅。 3. 用分类器自动过滤。训练样本采用搜索引擎 rank 最高的 50 幅，用 Fisher Vector 训练 1 对多 SVM 。最后保留每人 2000 幅中分数最高的 1000 幅。要训练 2622 个 SVM ，工作量巨大。 4. 去重。 5. 人工审核加分类器自动过滤。训练一个 CNN ，每个人分数低的样本就丢弃。最后剩 982803 幅图像。前 4 步只花了 4 天，整个流程花了 14 天。特征维度： 1024 。 CNN 结构中不包括 LRN 。输入减去了平均脸。没有进行颜色扰动。 mini-batch size= 64 。这个设得有点太小了。 dropout 用于两个 fc 层。 triplet loss 用于 fine-tune 。前面几层的参数都固定不变，只变新加的 fc 层。 triplet 中的负样本只选与 anchor 距离超过 margin 的。 3scales*10patches = 30 patches 。最后这 30 个特征取平均（原文如此，感觉特征取平均会乱套的，一般都是分类结果取平均或 voting ）

借鉴之处

人脸对齐是必要的，但没必要做精准对齐。训练时不太用准，测试时可以精准。跨层连接有利于信息流的反馈传播，有利于效果提升。识别与验证信号都有用，缺一不可。多个 patches 结合效果明显，但增加了计算负担。多个 model 结合效果明显，但增加了计算负担。大规模训练数据量。人数和图像总数都是越多越好。 joint bayesian 、直接用相似度距离均可，关键是学习出的特征是否有效。可以先用一般类型的图像学习 N 路识别 CNN ，再用测试图像类型迁移学习验证信号。也可以直接 end-to-end 。特征二值化，有利于哈希检索。

O (1) 空间搞定链表：穿针引线法核心技巧与例题无聊的小坏坏算法链表 c++算法
文章目录穿针引线法的核心思想基础应用：链表反转1.全链表反转2.部分链表反转高级应用：链表重排穿针引线法的设计模式常见问题解决方案1.K个一组反转链表2.环形链表检测在链表操作的世界里，"穿针引线"是一种优雅而高效的技巧，它通过精准的指针操作，像缝纫一样重新连接节点，解决各种复杂的链表问题。这种技巧不依赖额外数据结构，空间复杂度仅为O(1)，是算法面试中的必备技能。穿针引线法的核心思想指针即针线：
华为OD机试2025 B卷 - 通过软盘拷贝文件 (C++ & Python & JAVA & JS & GO) 无限码力华为OD机试真题刷题笔记华为od 华为OD机试华为OD机试 2025B卷华为OD2025B卷华为OD机考 2025B卷
通过软盘拷贝文件华为OD机试真题目录点击查看:华为OD机试2025B卷真题题库目录｜机考题库+算法考点详解华为OD机试2025B卷100分题型题目描述有一名科学家想要从一台古董电脑中拷贝文件到自己的电脑中加以研究。但此电脑除了有一个3.5寸软盘驱动器以外，没有任何手段可以将文件持贝出来，而且只有一张软盘可以使用。因此这一张软盘是唯一可以用来拷贝文件的载体。科学家想要尽可能多地将计算机中的信息拷贝到
解读华晨宇张羽的梦想森林
现在的综艺节目好看的真是多，时间有限，只能追我喜欢的，追《歌手》追了六年，依然被吸引着，只要有时间肯定看回放，所有广告全部跳过去，只看精华，每一次都觉得很爽！在《歌手》认识了90歌手华晨宇，说不上喜欢，但一直都觉得他很特别的，但又说不出哪里特别。汪峰一直评价他：这么小就能坚持自己喜欢的东西，坚持自己的风格，是难能可贵的！就在上周五的这一期，华晨宇演绎了崔健的歌曲《假行僧》，之前的花絮报道了这首歌重
python学智能算法（二十四）|SVM-最优化几何距离的理解
引言前序学习过程中，已经对几何距离的概念有了认知，学习链接为：几何距离这里先来回忆几何距离δ的定义：δ=min⁡i=1...myi(w∥w∥⋅xi+b∥w∥)\delta=\min_{i=1...m}y_{i}(\frac{w}{\left\|w\right\|}\cdotx_{i}+\frac{b}{\left\|w\right\|})δ=i=1...mminyi(∥w∥w⋅xi+∥w∥b)对上
华为OD机试2025C卷 - 计算三叉搜索树的高度 (C++ & Python & JAVA & JS & GO) 无限码力华为OD机试真题刷题笔记华为od 华为OD机试2025C卷华为OD2025C卷华为OD机考2025C卷
计算三叉搜索树的高度华为OD机试真题目录点击查看:华为OD机试2025C卷真题题库目录｜机考题库+算法考点详解华为OD机试2025C卷100分题型题目描述定义构造三叉搜索树规则如下：每个节点都存有一个数，当插入一个新的数时，从根节点向下寻找，直到找到一个合适的空节点插入。查找的规则是：如果数小于节点的数减去500，则将数插入节点的左子树如果数大于节点的数加上500，则将数插入节点的右子树否则，将数
支持向量机SVM 李昊哲小课 sklearn 人工智能机器学习支持向量机算法机器学习 sklearn 人工智能数据挖掘
支持向量机SVM一、支持向量机算法支持向量机（SupportVectorMachine，SVM）是一种用于分类和回归分析的机器学习算法。分类场景举例（更容易理解）假设现在有一个二维平面上散落着一些点，这些点分为两类，一类是红色的圆形点，另一类是蓝色的方形点。我们的任务就是找到一条直线，能够把这两类点尽可能准确地分开。支持向量机算法做的事情就和这个类似。算法核心思想它不是随便找一条能分开两类数据的直
打卡Day12 HAhhhiu python学习打卡 python 机器学习
@浙大疏锦行知识点：遗传算法：来源于自然界中的生物进化和基因遗传思想：模拟生物进化过程，通过“选择（保留优秀解）、交叉（组合解的特征）、变异（引入新特征）”迭代优化我想培养出一只超级泰迪犬？该怎么办呢？首先，我有一群泰迪犬，但是小泰迪们的各种基因不同，形态各色，我只想要一只高大、卷毛和聪明的泰迪。（这是初始解的集合，也是案例学习代码中，我们所设定的随机森林中的一堆的参数范围）接着，我开始挑选符合上
财富自由之路第三章可可_4b5e
读好书一定要慢。文字的出现，使人类与其他动物区分开来。人类也正是因为有了文字才与其它物种有了本质上的不同。而阅读，对于任何一个正常人类来说都具有非凡的意义。人类之外的物种只能依赖最落后但被称为神奇的方式积累经验：基因遗传。啄木鸟可以本能地采用最优算法获取食物——而一个MIT的数学博士面对同样的问题却不见得可以迅速解决；而啄木鸟的小脑袋在没有受过高等教育的情况下，是如何得到结果的呢？答案是：通过上百
【数据结构 | C语言】Dijkstra算法（迪杰斯特拉算法）竹一笔记 C 数据结构数据结构 c语言开发语言
文章目录一、Dijkstra算法介绍二、算法C语言三、完整代码四、示例一、Dijkstra算法介绍Dijkstra算法解决了单源点的最短路径Dijkstra算法是贪心算法步骤：从源点出发，找到已连通点与未连通点的最小代价边连接最小代价边，将该顶点归并到已连接顶点集将该顶点连通的边的代价与最小代价比较，若代价小于最小代价，则更新最小代价边重复操作，直到连通所有顶点为止Dijkstra算法与Prim算
高省支持抖音和快手购物返佣吗？详细解读高省邀请码使用方法与优惠好项目高省
在当今多元化的购物环境中，消费者越来越倾向于通过不同的平台来购买商品，其中抖音和快手等短视频平台也逐渐成为购物的新选择。那么，作为智能导购电商平台的高省，是否支持抖音和快手购物的返佣呢？同时，对于想要加入高省的用户来说，邀请码又是什么呢？首先，关于高省是否能在抖音和快手购物中提供返佣的问题，答案是肯定的。高省作为一个集成了多个电商平台的智能导购系统，不仅覆盖了传统的电商平台，也逐渐拓展了与新兴电商
lab2-2 Dijkstra算法求由顶点a到顶点h的最短路径西一安鲜算法
1.问题[描述算法问题，首选形式化方式（数学语言），其次才是非形式化方式（日常语言）]对于下图使用Dijkstra算法求由顶点a到顶点h的最短路径，按实验报告模板编写算法。2.解析Dijkstra算法（单源点路径算法，要求：图中不存在负权值边），Dijkstra算法使用了广度优先搜索解决赋权有向图或者无向图的单源最短路径问题，算法最终得到一个最短路径树。Dijkstra(迪杰斯特拉)算法是典型的
单源最短路之dijkstra 「維他檸檬茶」算法最短路
迪杰斯特拉算法主要用于解决单源最短路问题，主要有两种，朴素版和堆优化版，数据量较大时用堆优化版。迪杰斯特拉朴素版：#include#includeusingnamespacestd;#defineintlonglong//可能会超时#definePIIpairconstintINF=0x3f3f3f3f,mod=998244353;constintN=505;intn,m;intg[N][N],m
【初学数据结构】关于KMP算法的回退思考 Das1 算法数据结构
初学KMP算法时，理解next数组以及回退过程是一个超级劝退过程。如果实在理解不了的，可以直接背。虽然作为十大经典算法之一，但是并不是非常重要，也就考试会考到罢了。关键数据结构解释next数组：next[k]是t[0]~t[j-1]这个串的最大相同前缀的后一个地址，同时也表示最大相同前缀的数量。s串，t串：表示两个索引j,k在进行匹配时所指代的字串next数组是什么？求next数组实际上就是求对于
【算法-图论】图的定义与一些常用术语小蛋编程 C++c++算法
【算法-图论】图的定义图论编辑器1：https://csacademy.com/app/graph_editor/图论编辑器2：https://graphonline.top/ch/1.图是什么图（graph）由节点（node）和边（edge）组成。其中，节点集合记为VVV，边集合记为EEE。每条边连接两个节点，某些图的边可能具有方向性。集合元素的数量用该集合的绝对值来表示。通过对比可以看出，图比
【PTA数据结构 | C语言版】求图中关键活动
本专栏持续输出数据结构题目集，欢迎订阅。文章目录题目代码题目请编写程序，实现求带权的有向图中关键活动的算法。输入格式：输入首先在第一行给出两个正整数，依次为当前要创建的图的顶点数n（≤100）和边数m。随后m行，每行给出一条有向边的起点编号、终点编号、权重。顶点编号从0开始，权重（≤100）为整数。同行数字均以一个空格分隔。输出格式：按格式输出关键活动，其中u为起点编号，v为终点编号。按起点编号的
【PTA数据结构 | C语言版】最短路的交点
本专栏持续输出数据结构题目集，欢迎订阅。文章目录题目代码题目给定有向加权图G，和4个顶点u,v,s,t。假设图G中所有边的权值都非负。设计一个算法来判定“从u到v的最短路径”和“从s到t的最短路径”是否存在一个交点w。也即，顶点w是u到v的最短路径上的一个顶点，同时也是s到t的最短路径上的一个顶点。注意：最短路径包含两个端点；一对顶点间的最短路径可能不止一条，求交点时必须将所有最短路径考虑在内。输
【PTA数据结构 | C语言版】求单源最短路的Dijkstra算法
本专栏持续输出数据结构题目集，欢迎订阅。文章目录题目代码题目请编写程序，实现在带权的有向图中求单源最短路的Dijkstra算法。注意：当多个待收录顶点路径等长时，按编号升序进行收录。输入格式：输入首先在第一行给出两个正整数，依次为当前要创建的图的顶点数n（≤100）和边数m。随后m行，每行给出一条有向边的起点编号、终点编号、权重。顶点编号从0开始，权重（≤100）为整数。同行数字均以一个空格分隔。
防不胜防!第六届研究所老姜（姜新宁）算力3.0亏损被骗曝光,巨额损失真相令人胆寒心惊！大盛律道
数字经济十选五投资诈骗套路频出，投资者股民的“钱袋子”多有损失，以投资理财获取大数据数字经济投资算法为由，将投资者的积蓄收入囊中，成为不法分子常用的诈骗手段之一。为守护好投资者的“钱袋子”，小编持续开展曝光数字经济诈骗行动，维护“投资者”合法权益。近年来，股市波动不断，投资者们无不渴望找到稳健的投资途径。而一些不法分子趁机利用第六届研究所荐股群的手段，设下重重陷阱，致使投资者损失惨重。骗子冒充姜新
春季招聘数字化：智能招聘如何升级面试流程？人事百宝箱面试流程优化面试流程数字化面试流程优化招聘数字化
2025年春季招聘季，全球企业面临着双重挑战：既要应对人才争夺战，又要在AI技术革命中重构招聘体系。数据显示，采用数字化面试流程的企业，人才录用效率提升47%，候选人体验满意度提高39%。在智能招聘时代，传统依赖人工的面试模式已难以适应快速变化的市场需求，企业需要通过数字化升级实现降本增效与体验优化的双重目标。本文将从行业趋势出发，解析春招面试流程的数字化升级路径，并深度解读Moka人力资源管理系
基于YOLOv8的Web端交互式目标检测系统设计与实现 YOLO实战营 YOLO 前端目标检测人工智能 ui 目标跟踪计算机视觉
1.引言目标检测是计算机视觉领域的一项重要任务，它在安防监控、自动驾驶、医疗影像分析等领域有着广泛的应用。近年来，随着深度学习技术的快速发展，YOLO(YouOnlyLookOnce)系列算法因其出色的速度和精度平衡而备受关注。本文将详细介绍如何基于最新的YOLOv8模型构建一个Web端交互式目标检测系统，包含完整的UI界面设计和数据集处理流程。本系统将实现以下功能：基于YOLOv8的高效目标检测
基于卷积神经网络与小波变换的医学图像超分辨率算法复现神经网络15044 python 算法 cnn 算法人工智能图像处理开发语言神经网络深度学习
基于卷积神经网络与小波变换的医学图像超分辨率算法复现前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家，觉得好请收藏。点击跳转到网站。1.引言医学图像超分辨率技术在临床诊断和治疗规划中具有重要意义。高分辨率的医学图像能够提供更丰富的细节信息，帮助医生做出更准确的诊断。近年来，深度学习技术在图像超分辨率领域取得了显著进展。本文将复现一种结合卷积神经网络(CNN)、小波变
OpenCV引擎：驱动实时应用开发的科技狂飙芯作者 DD：计算机科学领域 opencv 计算机视觉
在人工智能与计算机视觉技术迅猛发展的今天，实时图像处理已成为工业自动化、自动驾驶、医疗诊断、增强现实等领域的核心技术需求。而**OpenCV（OpenSourceComputerVisionLibrary）**作为全球最活跃的开源计算机视觉库，正以其强大的算法生态、跨平台兼容性以及持续进化的架构设计，成为驱动实时应用开发的“数字引擎”。本文将深入剖析OpenCV如何通过技术创新突破实时处理的性能极
长篇科幻小说《黄茧》第33章发现 3 橙黄茧香
如果……如果那样下沉……那样穿越，就……就算最终能够完成，只怕……只怕我……我也会被这透明凝胶给窒息而亡。提取转化后的个体意识量子态信息数据，全需接受蜜云虚拟世界数理逻辑算法制约，必须在M蜜巢系统模式构架下运行，故环境数据对个体意识数据形成制约，如两者间发生数理冲突，个体意识信息数据必会被M蜜巢系统算法清除，个体意识也就将会在蜜云虚拟世界内消亡，窒息本质上对信息数据不构成损伤，但它执行是蜜云虚拟世
ROS和autosar区别和联系，以及AP/CP对比ROS Jaliang_ 汽车
ROS和autosar区别和联系ROS(RobotOperatingSystem)和AUTOSAR(AutomotiveOpenSystemArchitecture)是两个不同领域的开源软件框架。应用领域的不同:ROS主要面向机器人技术和相关的智能系统，它为机器人研发提供了一套完整的软件解决方案，包括通信、驱动、算法、模拟等各方面的支持。ROS适合用于机器人的控制、感知、规划、模拟等方面的开发，也
C#实现24种数据校验算法的综合指南及工具包.zip 语嫣凝冰
本文还有配套的精品资源，点击获取简介：在数据通信和网络编程中，数据的完整性和准确性是至关重要的。C#作为一种流行的开发语言，提供了强大的工具来实现各类数据校验算法。本压缩包包含了一个名为“WindowsFormsApp”的C#应用程序，用于展示和实验24种数据校验方法，涵盖从简单到复杂的各种算法。这包括CRC校验、MD5、SHA系列、Adler32、Checksum、ParityBit、LRC、H
【提示词优化技巧】利用大模型进行提示词自优化 weixin_37763484 大模型人工智能
看到一篇帖子，里面记录了如下的提示词优化技术，我使用ai进行了解读。整体来看，这个方法非常合理，能减少人工干预，值得试一试。原始方法如下：1.主题：构建高效Prompt的系统化流程：一种元提示工程方法在与大型语言模型（LLM）的交互中，提示词（Prompt）的质量直接决定了输出的上限。传统的Prompt撰写高度依赖工程师的经验和直觉，缺乏一套系统化的构建与优化流程，导致效率瓶颈和质量波动。本文提出
《数据结构》学习笔记二：算法（二）小曼blog
继续上节的学习，我们在这一篇文章里把“算法”这一章内容学习完。本节解决问题：算法的好坏到底是如何评估的？知识点：1.函数的渐进增长2.算法的时间复杂度3.常见的时间复杂度4.算法的空间复杂度1.函数的渐进增长这一知识点与数学相关，不过没关系都是很容易理解的内容。问题：假如两个算法的输入规模都是n,A的执行次数是2n+3,B的执行次数是3n+1,那么这两个算法哪一个更好呢？我们来分析一下，用数学的折
向量数据库FAISS/Chromadb/ES/milvus简单概述
FAISSFAISS（FacebookAISimilaritySearch）是一种高性能的向量相似性搜索库，用于在大规模向量数据集中快速搜索最相似的向量。它是由FacebookAIResearch开发的，旨在解决大规模向量搜索的问题，广泛应用于各种领域，如图像搜索、文本搜索、推荐系统等。FAISS的主要特点和优势如下：高效的相似性搜索：FAISS使用了一系列高效的算法和数据结构，如倒排索引、局部敏
大语言模型：人像摄影的“达芬奇转世”？——从算法解析到光影重塑的智能摄影革命黑巧克力可减脂 AIGC 语言模型人工智能自然语言处理
导言在摄影术诞生之初，达芬奇或许无法想象，他对于光影、比例和解剖的严谨研究，会在数百年后以另一种形式重生。今天，当摄影师面对复杂的光线环境或苦苦寻找最佳构图时，一位由代码构筑的“光影军师”正悄然降临——大语言模型（LLM）正以前所未有的方式，重塑人像摄影的创作边界。解构经典：大语言模型如何“消化”百年摄影智慧大语言模型并非凭空创造建议，其根基在于对海量摄影知识体系的深度理解与结构化重组。理论内化：
集群技术笔记-HAProxy 与 Keepalived 高可用负载均衡实战
目录前言HAProxy一、HAProxy介绍（一）定义（二）核心优势（三）调度算法速查表（四）工作模式（五）配置文件结构（六）健康检查字段二、搭建负载均衡集群（一）准备基本环境（二）配置流程配置真实服务器配置代理服务器（三）客户端验证三、配置健康检查页面（一）修改配置文件追加配置内容（二）重启服务（三）浏览器访问验证Keepalived一、Keepalived介绍（一）定义（二）功能（三）工作原理
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro

经典计算机视觉论文笔记——DeepFace\DeepID\DeepID2\DeepID3\FaceNet\VGGFace汇总

1. DeepFace:Closing the Gap to Human-Level Performance in Face Verification

技术概括

一些值得反思的细节

2. Deep LearningFace Representation from Predicting 10,000 Classes

技术概括

一些值得反思的细节

3. Deep LearningFace Representation by Joint Identification-Verification

技术概括

一些值得反思的细节

4. Deeply learnedface representations are sparse, selective, and robust

技术概括

一些值得反思的细节

5. DeepID3: FaceRecognition with Very Deep Neural Networks

技术概括

一些值得反思的细节

6. FaceNet: AUnified Embedding for Face Recognition and Clustering

技术概括

一些值得反思的细节

7. Deep FaceRecognition

技术概括

一些值得反思的细节

借鉴之处

你可能感兴趣的:(论文笔记,算法解读)