WeChat_007

ArcFace 论文大颗粒粗读笔记（一）

为什么看Arcface？应为实习要看啊。。。 ~~这篇文章相当于不严谨的翻译，看到此博文的同学们要带着批判的精神。~~

摘要，：以叙事的角度拆开看

作者开门藏山，只是露出了山的一角，告诉你最近使用深度卷积神经网络（DCNN）进行大规模人脸识别的特征学习中的主要挑战之一是设计适当的损失函数以增强判别能力。

缓缓拨开云雾，发现几个对手走在前面，都是要登顶的好手。走在最前面的是我们的Center Loss（这个链接有各个人脸识别的损失函数解析）选手，它会惩罚欧式要素空间中深层特征与其对应的类中心之间的距离，以实现类内紧凑性；后面紧跟的是SphereFace，SphereFace假定最后一个完全连接的层中的线性变换矩阵可用作角度空间中类中心的表示，并以乘法方式惩罚深部特征及其对应权重之间的角度。最近，一种流行的研究方向是将边距合并到公认的损失函数中，以使面部类别的可分离性最大化。

作者看到登山芝士们的身法，知己知彼，悟出了自己的一套无相剑骨，整装待发。提出了“相加角余量损失”（ArcFace），以获取用于面部识别的高判别特征。由于与超球面上的测地距离精确对应，因此拟议的ArcFace具有清晰的几何解释。

~~整个过程降维来说就是，俺也提了个损失函数，叫Arcface，效果拔群。~~

介绍：

这张图要表达什么意思？

幼儿园化来说，现在我有两个人的照片，每个人的照片为一个类别，我尝试用四种不同的损失来区分它们，A方法最好。

详细来说，基于中心[18]和特征[37]归一化，所有身份都分布在超球面上。为了增强类内紧凑性和类间差异，我们考虑了四种测地距离（GDis）约束。（A）余量损失：在样本和中心之间插入测地距离余量。（B）类内损失：减小样品与相应中心之间的测地距离。（C）类间损失：增加不同中心之间的测地距离。（D）三重态损失：在三重态样本之间插入测地距离裕度。在本文中，我们提出了一个加法角余量损失（ArcFace），它与（A）中的测地距离（Arc）余量罚分完全对应，以增强人脸识别模型的判别能力。大量的实验结果表明（A）的策略是最有效的。

前面讲历史，DCNN是现在FR（face recognition）的主流，主流方法可分为基于Softmax Loss与Triplet Loss的方法都算是比较成功的。

~~接下来是一大段翻译~~

但是，softmax损失和三元组损失都有一些缺点。对于softmax损失：（1）线性变换矩阵W∈Rd×n的大小随着身份数n线性增加；（2）对于封闭集分类问题，学习到的特征是可分离的，但对于开放集人脸识别问题，则不能充分区分。对于三元组损失：（1）特别是对于大型数据集，面部三胞胎的数量呈组合爆炸式增长，导致迭代步骤数显着增加；（2）对于有效的模型训练，半硬样本挖掘是一个相当困难的问题。已经提出了几种变体[38、9、46、18、37、35、7、34、27]，以增强softmax损失的判别能力。 Wen等。 [38]率先提出了中心损失，即每个特征向量与其类中心之间的欧几里得距离，以获得类内部的紧凑性，同时通过联合惩罚softmax损失来保证类间的色散。然而，由于最近可用于训练的面部类别的数量急剧增加，因此在训练期间更新实际中心极为困难。通过观察在softmax损失下训练的分类DCNN的最后一个完全连接层的权重与每个面部类别的中心具有概念上的相似性，[18，19]中的工作提出了乘法角余量罚分以强制执行额外的内部类紧凑性和类间差异同时出现，从而导致训练后的模型具有更好的判别能力。即使Sphereface [18]引入了重要的角度余量概念，它们的损失函数也需要一系列近似值才能计算出来，这导致网络的训练不稳定。为了稳定训练，他们提出了一种混合损失函数，其中包括标准softmax损失。根据经验，softmax损失在训练过程中占主导地位，因为基于整数的乘法角余量使目标logit曲线非常陡峭，从而阻碍了收敛。 CosFace [37，35]直接向目标logit添加余弦余量罚金，与SphereFace相比，它可获得更好的性能，但承认更容易实现，并且免除了softmax损失的联合监管需求。在本文中，我们提出了加法角余量损失（ArcFace），以进一步提高人脸识别模型的判别力并稳定训练过程。如图2所示，DCNN特征和最后一个完全连接的层之间的点积等于特征和权重归一化后的余弦距离。我们利用反余弦函数来计算当前特征与目标权重之间的角度。然后，我们向目标角度添加一个附加的角余量，然后通过余弦函数再次获得目标对数。然后，我们按照固定的特征范数重新缩放所有logit，随后的步骤与softmax损失中的步骤完全相同。提议的ArcFace的优点可以总结如下：
参与。
ArcFace通过归一化超球面中角度和弧线之间的精确对应关系直接优化了测地距离裕度。通过分析特征和权重之间的角度统计数据，我们直观地说明512-D空间中发生的情况。
有效。
ArcFace在十项人脸识别基准（包括大规模图像和视频数据集）上达到了最先进的性能。
简单。
ArcFace仅需要算法1中给出的几行代码，并且在基于计算图的深度学习框架中非常容易实现，例如MxNet [8]，Pytorch [25]和Tensorflow [4]。
此外，与[18，19]中的工作相反，ArcFace不需要与其他损失函数结合才能具有稳定的性能，并且可以轻松地收敛到任何训练数据集上。高效。在培训期间，ArcFace仅增加了可忽略的计算复杂性。当前的GPU可以轻松支持数百万个身份进行训练，而模型并行策略可以轻松支持更多身份。

概括的说，介绍了Softmax Loss两个不足，一个是随着类别的增多，参数量暴增，另一个是在开集上效果不好。Triplet Loss的两个不足，一个是image2image的compare太耗时，另一个是semi-hard sampling。再者是Softmax， Sphereface ，CosFace ，Arcface的出发点。最后是Arcface的特点。

提出的算法：

作者原话 The most widely used：Softmax Loss

其中 xi 表示第i个样本的深层特征，与类别yi相关联，嵌入特征尺寸d设置为512

j表示权重W的列， bj就是Wj对应的偏置

n为类别的数量，N为Batch size的大小

所以Softmax Loss在人脸识别中的看出来的不足就是： ~~。。。。又说Softmax Loss的不足了~~

但是，softmax损失函数并未明确优化嵌入的功能，以使类别内样本具有更高的相似度，而类别间样本具有更高的多样性，这会导致在类别间内部出现较大的外观变化和年龄差距以及较大的情况下，用于深层人脸识别的性能差距规模的测试方案。

这一段用Google翻译的乱七八糟的，我看了一个B站的视频，估摸着这一段里面大致意思是 Sofrmax虽然能区分类别，但是对年龄，光照，化妆的因素造成的类内区分不好。所以呢，基于这个点出发，作者开始修改上面的Softmax Loss了。

简单地说，参考文献[18]将bj修改为0，参考文献[26],把WjXi修改为||Wj||||Xi||cosθj，按照[18，37，36]把每个W，做归一化，并且加上了L2正则，按照[28 , 35 , 36 , 37]，对X也做归一化，L2正则，最后re-scale到s。特征和权重的归一化步骤使预测仅取决于特征和权重之间的夹角。因此，所学习的嵌入特征分布在半径为s的超球面上。

作者在这段并没有指出s大小，查阅资料发现这里s的值是64，目的在于舍弃X的值大小对分类的影响，使得网络更关注角度的因素。

经过上述的替换，原Softmax Loss损失函数可以写为公式2的形式。~~而分母拆分成两个部分，这样显得之前的解释变得直观？~~

重要的一个部分来了，也算是最核心的部分。

由于嵌入特征分布在超球面上的每个特征中心周围，因此我们在xi和Wyi之间添加了一个附加的角余量罚分m，以同时增强类内部的紧凑性和类间的差异。由于拟议的加法角余量罚分等于在非最小化超球面中的测地距离余量罚分，因此我们将方法命名为ArcFace。

最后这个损失函数的公式长这样。

jsonp 常用util方法 hw1287789687 jsonp jsonp常用方法 jsonp callback
jsonp 常用java方法 (1)以jsonp的形式返回:函数名(json字符串) /*** * 用于jsonp调用 * @param map : 用于构造json数据 * @param callback : 回调的javascript方法名 * @param filters : <code>SimpleBeanPropertyFilter theFilt
多线程场景 alafqq 多线程
0 能不能简单描述一下你在java web开发中需要用到多线程编程的场景？0 对多线程有些了解，但是不太清楚具体的应用场景，能简单说一下你遇到的多线程编程的场景吗？ Java多线程 2012年11月23日 15:41 Young9007 Young9007 4 0 0 4 Comment添加评论关注(2) 3个答案按时间排序按投票排序 0 0 最典型的如： 1、
Maven学习——修改Maven的本地仓库路径 Kai_Ge maven
安装Maven后我们会在用户目录下发现.m2 文件夹。默认情况下，该文件夹下放置了Maven本地仓库.m2/repository。所有的Maven构件(artifact)都被存储到该仓库中，以方便重用。但是windows用户的操作系统都安装在C盘，把Maven仓库放到C盘是很危险的，为此我们需要修改Maven的本地仓库路径。
placeholder的浏览器兼容 120153216 placeholder
【前言】自从html5引入placeholder后，问题就来了，不支持html5的浏览器也先有这样的效果，各种兼容，之前考虑，今天测试人员逮住不放，想了个解决办法，看样子还行，记录一下。【原理】不使用placeholder，而是模拟placeholder的效果，大概就是用focus和focusout效果。【代码】 <scrip
debian_用iso文件创建本地apt源 2002wmj Debian
1.将N个debian-506-amd64-DVD-N.iso存放于本地或其他媒介内，本例是放在本机/iso/目录下 2.创建N个挂载点目录如下： debian:~#mkdir –r /media/dvd1 debian:~#mkdir –r /media/dvd2 debian:~#mkdir –r /media/dvd3 …. debian:~#mkdir –r /media
SQLSERVER耗时最长的SQL 357029540 SQL Server
对于DBA来说，经常要知道存储过程的某些信息： 1. 执行了多少次 2. 执行的执行计划如何 3. 执行的平均读写如何 4. 执行平均需要多少时间列名 &
com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 7454103 eclipse
今天eclipse突然报了com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 错误，并且工程文件打不开了，在网上找了一下资料，然后按照方法操作了一遍，好了，解决方法如下：错误提示信息： An error has occurred.See error log for more details. Reason: com/genuitec/
用正则删除文本中的html标签 adminjun java html 正则表达式去掉html标签
使用文本编辑器录入文章存入数据中的文本是HTML标签格式，由于业务需要对HTML标签进行去除只保留纯净的文本内容，于是乎Java实现自动过滤。如下： public static String Html2Text(String inputString) { String htmlStr = inputString; // 含html标签的字符串 String textSt
嵌入式系统设计中常用总线和接口 aijuans linux 基础
嵌入式系统设计中常用总线和接口任何一个微处理器都要与一定数量的部件和外围设备连接，但如果将各部件和每一种外围设备都分别用一组线路与CPU直接连接，那么连线
Java函数调用方式——按值传递 ayaoxinchao java 按值传递对象基础数据类型
Java使用按值传递的函数调用方式，这往往使我感到迷惑。因为在基础数据类型和对象的传递上，我就会纠结于到底是按值传递，还是按引用传递。其实经过学习，Java在任何地方，都一直发挥着按值传递的本色。首先，让我们看一看基础数据类型是如何按值传递的。 public static void main(String[] args) { int a = 2;
ios音量线性下降 bewithme ios音量
直接上代码吧 //second 几秒内下降为0 - (void)reduceVolume:(int)second { KGVoicePlayer *player = [KGVoicePlayer defaultPlayer]; if (!_flag) { _tempVolume = player.volume;
与其怨它不如爱它 bijian1013 选择理想职业规划
抱怨工作是年轻人的常态，但爱工作才是积极的心态，与其怨它不如爱它。一般来说，在公司干了一两年后，不少年轻人容易产生怨言，除了具体的埋怨公司“扭门”，埋怨上司无能以外，也有许多人是因为根本不爱自已的那份工作，工作完全成了谋生的手段，跟自已的性格、专业、爱好都相差甚远。
一边时间不够用一边浪费时间 bingyingao 工作时间浪费
一方面感觉时间严重不够用，另一方面又在不停的浪费时间。每一个周末，晚上熬夜看电影到凌晨一点，早上起不来一直睡到10点钟，10点钟起床，吃饭后玩手机到下午一点。精神还是很差，下午像一直野鬼在城市里晃荡。为何不尝试晚上10点钟就睡，早上7点就起，时间完全是一样的，把看电影的时间换到早上，精神好，气色好，一天好状态。控制让自己周末早睡早起，你就成功了一半。有多少个工作
【Scala八】Scala核心二：隐式转换 bit1129 scala
Implicits work like this: if you call a method on a Scala object, and the Scala compiler does not see a definition for that method in the class definition for that object, the compiler will try to con
sudoku slover in Haskell (2) bookjovi haskell sudoku
继续精简haskell版的sudoku程序，稍微改了一下，这次用了8行，同时性能也提高了很多，对每个空格的所有解不是通过尝试算出来的，而是直接得出。 board = [0,3,4,1,7,0,5,0,0, 0,6,0,0,0,8,3,0,1, 7,0,0,3,0,0,0,0,6, 5,0,0,6,4,0,8,0,7,
Java-Collections Framework学习与总结-HashSet和LinkedHashSet BrokenDreams linkedhashset
本篇总结一下两个常用的集合类HashSet和LinkedHashSet。它们都实现了相同接口java.util.Set。Set表示一种元素无序且不可重复的集合；之前总结过的java.util.List表示一种元素可重复且有序
读《研磨设计模式》-代码笔记-备忘录模式-Memento bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; /* * 备忘录模式的功能是，在不破坏封装性的前提下，捕获一个对象的内部状态，并在对象之外保存这个状态，为以后的状态恢复作“备忘”
《RAW格式照片处理专业技法》笔记 cherishLC PS
注意，这不是教程！仅记录楼主之前不太了解的一、色彩（空间）管理作者建议采用ProRGB（色域最广），但camera raw中设为ProRGB，而PS中则在ProRGB的基础上，将gamma值设为了1.8（更符合人眼）注意：bridge、camera raw怎么设置显示、输出的颜色都是正确的（会读取文件内的颜色配置文件），但用PS输出jpg文件时，必须先用Edit->conv
使用 Git 下载 Spring 源码编译 for Eclipse crabdave eclipse
使用 Git 下载 Spring 源码编译 for Eclipse 1、安装gradle，下载 http://www.gradle.org/downloads 配置环境变量GRADLE_HOME，配置PATH %GRADLE_HOME%/bin，cmd，gradle -v 2、spring4 用jdk8 下载 https://jdk8.java.
mysql连接拒绝问题 daizj mysql 登录权限
mysql中在其它机器连接mysql服务器时报错问题汇总一、[running][email protected]:~$mysql -uroot -h 192.168.9.108 -p //带-p参数，在下一步进行密码输入 Enter password: //无字符串输入 ERROR 1045 (28000): Access
Google Chrome 为何打压 H.264 dsjt apple html5 chrome Google
Google 今天在 Chromium 官方博客宣布由于 H.264 编解码器并非开放标准，Chrome 将在几个月后正式停止对 H.264 视频解码的支持，全面采用开放的 WebM 和 Theora 格式。 Google 在博客上表示，自从 WebM 视频编解码器推出以后，在性能、厂商支持以及独立性方面已经取得了很大的进步，为了与 Chromium 现有支持的編解码器保持一致，Chrome
yii 获取控制器名和方法名 dcj3sjt126com yii framework
1. 获取控制器名在控制器中获取控制器名: $name = $this->getId(); 在视图中获取控制器名: $name = Yii::app()->controller->id; 2. 获取动作名在控制器beforeAction()回调函数中获取动作名: $name =
Android知识总结（二） come_for_dream android
明天要考试了，速速总结如下 1、Activity的启动模式 standard：每次调用Activity的时候都创建一个（可以有多个相同的实例，也允许多个相同Activity叠加。） singleTop：可以有多个实例，但是不允许多个相同Activity叠加。即，如果Ac
高洛峰收徒第二期：寻找未来的“技术大牛” ——折腾一年，奖励20万元 gcq511120594 工作项目管理
高洛峰，兄弟连IT教育合伙人、猿代码创始人、PHP培训第一人、《细说PHP》作者、软件开发工程师、《IT峰播》主创人、PHP讲师的鼻祖！首期现在的进程刚刚过半，徒弟们真的很棒，人品都没的说，团结互助，学习刻苦，工作认真积极，灵活上进。我几乎会把他们全部留下来，现在已有一多半安排了实际的工作，并取得了很好的成绩。等他们出徒之日，凭他们的能力一定能够拿到高薪，而且我还承诺过一个徒弟，当他拿到大学毕
linux expect heipark expect
1. 创建、编辑文件go.sh #!/usr/bin/expect spawn sudo su admin expect "*password*" { send "13456\r\n" } interact 2. 设置权限 chmod u+x go.sh 3.
Spring4.1新特性——静态资源处理增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
idea ubuntuxia 乱码 liyonghui160com
1.首先需要在windows字体目录下或者其它地方找到simsun.ttf 这个字体文件。 2.在ubuntu 下可以执行下面操作安装该字体： sudo mkdir /usr/share/fonts/truetype/simsun sudo cp simsun.ttf /usr/share/fonts/truetype/simsun fc-cache -f -v
改良程序的11技巧 pda158 技巧
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短永远永远不要把同一个变量用于多个不同的
300个涵盖IT各方面的免费资源（下）——工作与学习篇 shoothao 创业免费资源学习课程远程工作
工作与生产效率: A. 背景声音 Noisli:背景噪音与颜色生成器。 Noizio:环境声均衡器。 Defonic:世界上任何的声响都可混合成美丽的旋律。 Designers.mx:设计者为设计者所准备的播放列表。 Coffitivity:这里的声音就像咖啡馆里放的一样。 B. 避免注意力分散 Self Co
深入浅出RPC uule rpc
深入浅出RPC-浅出篇深入浅出RPC-深入篇 RPC Remote Procedure Call Protocol 远程过程调用协议它是一种通过网络从远程计算机程序上请求服务，而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在，如TCP或UDP，为通信程序之间携带信息数据。在OSI网络通信模型中，RPC跨越了传输层和应用层。RPC使得开发

ArcFace 论文大颗粒粗读笔记（一）

你可能感兴趣的:(...)