shine_6088

关于人脸识别项目

事宜

日期	待做	备注
2019/05/25	(1)人脸比对的模型可以考虑由faceNet换成insightFace (2)MTCNN人脸检测器可以再重新训练
2019/06/10	(1)开发那边的图片有些不合格，不符合我这边的规则的时候，可以删掉这些图片，并且新增图片。
2019/06/11	(1)编码考虑自动化，设定时间让程序自动运行 (2)将比对代码所有人和所有人对比
2019/06/12	（1）服务器和线下数据整合；（2）与官方数据集进行对比，计算准确率；（3）新增数据时，不根据系统时间而是每次对比是否存在这个json文件；
2019/06/13	（1）筛选图片时，选择人脸区域分辨率不小于8080甚至100100的；（2）一个id的比对结果也可以不是一个，可以返回多个结果供人来进行最后的判定；
2019/06/17	（1）之后要训练facenet的权重文件；（2）可能服务器上并不需要每个id存放50张图片，10张应该就够了；
2019/06/19	(1)考虑损失函数是用softmax还是tripletloss函数；
2019/06/20	(1)对每个id下进行聚类，找到id下不是一个人的；	李博的意见是一个id下两个学生上课的情况毕竟是少数，暂时先不管，一起放进去训练。
2019/06/21	（1）安保领域的黑白名单，借鉴此思路；（2）训练的时候学习率的策略，要加上验证集，可以考虑用LFW数据集或者，自己构造；（3）问中华哥，无用的图片要不要删了，放着也是占内存，还增加了我这边的处理量；
2019/06/24	（1）正式训练之前要检查学习率优化器等；（后面的处理要学习聚类）	done
2019/07/02	（1）从6月20到7月2号，学生ID一共增加了800多个，这个正常吗？
2019/07/05	(1)每个学生仅留下一张做比对时，会不会在人工筛选阶段不利于判断，这个需要看一张的策略是否有问题；
2019/07/05	(1)为了解决遮挡带来的精度下降问题，提出线性空间重构，利用参考图片的信息尝试尽可能地恢复残缺特征图，恢复后的特征图和参考特征图之间的距离即为重构距离。
2019/07/23	(1)尝试不同的人脸检测器和不同的人脸识别模型；
2019/07/30	（1）分批给lpb结果，先以表筛选，再类内筛选；（2）可以设置不同的阈值；
2019/08/01	（1）接口的服务：将传入的id与全库的id进行对比；

工作手记：

2019/06/05

6月5号前的120万（1256250）张图片中，编码成功了100万（1072036）张。

2019/06/10

这次增加aftercoding时间是截止到2019-06-10的图片

2019/06/11

增加aftercoding的时间从2019-06-10 12:00到2019-06-11 11:00

截至到下午已经编码了1115801条，大概存了6万多个id的图片

2019/06/13

目前的人脸识别的具体步骤如下：

筛选图片———人脸对齐——通过训练的模型进行编码——直接比较各张脸之间的欧式距离

2019/06/19

测试了权重文件20170512-110547，20180402-114759在LFW数据集上的准确性，分别是0.99550+-0.00342@ FAR=0.00100，0.97467+-0.01477 @ FAR=0.00133

关于lfw数据集的pairs.txt的格式说明：

从Line1-line301是同一个id的不同图片；

line302-line601是不同id的图片；

Line602-line901是同一个id的不同图片；

line902-line1201是不同id的图片；

.......

每行是一对，测试过程LFW给出一对照片，询问测试中的系统两张照片是不是同一个人，系统给出“是”或“否”的答案。通过6000对人脸测试结果的系统答案与真实答案的比值可以得到人脸识别准确率。这样的测试一共进行10次，每次600行有300行是匹配的，300行是不匹配的。参考

2019/06/17

用facenet的模型20170512-110547，测试了pot是10000的50个id的识别正确率，得到的是0.831-0.9之间；

2019/06/18

昨天97个id的图片的正确率是0.831-0.9之间，今天将id增加到495个，正确率是0.868+-0.012并没有显著变化。开始增量训练facenet模型;找到了训练分类器以及进行分类和预测人是那个的方法：分别使用claffifier.py以及predict.py。使用方法：博客。

2019/06/19

今天把facenet增量训练和直接训练的softmax函数也调通了

因为服务器上的图片存在不同id下同一个人的情况，因此，训练策略需要再考虑。目前考虑的

策略有两个：（1）对训练的照片先选用官方模型进行严格筛选，再放入进行训练，但是这样要考虑如果是将官方模型文件能够选出的图片放进去训练的话，意义不大，只能从facenet识别有问题的图片下手（facenet或者其他的模型）（2）可以从结果入手，进行对比的时候返回的结果不至一个id，这就需要在后面的部分加一些逻辑。这两种方法都要考虑聚类进去。

2019/06/20

目前aiImg服务器上一共140万图片（1400701），7万id（70048），图像的像素大小对识别的精度有着非常重要的影响

LFW数据集的分辨率：250*250

关于编码之前的人脸对比，facenet不需要像别的人脸识别的对齐方式：

faceNet不采用landmark直接用CNN来学对齐的那套，直接是face detection->feature extraction

其他的走face detection->face alignment ->feature extraction步骤。

2019/06/21

根据格灵深瞳的CEO赵勇：在公安系统的人脸识别系统中，对于犯罪分子的抓捕，是有黑白名单的（我认为一定不是全库搜索，在给定计算能力的情况下，耗时一定很久，正确率也会大大下降）。

人眼的分辨率大致计算是5.76亿。

图片量1404140，上的课只有一半的量能够存下来；

facenet的模型20180402-114759，测试海风的495个id的12k图片（12143），Accuracy:0.868+-0.012;

facenet的模型20170512-110547，测试海风的495个id的12k图片（12143），Accuracy:0.829+-0.010;

差了3%

从2019-06-21 18:12:58开始人脸对齐，

2019/06/22

pic:1407545

2019/06/24

一共切割137万完成（1372500）图片，不能对齐的有3万5千张图片（34973）

训练的参数设置，

第一个epoch训练之后，正确率0.9145+-0.01065；

第2个epoch训练之后，正确率0.91317+-0.01047；

第3个epoch训练之后，正确率0.91467+-0.00977；

第4个epoch训练之后，正确率0.91550+-0.00949；

第5个epoch训练之后，正确率0.91633+-0.00113；

2019/06/25

经过200轮训练之后，正确率跟昨天一致，但是损失从昨天的11稳步降到了8左右，Accuracy也增加到了0.55左右；

中华哥那边的日志的路径：/home/zzh/vision/faceDetector/logs

2019/06/26

人脸识别对整张照片的像素没有要求，但是脸部像素至少在64x64以上，最好是128x128以上。参考阿里云的问答；

写了一个筛选规则，只有大约一半的id有符合要求的图像；

2019/06/27

使用20180402-114759，测试海风的对500个id的筛选后的图片，Accuracy:0.897+-0.012;也就是正确率提高了3%（不是之前的500个id）

自己的数据训练200论之后，测试海风500个id的正确率0.858+-0.012

自己的数据训练200轮之后，测试海风之前的495个id的正确率竟然是：0.821+-0.006也就是比原先的基础模型的准确率（0.868+-0.012）反而降低了4%，目前原因不明。

2019/07/01

服务器上学生的图片数量依然是142万张（1424431）；

使用服务器上的验证validate_on_lfw.py,来测试模型的正确率时，采用官方的20180402-114759.pb，Accuracy: 0.86633+-0.01201；采用20190624-163159（softmax）时，Accuracy: 0.91700+-0.01074；

在本地采用validate_on_lfw.py,验证20190701-173059（triplet_loss）时，Accuracy: 0.950+-0.009；

在本地采用validate_on_lfw.py,验证之前训练的模型，Accuracy: 0.939+-0.005；

在本地采用validate_on_lfw.py,验证20190701-173059（triplet_loss）时，用筛选之后的图片，Accuracy: 0.966+-0.004；

在本地采用validate_on_lfw.py,验证20190701-173059（triplet_loss）训练140轮之后的qu时，权重文件时，在筛选之后的500个id上，Accuracy: 0.984+-0.005；

2019/07/02

截止到今天服务器上一共有图片142万张（1426176），学生数目7万（70892）

2019/07/03

服务器上的图片，进行选择时，将人脸区域的大小限制为124*124时，符合此条件的图片大约是17%；再限制全部关键点以及头部角度（-10，10）会减少4%

服务器上的图片，进行选择时，将人脸区域的大小限制为86*86时，符合此条件的图片大约是66%；再限制全部关键点以及头部角度（-10，10）会减少4%；

在服务器上，调整脸部区域面积为90*112时，筛出率为83.5左右，筛出id一共1000个，6000个问答，使用权重文件20190701-173059的正确率是0.96900+-0.00549；

在本机上，调整脸部区域面积为90*112时，筛出率为83.5左右，筛出id一共1000个，6000个问答，使用权重文件20190701-173059的正确率是0.967+-0.005；

在服务器上，对triplt损失函数训练400轮之后的20190701-193246，对之前按照124*124的标准筛选出的数据测试的结果是0.99217+-0.00373；

在服务器上，对triplt损失函数训练400轮之后的20190701-193246之后，对未进行筛选的hf_tmp的数据测试的结果是0.97533+-0.00666；

在服务器上，对triplt损失函数训练400轮之后的20190701-193246之后，对按照90*112的标准筛选出的数据测试的结果是0.99117+-0.00308；

在本机，对triplt损失函数训练400轮之后的20190701-193246之后，对按照124*124的标准筛选出的数据测试的结果是0.987+-0.004；在没有经过筛选的数据上测试的0.964+-0.008；

在服务器上，对triplt损失函数训练500轮之后的20190701-193246，对之前按照124*124的标准筛选出的hf_tmp_after_select数据测试的结果是0.98300+-0.00427；

在服务器上，对triplt损失函数训练500轮之后的20190701-193246，对之前按照90*112的标准筛选出的hf_tmp_after_select1数据测试的结果是 0.98183+-0.00647；

2019/07/04

根据筛选规则的结果统计

id	notes	good or bad
115505	遮挡导致选择的脸不是最大的最清楚的	0
115529		1
115544		1
		1
199833	有遮挡	1
		1
		1
		1

2019/07/05

服务器上截止到今天积累的图片150万（1502914）,id数目72k(72461)

2019/07/09

服务器上图片的数量152万（1526953），id数目73k（72979），平均每个人20张图片；

警方给出寻找跟某个罪犯比较相似的会按照相似度给出TOP K（K值一般是十、几十或者100）个相似的预测；

CASE:假设一共10个罪犯，安防搜索100万次，底库有10万，总共系统报警100此，确认9个嫌疑犯；

召回率：10个罪犯出现，抓到了9个，不考虑报警了多少次，召回率90%；

误报率：误报91次，一共搜索100w*10w次，误报率：91/(100w*10w)约为10亿分之一

影响人脸识别效果的一些因素：

（1）数据收集、数据清洗、数据分布不平衡；

（2）domin问题（监控/手机自拍/证件照/黑白）

（3）分辨率、侧脸、遮挡、光照、模糊、跨年龄段等极端情形的改进；

（4）loss设计；

（5）超大规模模型训练；

（6）模型压缩（distilling、int8等；

（7）模型评测；

（8）检测/Alignment准确性；

（9）视频流中人脸跟踪的稳定性，人脸的抓拍质量；

（10）视频中人脸多帧融合

（11）........

2019/07/10

查了服务器上老师的数量1.2万（12406），图片数量62万（624453）

人脸识别常用的测试数据集：

LFW:5K名人，6k对人脸比对；（量小，有饱和趋势）

MeGaface：在100万干扰项中找到目标人脸；（存在一些噪声数据，正样本人脸对的数量有限）目前在筛除噪声之后，精度已经刷到了98.998%;筛除噪声之前（iBUG_DeepInsight）数据集，达到精度98.063%；

类内噪声：同一个id下不是一个人的图片；

类间噪声：同一个id被分到了不同id下面；

如何解决类别分布不平衡和跨domin的问题（因为不同种族人脸之间的距离不同），留待学术人员研究；

类内图片的差异：

戴眼镜、模糊、遮挡、黑白、侧脸、跨年龄、化妆；

关于数据：

gallery set:参考图像集 | probe set ：测试图像集； | quarery set：也就是做真实情况时候的数据（个人理解）

千亿级别人脸识别模型测试，上传编码之后的文件：http://trillionpairs.deepglint.com/overview

这里有一个非常好的人脸识别的综述：https://www.cnblogs.com/shouhuxianjian/p/9789243.html

大致理一下近几年常用的人脸识别的数据集：

时间	名字	人数	图片量	备注
2007	LFW(labled face in wild)	5K	13k	最早的非约束场景下的人脸识别测试数据集
2014	CASIA WebFace	10k	500k	大规模公开训练集，平均50
2016	VGGFace	2.6k	2.6M	训练集，平均1000
2018	MS-celeb-1M	100k	10M	训练集，平均100，特点：广，化妆，每个id图像的数量都逼近100张；
2018	Megaface	670k	4.7M	训练集，平均7，特点：日常
2018	VGGFace2	9k	3.3M	训练集，平均366，特点：深，每个Id下最少3张图片，最多2469图片；

（1）Cao在VGGFace2和MS-celeb1-M上进行模型训练并做了系统性研究，并发现首先在MS-celeb-1M(广度)上训练然后在VGGFace2(深度)进行微调可以得到最优的结果。

（2）数据偏置问题：数据集存在差距，例如Megaface是日常场景，而VGGface2和Ms-celeb-1M的场景是化了妆的场景，这种数据

2019/07/15

FRVT比赛中，格灵深瞳的比赛经验总结：https://zhuanlan.zhihu.com/p/72518307

训练模型的过程：

根据以往的经验，在这个特定的比赛任务上，不断的试验：

（1）各种模型优化策略；

（2）数据集融合策略；

（3）调整和尝试各种模型结构；

（4）调整超参数、迭代次数、损失函数、等等；

混合精度训练：

单精度：32位浮点数；

半精度：16位浮点数；

大多数的深度学习模型使用的是32位浮点数（fp32）进行训练，而混合精度训练的方法，通过16位浮点数的方法（fp16）进行深度学习模型训练，从而减少训练深度学习模型所需要的内存，同时由于fp16的运算比fp32更快，从而也进一步提高了硬件效率。

深度学习模型的计算任务分为训练和推理，训练往往是放在云端或者超算集群中，利用GPU强大的浮点数计算能力，来完成网络模型参数的学习过程。一般来说训练时，计算资源往往非常充足，基本上受限于显存资源/多节点扩展/通讯库效率的问题。相对于训练过程，推理往往被应用于终端设备，如手机，计算资源/功耗都收到严格的限制，为了解决这样的问题，提出了很多不同的方法来减少模型的大小以及所需的计算资源/存储资源。模型压缩除了剪枝以外，还有一个方法就是降低模型参数的数值精度。随着网络深度的加大，带来的参数数量也呈现指数级增长，如何将最终学习好的网络模型塞入到终端设备有限的空间中是目前很多性能优良的网络真正应用到日常生活中的一大阻碍。

我从此次比赛经验学到的：

（1）基于insightface的baseline进行；

（2）修改insightface的网络结构，数据集处理等；

（3）模型剪支、压缩；

2019/07/16

（1）对id_A的每张图片匹配id（P_id_n）（设置阈值），如果这个id_A下面的所有图片都可以跟某个id下面的图片匹配的到；

对id_A的每张图片匹配id（P_id_n）（设置阈值），如果小于这个阈值的id的数目占总数的一半以上，则认为可疑Id

2019/07/17

筛选之后，大约有58%的id下的图片是不超过10张的，51%的图片是不超过9张的

2019/07/18

pkl文件需要二进制读写，json文件是一种能传递基本的数型(int,long,string等)，但不能传递byte类型，即不能进行二进制读写；

所以，同样的内容保存在pkl文件是比保存在json文件所占的内存小的：pkl文件 4.6kb;json文件 11kb;

2019/07/22

服务器上学生id数量：7.3万（73541），图片数量154万（1547419）；

试了本机的4万多pkl一次性读入内存，只占了2.5兆

id:156867 1543839

id:1522295 1316737

2019/07/23

发现用之前训练的模型可能呢能够大概区分不同id;

2019/07/24

将之前本地的id和服务器的合并，学生数量89371 图片数量 1959591

2019/07/25

连蓬勃给的查找的意见：

`view_student`表的先查track_userid相同的，其次查 exam_year sex province_id相同的

2019/07/30

track_userid相同的， exam_year sex province_id相同的数据中，student_id的数量小于1000的，一共12154行，只有343行中的数据满足，至少两个ID的图片是被编码的。

same_by_track_userid_exam_year.txt一共12508行，少于100个的占12173行，100到1000之间的占据170行，1000到10000之间的128行，大于10000的有37行。

2019/07/31

人脸识别的对比：

0<=len(name_list)<100

100<=len(name_list)<1000;60910个id

1000<=len(name_list)<1500：32行，39620个id

排列组合计算公式：

将1000——1500之间的图片结果与face++对比

743个文件夹，聚类时间越1个小时

2019/08/05

insightface人脸识别

2019/08/06

insightface的距离和相似度计算方法：

dis = np.sum(np.square(v1-v2))
sim = np.dot(v1, v2.T)

2019/08/07

人脸检测算法评价标准中，FDDB数据集是一个常用的评价标准，地位类似于人脸识别评价中的LFW数据集。

1.FAR(false accept rate)误识率：本该匹配失败的判别为匹配成功的次数/类间尝试总次数（假冒者尝试的总次数）

2.FRR(false rejection rate)拒识率：本该匹配成功的判别为匹配失败次数/类内匹配总次数（总的匹配成功次数）

3.TRR = 正确拒绝的次数/类间匹配的次数，TRR = 1 - FRR

4.TAR = 正确拒绝的次数/类内匹配的次数,TAR = 1 - FAR；

FAR越高，意味着假冒者被接受的可能性越高，系统安全性越低；

FRR越高，意味着合法用户被拒绝的可能性越高，系统的易用性越低；

因此，强调安全性的场合，例如金融机构，要求较低的FAR，也就是较高的阈值；一般情况下，误识率FAR 随阈值的减小（放宽条件）而增大，拒识率FRR 随阈值的减小而减小。因此，可以采用等错误率（Equal Error Rate, ERR）作为性能指标，即通过调节阈值，使这FAR和FRR两个指标相等时的FAR 或 FRR。

3.Acc(准确率)：（TP+FN）/(TP+FP+FN+TN)

4.Precision（精确度）= TP/(TP+FP)，又名查准率，意为：预测为正样本的实例中，确实是正样本的比例；

5.TPR(true positive rate)将正例分为正类的概率，也称为recall = TP/(TP+FN)，又名查全率，意为：实际是正样本的实例中，被预测为正样本的实例，所占比例；

参考：https://www.cnblogs.com/shinedaisiki/p/10050267.html
https://blog.csdn.net/lijiao1181491631/article/details/54407830

2019/08/14

服务器上学生ID数量89581人，图片数量1968454

2019/09/02

服务器上学生ID数量89649人，图片数量1972431

2019/09/03

服务器上学生ID数量89653人

2019/10/-9

人脸识别中常见的损失函数：softmax，triplet loss, center loss,cosine loss,arcface等；参考资料

人脸识别的baseline是：CNN+softmax

softmax损失函数是使用softmax激活函数加上crossEntropy作为损失函数将线性特征转化为概率。最早的softmax损失函数，不能像metric learning那样显式化类内距离以及类间距离，因此性能不是特别好。另外，人脸识别不只是分类，根源在于得到泛化能力更强的人脸特征。（metric learning概念：根据不同任务，自主学习出针对于某个任务的距离衡量函数）;

triplet loss：与softmax损失函数最小化类内距离，最大化类间距离不同，triplet loss引入样本间距离的概念，直接对样本间距离进行优化，使不同类间样本距离比同类间样本距离大出一个间隔（margin）。在训练样本足够多，模型的表示能力足够强的情况下，triplet loss函数能够学习的很好。但是使用该损失函数的时候，由于过于关注局部，经常出现难以训练且收敛时间长的问题。因此，比较好的训练方式是先使用分类损失函数训练模型，再使用triplet loss进行fine tune来提升模型的效果。

center loss的提出：有些情况下，类内距离比类间距离还要大，该损失函数为每一个类别提出一个类内中心，最小化每个样本与中心的距离。因此center loss是用于压缩类内距离；

cosine loss将人脸的embedding信息归一化，使得类间距离仅取决于余弦夹角，并进一步引入了余弦间隔参数，用于扩大类间距，缩小类内距离，同时，由于，余弦角范围较小，为了扩大类间距离，是的类间距离更显著，引入超参数，来放大余弦距离。

arcface是为了使得embedding的表示更加符合超球体流行假设，将cosine loss的余弦距离改为角度距离。

你可能感兴趣的:(人脸算法项目)

关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
OC语言多界面传值五大方式 Magnetic_h ios ui 学习 objective-c 开发语言
前言在完成暑假仿写项目时，遇到了许多需要用到多界面传值的地方，这篇博客来总结一下比较常用的五种多界面传值的方式。属性传值属性传值一般用前一个界面向后一个界面传值，简单地说就是通过访问后一个视图控制器的属性来为它赋值，通过这个属性来做到从前一个界面向后一个界面传值。首先在后一个界面中定义属性@interfaceBViewController:UIViewController@propertyNSSt
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
如何在 Fork 的 GitHub 项目中保留自己的修改并同步上游更新？github_fork_update iBaoxing github
如何在Fork的GitHub项目中保留自己的修改并同步上游更新？在GitHub上Fork了一个项目后，你可能会对项目进行一些修改，同时原作者也在不断更新。如果想要在保留自己修改的基础上，同步原作者的最新更新，很多人会不知所措。本文将详细讲解如何在不丢失自己改动的情况下，将上游仓库的更新合并到自己的仓库中。问题描述假设你在GitHub上Fork了一个项目，并基于该项目做了一些修改，随后你发现原作者对
抖音乐买买怎么加入赚钱?赚钱方法是什么测评君高省
你会在抖音买东西吗?如果会，那么一定要免费注册一个乐买买，抖音直播间，橱窗，小视频里的小黄车买东西都可以返佣金!省下来都是自己的，分享还可以赚钱乐买买是好省旗下的抖音返佣平台，乐买买分析社交电商的价值，乐买买属于今年难得的副业项目风口机会，2019年错过做好省的搞钱的黄金时期，那么2022年千万别再错过乐买买至于我为何转到高省呢？当然是高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
git - Webhook让部署自动化大猪大猪
我们现在有一个需求，将项目打包上传到gitlab或者github后，程序能自动部署，不用手动地去服务器中进行项目更新并运行，如何做到？这里我们可以使用gitlab与github的挂钩，挂钩的原理就是，每当我们有请求到gitlab与github服务器时，这时他俩会根据我们配置的挂钩地扯进行访问，webhook挂钩程序会一直监听着某个端口请求，一但收到他们发过来的请求，这时就知道用户有请求提交了，这时
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
Faiss Tips：高效向量搜索与聚类的利器焦习娜Samantha
FaissTips：高效向量搜索与聚类的利器faiss_tipsSomeusefultipsforfaiss项目地址:https://gitcode.com/gh_mirrors/fa/faiss_tips项目介绍Faiss是由FacebookAIResearch开发的一个用于高效相似性搜索和密集向量聚类的库。它支持多种硬件平台，包括CPU和GPU，能够在海量数据集上实现快速的近似最近邻搜索（AN
冬天短期的暴利小生意有哪些？那些小生意适合新手做？一起高省
短期生意不失为创业的一个商机，不过短期生意的商机是转瞬即逝的，而且这类生意也很难作为长期的生意去做，那冬天短期暴利小生意查看更多关于短期暴利小生意的文章有哪些呢?给大家先推荐一个2023年风口项目吧，真很不错的项目，全程零投资，当做副业来做真的很稳定，不管你什么阶层的人，或多或少都网购吧？你们知道网购是可以拿提成，拿返利，拿分佣的吗？你们知道很多优惠券群里面，天天群主和管理发一些商品吗？他们其实在
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
高级 ECharts 技巧：自定义图表主题与样式 SnowMan1993 echarts 信息可视化数据分析
ECharts是一个强大的数据可视化库，提供了多种内置主题和样式，但你也可以根据项目的设计需求，自定义图表的主题与样式。本文将介绍如何使用ECharts自定义图表主题，以提升数据可视化的吸引力和一致性。1.什么是ECharts主题？ECharts的主题是指定义图表样式的配置项，包括颜色、字体、线条样式等。通过预设主题，你可以快速更改图表的整体风格，而自定义主题则允许你在此基础上进行个性化设置。2.
01-Git初识 Meereen Git git
01-Git初识概念：一个免费开源，分布式的代码版本控制系统，帮助开发团队维护代码作用：记录代码内容。切换代码版本，多人开发时高效合并代码内容如何学：个人本机使用：Git基础命令和概念多人共享使用：团队开发同一个项目的代码版本管理Git配置用户信息配置：用户名和邮箱，应用在每次提交代码版本时表明自己的身份命令：查看git版本号git-v配置用户名gitconfig--globaluser.name
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
果然只有离职的时候，才有人敢说真话！ return2ok
今天公司出了神贴。今天中午吃饭，同事问我看了论坛上的神贴了吗？什么帖子？我问。同事显得很惊讶，你居然没看，现在那个帖子可能会成为年度最佳帖子。这么厉害？我等不及了，饭没吃完就快速的奔向办公室，打开公司论坛，我要一睹这个帖子的神奇。写这帖子的童鞋胆儿真肥。这哪里是一个帖子，这是很多个帖子，组成了一个系列。某人从公司文化、管理、人事、项目管理等多个方面分析了公司的概况，并抨击了公司的各种弊端，并提出了
如何选择最适合你的项目研发管理软件？TAPD卓越版全面解析北京云巴巴信息技术有限公司产品经理需求分析
在当今快速发展的科技时代，项目研发管理软件已成为企业不可或缺的重要工具。面对市场上琳琅满目的产品，如何选择一款适合自己团队的项目研发管理软件呢？本文将围绕项目研发管理软件的选择标准，重点介绍TAPD卓越版的特点、优势以及使用体验，让你更好地理解和选择适合自己的项目研发管理软件。项目研发管理软件的选择标准在选择项目研发管理软件时，我们需要考虑以下几个方面的因素：功能全面性：软件是否覆盖了从需求管理、
OPENAIGC开发者大赛企业组AI黑马奖 | AIGC数智传媒解决方案 RPA中国人工智能 AIGC 传媒
在第二届拯救者杯OPENAIGC开发者大赛中，涌现出一批技术突出、创意卓越的作品。为了让这些优秀项目被更多人看到，我们特意开设了优秀作品报道专栏，旨在展示其独特之处和开发者的精彩故事。无论您是技术专家还是爱好者，希望能带给您不一样的知识和启发。让我们一起探索AIGC的无限可能，见证科技与创意的完美融合！创未来AI应用赛-企业组AI黑马奖作品名称：AIGC数智传媒解决方案参赛团队：深圳市三象智能技术
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
数据结构 | 栈和队列 TT-Kun 数据结构与算法数据结构栈队列 C语言
文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
快乐春节 Lilywo
春节肯定是大多小朋友都喜欢的节日吧，因为春节的娱乐项目可多啦，下面我就带大家去看一看某些娱乐项目吧！第一件肯定就是穿新衣啦！因为辞旧迎新，一年过去了，要迎来新的一年。所以过年穿新衣也是一项习俗吧；第二件，收压岁钱。压岁钱大家都知道吧，过年的时候，小朋友们肯定都会受到大人们的压岁钱吧，对啦！大家知道为什么亲人们会给我们压岁钱呢？答案是因为亲人们希望我们在新的一年里可以健健康康、平平安安，幸福福的生活
spring如何整合druid连接池？惜.己 spring spring junit 数据库 java idea 后端 xml
目录spring整合druid连接池1.新建maven项目2.新建mavenModule3.导入相关依赖4.配置log4j2.xml5.配置druid.xml1)xml中如何引入properties2)下面是配置文件6.准备jdbc.propertiesJDBC配置项解释7.配置druid8.测试spring整合druid连接池1.新建maven项目打开IDE（比如IntelliJIDEA,Ecl
[Python] 数据结构详解及代码 AIAdvocate 算法 python 数据结构链表
今日内容大纲介绍数据结构介绍列表链表1.数据结构和算法简介程序大白话翻译,程序=数据结构+算法数据结构指的是存储,组织数据的方式.算法指的是为了解决实际业务问题而思考思路和方法,就叫:算法.2.算法的5大特性介绍算法具有独立性算法是解决问题的思路和方式,最重要的是思维,而不是语言,其(算法)可以通过多种语言进行演绎.5大特性有输入,需要传入1或者多个参数有输出,需要返回1个或者多个结果有穷性,执行
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st