小白学视觉

用OpenCV和深度学习进行年龄识别

点击上方“小白学视觉”，选择加"星标"或“置顶”

重磅干货，第一时间送达

本文转自|机器学习算法那些事

在本教程中，您将学习如何使用OpenCV，深度学习和Python执行年龄的自动识别/预测。

学完本教程后，您将能够以相当高的精确度去自动预测静态图像文件和实时视频中的人物年龄。

要了解如何使用OpenCV和深度学习进行年龄识别，请继续阅读！

用OpenCV和深度学习进行年龄识别

在本教程的第一部分中，您将学习年龄识别，这包括从图片或视频中自动预测人的年龄需要的步骤（以及为什么应该将年龄识别当做分类问题而不是回归问题）。

下面，我们将介绍这个基于深度学习的年龄识别模型，然后学习如何使用这两种模型：

1.静态图像中的年龄识别

2.实时视频中的年龄识别

然后，我们将分析我们所做的年龄预测工作的结果。

什么是年龄识别？

图1：在本教程中，我们使用OpenCV和预先训练的深度学习模型来预测给定人脸的年龄。

年龄识别是仅用人脸的照片去自动识别其年龄的过程

通常，您会看到年龄识别可分为两个阶段进行实现：

1.阶段1：检测输入图像/视频中的人脸

2.阶段2：提取人的面部（感兴趣区域，ROI），并通过年龄检测器的算法去预测人物的年龄

对于阶段1，能够为图片中的人脸生成边框的人脸检测器都是可用的，这些检测器包括但不限于Haar cascades，HOG+线性SVM，单杆检测器（SSD）等。

使用哪种人脸检测器取决于您的项目：

Haar cascades速度很快，并且能够在嵌入式设备上实时运行，存在的问题是它们的准确度较低并且极易出现假阳性检测。
HOG+线性SVM模型比Haar cascades更精确，但速度较慢。它们对遮挡（即部分面部可见）或视角变化（即面部的不同视图）的容错性也较低。
基于深度学习的人脸检测器功能最为强大，它提供了最高的准确度，但比Haar cascades和HOG+线性SVM需要更多的计算资源。

在为您的应用选择人脸检测器时，请花点时间考虑您的项目需求——速度或准确性，哪个对您更加重要？我还建议对每个面部检测器进行一些试验，以便让这些结果来指导您做决定。

一旦您的面部检测器在图像/视频中生成了人脸的边界框坐标，您就可以进入第2阶段——识别人的年龄。

确定了脸部的边界框坐标（x，y）后，您首先提取面部ROI，而忽略图像（帧）的其余部分。这样做可以使年龄检测器仅将注意力放在人脸上，而不是图像中其他不相关的“噪点”。

然后将面部ROI传递给模型，从而得到实际的年龄预测。

年龄检测器的算法有很多，但是最受欢迎的是基于深度学习的年龄检测器——在本教程中，我们将使用这种基于深度学习的年龄检测器。

我们基于深度学习的年龄检测器模型

图2：用深度学习进行年龄识别是一个活跃的研究领域。在本教程中，我们使用由Levi和Hassner在其2015年论文中构建和训练的模型

我们在这里使用的深度学习年龄检测器模型是Levi和Hassner在其2015年发表的《使用卷积神经网络进行年龄和性别分类》（https://talhassner.github.io/home/publication/2015_CVPR）中构建和训练的。

在这篇论文里，作者提出了一个类似AlexNet的简单体系，该体系总共学习了8个年龄段：

您可能会注意到这些年龄段是不连续的——这是有意而为的，因为用于训练模型的Adience数据集(https://talhassner.github.io/home/projects/Adience/Adience-data.html#agegender)定义了年龄段（我们将在下一节中介绍为什么这样做）。

在这篇文章中，我们将使用预先训练的年龄检测器模型。但是如果您有兴趣学习如何从头开始训练它，请务必阅读《用Python进行计算机视觉深度学习》(https://www.pyimagesearch.com/deep-learning-computer-vision-python-book/)，在那里我将向您展示如何训练。

我们为什么不将年龄预测看做回归问题？

图3：用深度学习进行年龄预测可以被归类为回归或分类问题。

您会在上面注意到，我们将年龄离散化为“不同的区间”，从而将年龄预测作为分类问题——为什么不将它看做回归问题（我们在房价预测教程中所使用的方法：https://www.pyimagesearch.com/2019/01/28/keras-regression-and-cnns/）？

从技术上讲，没有理由不能将年龄预测看做回归任务。甚至有一些模型可以通过回归来实现。

问题在于年龄预测本质上是主观的，并且仅基于容貌。

一个五十多岁的人一生中从未吸烟，出门总是擦防晒霜，而且每天都要护理皮肤。而一个三十多岁的人一天要抽很多烟，不擦防晒霜去从事体力劳动，并且没有适当的皮肤护理。这个五十岁的人很可能看起来比这个三十岁的人年轻。

而且不要忘记基因是衰老最重要的驱动因素——有些人就是比其他人衰老得慢。

例如，看看下面的Matthew Perry（在电视情景喜剧Friends中扮演Chandler Bing）的图片，并将它与Jennifer Aniston（扮演Rachel Green）的图片进行比较：

图4：许多名人和行业领袖努力使自己看起来更年轻。这对使用OpenCV深度学习进行年龄检测提出了挑战。

您能猜出Matthew Perry（50岁）实际上比Jennifer Aniston（51岁）小一岁吗？

除非您事先了解了关于这些演员的情况，否则我不会相信。

但另一方面，您能猜到这些演员在48-53岁吗？

我愿意打赌您可能有这个能力。

虽然人类天生不擅长预测年龄的准确值，但我们实际上在预测年龄段方面还是不错的。

当然，上面是一个示例。

Jennifer Aniston的基因近乎完美，再加上有非常优秀的整形外科医生，她似乎青春不老。

但这印证了我的观点——人们有意掩饰自己的年龄。

而且，如果人类准确地预测一个人的年龄很困难的话，那么机器肯定也会同样困难。

一旦你将年龄预测看做回归问题，那么对于一个模型，要准确预测人的图像中的年龄值是极困难的。

但是，如果您将其视为分类问题，为模型定义了年龄段，那么我们的年龄预测模型将更容易训练，通常会比基于回归的预测提供更高的准确性。

简而言之：将年龄预测看做分类问题可以极大地“缓解”问题，使其更容易解决——通常我们不需要一个人的确切年龄；粗略的估计就足够了。

项目结构

请确保从本文的“下载”部分中获取代码，模型和图片。提取文件后，您的项目将如下所示：

前两个目录由年龄预测器和面部检测器组成。这两个深度学习模型都基于Caffe。

我提供了三张用于年龄预测的测试图片；您也可以添加自己的图片。

在本教程的其余部分，我们将讨论这两个Python脚本：

detect_age.py：图片年龄预测
detect_age_video.py：视频年龄预测

这些脚本都会检测图片/帧中的人脸，然后使用OpenCV对它们进行年龄预测。

运行我们的OpenCV图像年龄检测器

让我们开始在静态图像中使用OpenCV进行年龄检测。

在您的目录中打开detect_age.py文件，让我们开始工作：

为了启动我们的年龄检测器脚本，我们先导入NumPy和OpenCV。我建议查看我的pip install opencv教程（https://www.pyimagesearch.com/2018/09/19/pip-install-opencv/）来配置您的系统。

此外，我们需要导入Python内置的os模块，它可以添加模型所需的路径。

最后，我们导入argparse来解析命令行参数（https://www.pyimagesearch.com/2018/03/12/python-argparse-command-line-arguments/）。

我们的脚本需要四个命令行参数：

·--图片：提供为年龄检测输入图像的路径

·--人脸：为预先训练的面部检测器模型提供路径

·--年龄：预先训练的年龄探测器模型

·--置信度：最小概率阈值，以便筛除低置信检测

如上所述，我们的年龄检测器是一种分类器，可以根据预定义的年龄分段，通过人的面部ROI预测这个人的年龄——我们不会将其视为回归问题。现在让我们定义这些年龄段的bucket：

我们的年龄是在预先训练好的年龄检测器的bucket（即类别标签）中定义的。我们将使用此列表和相关的索引来获取年龄段，从而在输出的图像上进行注释。

完成了导入，命令行参数和年龄段的设置，我们现在就可以加载两个预先训练的模型：

在这里，我们加载两个模型：

·我们的人脸检测器可以找到并定位图片中的人脸（第25-28行）

·年龄分类器确定特定面孔所属的年龄范围（第32-34行）

这些模型均使用Caffe框架进行了训练。我在PyImageSearch Gurus课程（https://www.pyimagesearch.com/pyimagesearch-gurus/）中介绍了如何训练Caffe分类器。

现在我们已经完成了所有初始化，让我们从磁盘加载图像并检测面部ROI：

37-40行加载并预处理了我们输入的图像。我们使用OpenCV的blobFromImage方法——请在我的教程（https://www.pyimagesearch.com/2017/11/06/deep-learning-opencvs-blobfromimage-works/）中阅读有关blobFromImage的更多信息。

为了检测图片中的人脸，我们通过CNN传送blob，得到了detections的列表。现在让我们循环面部ROI的检测：

当我们循环detections时，我们清除了低置信度的面部（第51-55行）。

对于满足了最低置信度标准的面部，我们提取它们的ROI坐标（第58-63行）。现在，我们在仅包含单个面部的图像中有了小小收获。我们在第64-66行根据此ROI创建一个blob（即faceBlob）。

现在，我们将进行年龄识别：

我们使用face blob进行年龄预测（第70-74行），从而得出年龄段和年龄的置信度。我们使用这些数据点以及面部ROI的坐标来注释最初输入的图片（第77-86行）并显示结果（第89和90行）。

在下一部分中，我们将分析结果。

OpenCV的年龄识别结果

让我们运行OpenCV年龄检测器。

首先，从本教程的“下载”部分下载源代码，预先训练的年龄检测器模型及示例图像。

从那里打开一个终端，然后执行以下命令：

图5：在我30岁时的照片中，该OpenCV年龄检测器正确识别了我的年龄。

在这里，您可以看到我们的OpenCV年龄检测器以57.51％的置信度预测了我的年龄为25-32岁——实际上，该年龄检测器是正确的（我拍摄这张照片时是30岁）。

让我们再举一个例子，这是著名演员Neil Patrick Harris小时候的照片：

图6：使用OpenCV进行年龄预测时，可以很确定地认为拍摄这张照片时的Neil Patrick Harris是8-12岁。

我们的年龄预测值又是正确的——拍摄这张照片时，Nat Patrick Harris看起来的确在8-12岁年龄段中的某个年龄。

让我们尝试另一张图片；这张图是Samuel L. Jackson，他是我最喜欢的演员之一：

图7：使用OpenCV通过深度学习进行年龄预测并不总是准确的，正如Samuel L. Jackson的照片所证明的那样。年龄预测只是一个软件，对人类来说是主观的。

这里我们的OpenCV年龄检测器出错了——Samuel L. Jackson大约71岁，这使我们的年龄预测大约有了18岁的偏差。

也就是说，仅仅看照片——Jackson先生看上去像71岁吗？

我的猜测应该是50到60岁左右。至少对我来说，他不像70岁多一点的男人。

但这恰恰印证了我在前文提出的观点：

用视觉进行年龄预测的过程很困难，当计算机或人试图猜测某人的年龄时，我认为这是主观的。

为了评估年龄检测器，您不能依赖人的实际年龄去评价。相反，您需要衡量预测年龄和感知年龄之间的准确度。

为实时视频运行我们的OpenCV年龄检测器

现在我们可以在静态图像中实现年龄检测，但实时视频可以吗？

我们可以这样做吗？

您应该猜我们可以。我们的视频脚本与图像脚本非常相似。不同之处在于，我们需要设置视频流并在每个帧上循环进行年龄检测。本文将重点介绍视频功能，因此请根据需要参考上面的流程。

要了解如何在视频中进行年龄识别，那就来看看detect_age_video.py。

我们需要导入三个新的模块：（1）VideoStream (2)imutils (3)time。这些导入允许我们对视频进行设置和使用webcam功能。

我决定定义一个快捷函数来获取帧，定位面部并预测年龄。函数通过进行检测和逻辑预测，使我们的帧处理循环不会那么庞大（您也可以将此函数放到单独的文件中）。现在让我们进入这个程序：

我们的 detect_and_predict_age 辅助函数接受以下参数：

frame：视频通过webcam获取的单个帧
faceNet：初始化的深度学习人脸检测器
ageNet：初始化的深度学习年龄分类器
minConf：筛去较差人脸识别的置信度阈值

这里的参数和我们的图片年龄检测器脚本的命令行参数是相似的。

我们的AGE_BUCKETS再次被定义（第12和13行）。

然后我们定义一个空列表来保存面部定位和年龄检测的结果。

第20-26行进行面部检测。

接下来，我们将处理每个detections：

请看29-43行——它们循环检测，以确保较高的置信度，然后提取出面部ROI。

第46-47行是新的——由于以下两个原因，我们要确保视频中的面部ROI足够大：

·首先，我们要筛掉帧中检测到的假阳性面部。

·其次，年龄分类结果对于远离相机的脸（即脸部很小）来说并不准确。

为了完成我们的辅助功能，我们将进行年龄识别并返回结果：

在这里，我们预测人脸的年龄并提取出年龄段和年龄置信度（第56-60行）。

第65-68行在一个字典中存储面部定位和年龄预测。循环检测的最后一步是将该字典放到结果列表中（第69行）。

如果所有检测都已经完成，并且结果都得到了，那我们将结果返回给调用者。

定义好辅助函数后，现在我们可以继续处理视频了。但我们需要先定义命令行参数：

我们的脚本需要三个命令行参数：

·--face：预先训练的面部检测器模型的目录的路径

·--age：预先训练的年龄检测器模型的目录

·--confidence：最小概率阈值，以便筛除低置信检测

在这里，我们将加载模型并初始化视频：

第86-89行加载并初始化了我们的面部检测器，而第93-95行加载了年龄检测器。

然后，我们使用VideoStream类来初始化webcam（第99和100行）。

webcam准备好后，我们将开始处理帧：

在上面的循环中，我们：

获取帧，并将其调整为已知宽度（第106和107行）
通过我们的detect_and_predict_age便捷函数传递帧，以便（1）检测面部（2）确定年龄（第111和112行）
在帧上注释结果（第115-124行）
显示和捕获键盘输入（第127和128行）
如果键入q，那么退出并清空（第131-136行）

在下一节中，我们将启动年龄检测器，看看它是否有效！

使用OpenCV进行实时年龄检测的结果

现在，让我们将OpenCV年龄检测器应用于实时视频。

确保您已从本教程的“下载”部分下载源代码和预先训练的年龄检测器。

从那里打开一个终端，然后输入以下命令：

在这里，您可以看到OpenCV年龄检测器将我的年龄范围准确地预测为25-32岁（在写本文时，我还是31岁）。

如何改善年龄预测结果？

由Levi和Hassner训练的年龄预测模型的问题之一是，它严重偏向25-32岁年龄组，如他们原始版本（https://talhassner.github.io/home/projects/cnn_agegender/CVPR2015_CNN_AgeGenderEstimation.pdf）中的这个混淆矩阵表所示：

图8：Levi和Hassner的深度学习年龄检测模型严重偏向25-32岁年龄段。为了在您的模型中解决此问题，请考虑收集更多的训练数据，使用类权重、数据扩充和正则化技术。（图片来源https://talhassner.github.io/home/projects/cnn_agegender/CVPR2015_CNN_AgeGenderEstimation.pdf）

不幸的是，这意味着我们的模型预测的25-32岁结果可能实际上属于其他的年龄段——我在分析本教程的结果以及我自己的年龄预测中也遇到了几次这样的情况。

您可以通过以下方法消除这种偏差：

1 收集其他年龄段的额外训练数据以帮助平衡数据集

2 使用类权重来处理类失衡的问题

3 注意数据扩充

4 训练模型时使用正则化

其次，年龄预测结果可以通过使用人脸对齐（https://www.pyimagesearch.com/2017/05/22/face-alignment-with-opencv-and-python/）来改善。

人脸对齐功能会识别人脸的几何结构，然后尝试使用平移，缩放和旋转获得人脸的规范化。

在许多情况下（但并非总是如此），人脸对齐可以改善面部应用的效果，包括面部识别，年龄预测等。

为简单起见，我们在本教程中没有使用人脸对齐功能，但是您可以按照这个教程（https://www.pyimagesearch.com/2017/05/22/face-alignment-with-opencv-and-python/）学习有关人脸对齐的更多信息，然后将其应用于自己的年龄预测程序中。

性别预测呢？

我特意选择不在本教程中介绍性别预测。

使用计算机视觉和深度学习来识别一个人的性别似乎是一个有趣的分类问题，但实际上这是一个道德问题。

某人在视觉上看上去怎样，穿着什么或如何表现，这些都并不意味着他们可能是某种（或其他）性别。

试图将性别划分为两类的软件只会把我们束缚在对于性别的过时观念里。因此，我鼓励您尽可能不要在自己的程序中使用性别识别。

如果必须进行性别识别，请确保对自己负责，并确保您不去创建使他人遵循性别偏见的应用程序（例如根据感知到的性别去定义用户体验）。

性别识别几乎没有价值，而且它引起的问题比它解决的问题还要多。请尽可能避免它。

总结

在本教程中，您学习了如何使用OpenCV通过深度学习进行年龄识别。

为此，我们利用了Levi和Hassner在2015年出版的《使用卷积神经网络进行年龄和性别分类》中的预训练模型。该模型使我们能够以相当高的准确度去预测八个不同的年龄段；但是，我们必须认识到年龄预测是一个很有挑战性的问题。

有很多因素可以决定一个人的视觉年龄，包括他们的生活方式，工作，吸烟习惯，最重要的是基因。其次，请记住，人们试图掩饰自己的年龄——如果人类准确地预测某人的年龄有困难的话，那么机器学习模型同样会有困难。

因此，您必须根据感知年龄（而非实际年龄）去评估所有的年龄预测结果。在您自己的计算机视觉项目中进行年龄识别时，请记住这一点。

End

下载1：OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复：扩展模块中文教程，即可下载全网第一份OpenCV扩展模块教程中文版，涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2：Python视觉实战项目52讲

在「小白学视觉」公众号后台回复：Python视觉实战项目，即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目，助力快速学校计算机视觉。

下载3：OpenCV实战项目20讲

在「小白学视觉」公众号后台回复：OpenCV实战项目20讲，即可下载含有20个基于OpenCV实现20个实战项目，实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流，目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群（以后会逐渐细分），请扫描下面微信号加群，备注：”昵称+学校/公司+研究方向“，例如：”张三 + 上海交大 + 视觉SLAM“。请按照格式备注，否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告，否则会请出群，谢谢理解~

你可能感兴趣的:(编程语言,python,计算机视觉,机器学习,人工智能)

Python-有效字母异位词 m0_37763377 python 哈希算法算法数据结构
一、什么是字母异位词字母异位词‌是指由相同字母组成但排列顺序不同的单词。例如，"eat"、"tea"和"ate"都是字母异位词，因为它们由相同的字母组成，只是排列顺序不同。‌二、思路（一）暴力解法这里可以用两层循环来判断2个字符串的元素是否一样，显然时间复杂度为O(n²），在这里大家可以自己写一下，文章就不再提供演示。（二）哈希表解法1.什么是哈希表？哈希表（HashTable），也称为散列表，是
LeetCode56☞合并区间 fantasy_4 LeetCode刷题 leetcode python java 算法贪心算法
关联LeetCode题号56本题特点贪心本题思路将二维数组排序按照左边界排序。排序后，右边界的大小成为找到局部最大值的关键。由题意合并区间可知，应该取数组的’并集‘，局部最优解推出全局最优解，每次找到局部最大的范围，整体就会合并成一个大区间Python写法defmerge(self,intervals):result=[]iflen(intervals)==0:returnresult#区间集合为
【python】图形用户界面和游戏开发 usp1994 python ui ide
图形用户界面和游戏开发文章目录图形用户界面和游戏开发基于tkinter模块的GUI使用Pygame进行游戏开发制作游戏窗口在窗口中绘图加载图像实现动画效果碰撞检测事件处理基于tkinter模块的GUIGUI是图形用户界面的缩写，图形化的用户界面对使用过计算机的人来说应该都不陌生，在此也无需进行赘述。Python默认的GUI开发模块是tkinter（在Python3以前的版本中名为Tkinter），
【Apache Storm】茉菇 apache storm 大数据
一、Storm简介1、概述官网地址：https://storm.apache.org/index.htmlApacheStorm是一个开源的、分布式的实时计算系统，专为处理流式数据而设计。它能够处理大量数据流并在极低的延迟下提供实时的结果。相比于传统的批处理系统，Storm具有处理无限数据流的能力，支持非常高的可扩展性和容错机制。Storm可以适用于多种编程语言，具有高度的灵活性。2、核心功能分布
Python 爬虫实战：如何爬取小红书数据并进行分析 Python爬虫项目 python 爬虫开发语言 selenium 测试工具
一、引言随着社交电商的崛起，小红书（Xiaohongshu）作为一款结合了社交和电商的应用，吸引了大量年轻用户。用户在平台上分享购物心得、生活经验以及个性化的消费推荐内容，形成了庞大的用户数据与内容生态。因此，如何从小红书获取数据进行分析，成为了数据科学、市场营销和社交媒体研究中的一个重要课题。本文将介绍如何使用Python编写爬虫爬取小红书的数据，分析如何通过小红书的开放API获取用户信息、帖子
Python 常用内建模块-base64 赔罪 Python 系统学习 python 前端 linux
目录base64小结练习base64Base64是一种用64个字符来表示任意二进制数据的方法。用记事本打开exe、jpg、pdf这些文件时，我们都会看到一大堆乱码，因为二进制文件包含很多无法显示和打印的字符，所以，如果要让记事本这样的文本处理软件能处理二进制数据，就需要一个二进制到字符串的转换方法。Base64是一种最常见的二进制编码方法。Base64的原理很简单，首先，准备一个包含64个字符的数
基于python的ansys_基于python的感知机 weixin_39687990 基于python的ansys
一、1、感知机可以描述为一个线性方程，用python的伪代码可表示为：sum(weight_i*x_i)+bias->activation#activation表示激活函数，x_i和weight_i是分别为与当前神经元连接的其它神经元的输入以及连接的权重。bias表示当前神经元的输出阀值(或称偏置)。箭头(->)左边的数据，就是激活函数的输入2、定义激活函数f:deffunc_activator(
python ansys workbench联动_【干货】如何在ANSYS WORKBENCH中关联几何模型和有限元模型... weixin_39644377 python ansys workbench联动
原标题：【干货】如何在ANSYSWORKBENCH中关联几何模型和有限元模型我们都知道，通过诸如HPERMESH这样的有限元网格划分软件得到的模型，在传入ANSYS以后，只包含节点和单元信息。但是当我们在WB中使用模型操作时，有时候需要选择几何特征，如在圆孔面上施加圆柱支撑，而此时对象只有单元节点信息，并无体面线的几何信息，该怎么办呢？显然，处理此问题的有效途径，在于把有限元模型与该有限元模型对应
python ansys workbench联动_如何在ANSYS WORKBENCH中关联几何模型和有限元模型 YUNYA麻麻 python ansys workbench联动
我们都知道，通过诸如HPERMESH这样的有限元网格划分软件得到的模型，在传入ANSYS以后，只包含节点和单元信息。但是当我们在WB中使用模型操作时，有时候需要选择几何特征，如在圆孔面上施加圆柱支撑，而此时对象只有单元节点信息，并无体面线的几何信息，该怎么办呢？显然，处理此问题的有效途径，在于把有限元模型与该有限元模型对应的几何模型进行关联，再一起导入到MECHANICAL中进行分析，则既能够既享
数据增强：扩充数据集提升模型泛化能力 AI天才研究院计算 AI大模型企业级应用开发实战 ChatGPT 计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1.数据增强的重要性在机器学习领域，模型的泛化能力至关重要。一个泛化能力强的模型能够在未见数据上表现良好，而过拟合的模型则会在训练数据上表现出色，但在新数据上表现糟糕。数据增强是一种有效提升模型泛化能力的技术，它通过对现有数据进行各种变换，人为地扩充数据集，从而增加训练数据的数量和多样性。1.2.数据增强的应用场景数据增强广泛应用于各种机器学习任务中，包括：图像识别:对图像进行旋转
数据增强：扩充数据集，提升模型的鲁棒性 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 LLM大模型落地实战指南计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
数据增强：扩充数据集，提升模型的鲁棒性1.背景介绍1.1数据集的重要性在机器学习和深度学习领域中,数据集是训练模型的基础。高质量的数据集对于构建准确、鲁棒的模型至关重要。然而,在现实世界中,获取大量高质量的数据通常是一个巨大的挑战。数据采集过程耗时耗力,而且成本高昂。此外,某些领域的数据存在隐私和安全问题,难以获取。1.2数据集不足的挑战当数据集规模有限时,模型很容易过拟合,无法很好地推广到新的、
在 Ansys Mechanical 中创建等效应力结果并使用 Python 导出到文件 David WangYang 硬件工程
介绍在AnsysMechanical模型中，通常需要对许多实体/曲面体或它们组进行后处理等效应力或总变形等。使用分组在TreeGrouping文件夹中的NamedSelections，可以在Mechanical中编写Python脚本来自动生成结果对象。此外，once可以获取新创建的结果对象，并再次使用Mechanical中的Python脚本将所有结果集的结果导出到.csv文件。在本文中，我们将探讨
Centos离线安装gcc 为什么要做囚徒 linux运维 linux centos linux 运维
文章目录Centos离线安装gcc1.gcc是什么？2.gcc下载地址3.gcc的安装4.安装结果验证Centos离线安装gcc1.gcc是什么？GCC（GNUCompilerCollection）是GNU项目下的开源编译器套件，主要用于将C、C++等编程语言的源代码编译成可执行程序或库2.gcc下载地址gcc整体打包下载地址CentOS-7所有rpm包的仓库地址：bzip2-devel-1.0.
关于使用python进行处理雷达数据笔记六毛驴 python 数据分析
好久不见，甚是想念本人深知这段时间鸽了一篇博（上一篇博），后续会补上的，今天想写一下关于使用python进行TI雷达接收回波数据处理的一些常见问题和解决方法。这也是前几天领导给我布置的任务，所以我将这段时间自己遇到的并且已经解决的问题进行了简单的汇总，也会推荐几本这几天阅读了python书籍。python书籍推荐：python学习手册MarkLutz著（对应python版本3.X，2.X都可）Py
焊接性能分析代码（Python）骑蜗牛上月亮 python 开发语言
welding_performance_data.xls数据文件。welding_strengthtoughness5001052012480855015490953013510115401447075601690018600121500139111578115importpandasaspdimportmatplotlib.pyplotaspltimporttkinterastkfrommatp
从零实现B站视频下载器：Python自动化实战教程木觞清 #编程语言自动化运维
一、项目背景与实现原理1.1B站视频分发机制Bilibili的视频采用音视频分离技术，通过以下方式提升用户体验：动态码率适配（1080P/4K/HDR）分段加载技术（基于M4S格式）内容保护机制（防盗链/签名验证）1.2技术实现路线graphTDA[模拟浏览器请求]-->B[获取加密播放信息]B-->C[解析音视频地址]C-->D[多线程下载]D-->E[FFmpeg合并]二、代码逐层解析2.1请
chatgpt赋能python：Python处理雷达基数据：从入门到实践 lvsetongdao123 ChatGpt python chatgpt 开发语言计算机
Python处理雷达基数据：从入门到实践随着气象技术的不断发展，雷达探测技术已成为当今天气预报和气象研究的主要手段之一。雷达基数据是气象雷达接收到的未经加工的原始数据，因其包含大量天气信息，不仅在天气预报、天气预警等方面得到了广泛应用，还被广泛地用于气象科研和大气环境研究。本文将介绍如何使用Python处理雷达基数据，解析其中的信息，获取有效的天气数据，以及分析和可视化这些数据。雷达基数据格式与处
PyCINRAD 安装和配置指南颜欢钰Edith
PyCINRAD安装和配置指南PyCINRADDecodeCINRAD(ChinaNewGenerationWeatherRadar)dataandvisualize.项目地址:https://gitcode.com/gh_mirrors/py/PyCINRAD1.项目基础介绍和主要编程语言项目基础介绍PyCINRAD是一个开源的气象雷达数据处理和可视化库，专门用于解码中国新一代天气雷达（CINR
使用TensorFlow、OpenCV和Pygame实现图像处理与游戏开发 UwoiGit tensorflow opencv pygame
在本篇文章中，我们将介绍如何结合使用TensorFlow、OpenCV和Pygame来进行图像处理和游戏开发。这三个工具在机器学习、计算机视觉和游戏开发领域都非常流行，并且它们的结合可以提供强大的功能和无限的创造力。我们将逐步介绍如何安装和配置这些工具，并提供相关的源代码示例。安装TensorFlowTensorFlow是一个基于数据流图的开源机器学习框架，提供了丰富的工具和库来构建和训练各种深度
PTA天梯赛PYthon7-10 树的遍历胡同Alley 算法数据结构 python
给定一棵二叉树的后序遍历和中序遍历，请你输出其层序遍历的序列。这里假设键值都是互不相等的正整数。输入格式：输入第一行给出一个正整数N（≤30），是二叉树中结点的个数。第二行给出其后序遍历序列。第三行给出其中序遍历序列。数字间以空格分隔。输出格式：在一行中输出该树的层序遍历的序列。数字间以1个空格分隔，行首尾不得有多余空格。输入样例：723157641234567输出样例：4163572代码长度限制
机器学习之KMeans算法知舟不叙机器学习算法 kmeans
文章目录引言1.KMeans算法简介2.KMeans算法的数学原理3.KMeans算法的步骤3.1初始化簇中心3.2分配数据点3.3更新簇中心3.4停止条件4.KMeans算法的优缺点4.1优点4.2缺点5.KMeans算法的应用场景5.1图像分割5.2市场细分5.3文档聚类5.4异常检测6.Python实现KMeans算法7.总结引言KMeans算法是机器学习中最经典的无监督学习算法之一，广泛应
机器学习流程—数据预处理清洗不二人生机器学习机器学习人工智能数据预处理
文章目录机器学习流程—数据预处理清洗定义问题数据预处理数据加载与展示重复数据处理数据类型空值处理无关特征删除数据分布删除异常值生成标签和特征数据分割机器学习流程—数据预处理清洗数据处理是将数据从给定形式转换为更可用和更理想的形式的任务，即使其更有意义、信息更丰富。使用机器学习算法、数学建模和统计知识，整个过程可以自动化。这个完整过程的输出可以是任何所需的形式，如图形、视频、图表、表格、图像等等，具
MMScan数据集：首个最大的多模态3D场景数据集，包含层次化的语言标注数据集
2024-10-24，由上海人工智能实验室联合多所高校创建了MMScan，这是迄今为止最大的多模态3D场景数据集，包含了层次化的语言标注。数据集的建立，不仅推动了3D场景理解的研究进展，还为训练和评估多模态3D感知模型提供了宝贵的资源。一、研究背景：随着大型语言模型（LLMs）的兴起和与其他数据模态的融合，多模态3D感知因其与物理世界的连接而受到越来越多的关注，并取得了快速进展。然而，现有的数据集
【AI大模型】RAG如何让生成AI更智能？最新方法与优劣深度解析健忘的派大星人工智能语言模型 ai AI大模型 agi RAG 程序员
前言近年来，人工智能技术突飞猛进，尤其是生成式AI，简直像是开了挂一样，各种惊艳的表现让人直呼“未来已来”。根据IDC的研究，生成式AI的市场规模在2022年已经达到了107亿美元，而到2026年，这个数字预计会飙升至326亿美元！不过，尽管生成式AI很强大，但它也并非完美无缺——比如生成内容的质量、准确性和可靠性，依然有提升的空间。这时候，检索增强生成（RAG）技术登场了！RAG的核心思路很简单
Python自动化运维开发系列—CICD项目 weixin_46240874
导语都忘记是什么时候知道python的了，我是搞linux运维的，早先只是知道搞运维必须会shell,要做一些运维自动化的工作，比如实现一些定时备份数据啊、批量执行某个操作啊、写写监控脚本什么的。后来发现工作量大的时候shell开始变慢，实现某个功能使用shell感觉力不从心，听人说python能实现shell能做的一切功能，而且开发效率高，速度快，慢慢的就认识了python,多多少少看点简单的东
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算【超级详细版】 AI筑梦师计算机视觉算法深度学习人工智能机器学习计算机视觉 python
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算1.引言1.1研究背景在计算机视觉、模式识别、医学影像分析和自动驾驶等领域，形状匹配是核心任务之一。然而，现实世界的形状往往存在可变性（Variability），主要体现在以下几个方面：形变（Deformation）：物体可能由于柔性材料、外力作用或生物运动发生非刚性形变。尺度变化（ScaleVariation）：目标形状在不同场景下可能大
每日实战：python爬虫之网页跳转-以某博为例代码CC python爬虫 python 爬虫 pandas 开发语言
一、项目背景与核心需求通过逆向分析微博热榜接口，实现实时热搜数据抓取，重点解决：话题跳转链接参数缺失问题页面数据清洗规范化处理多维度数据采集存储二、网页跳转爬虫实现原理2.1跳转链接生成逻辑原始热搜词→"雷军刚知道柯洁定了SU7Ultra"处理流程：1.添加话题标识→#雷军刚知道柯洁定了SU7Ultra#2.URL编码→%23雷军刚知道柯洁定了SU7Ultra%233.添加搜索参数→&t=31生成
C++与C语言的区别 @haihi c++c语言开发语言
前言本文主要用C语言和C++做对比来学习C++，便于个人理解。C++包含C语言，是对C语言的扩展，在C++中，支持C语言的语法使用，C++是C语言的超集一、C++与C语言的区别C语言简单高效，适合低级系统编程和硬件相关的开发。C++更加灵活、强大，适合大型项目开发，尤其是需要面向对象、代码复用和复杂数据结构的应用。1.编程范式C语言：C是一种过程式编程语言，主要关注函数和过程。程序是通过一系列函数
基于 Python 将 PDF 转 Markdown 并拆解为 JSON，支持自定义标题处理 drebander python pdf json
在日常工作中，我们经常需要将PDF文件转换为可编辑、可结构化的数据格式，比如Markdown和JSON。但实际操作中，自动化工具往往会出现标题识别不准确的问题，尤其是PDF转换过程中，缺乏明确的标题标识。这篇文章将教你如何使用Python将PDF转换为Markdown，并通过自定义规则精准识别标题，最终将内容按标题结构拆解为JSON，方便后续快速检索与使用。1.实现目标将PDF文件转换为Markd
Python 项目自动化与 CI/CD 实践：让部署和发布像开挂一样简单全栈探索者chen python python 自动化 ci/cd 开发语言程序人生性能优化可用性测试
Python项目自动化与CI/CD实践：让部署和发布像开挂一样简单在软件开发的世界里，自动化和持续集成/持续部署（CI/CD）是超级英雄，它们不仅让我们的工作更加高效，还能避免那些令人头疼的手动操作。它们就像开发者的最佳伙伴，随时准备打击bug，拯救开发进度。那么，今天我们就来聊聊怎么在Python项目中玩转自动化和CI/CD，让你从繁琐的手动部署中解脱出来，飞速交付高质量的代码。文章目录什么是C
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p