战争热诚

关键点检测笔记（3）——关键点检测的概念扫盲

　　关键点检测，也被称作关键点定位或关键点对齐（keypoint alignment），在不同的任务中名字可能略有差异。比如，在人脸关键点定位中会被称作facemark alignment，在人体关键点检测中称作pose alignment。通常，它的输入是一张包含目标的图像，比如人脸的图像、人体的图像或手部的图像，输出是一组预先定义好关键点的位置，比如人脸的五官与脸部轮廓、人体的各个关节、手部的各个关节等。

　　在关键点检测中，主要的方法可以分为两类：top-down方法和bottom-up方法。这两种方法在处理多个人体的姿态估计问题时有着不同的策略和流程。除此之外呢，关键点检测还可以根据预测方法的不同分为heatmap-based 和 regression-based两种方法。然后我们了解一下检测的难点等。所以本节课呢，主要是对概念的一些了解，然后下一节就要进入实战了。

1，关键点检测需要解决的问题及其应用场景

　　关键点检测是计算机视觉中的基础研究方向之一，其主要目标是识别图像或视频中物体的关键点，例如人体的关节位置、面部特征点等。这项技术在许多应用中发挥着重要作用，比如人体姿态估计，面部特征检测，手部动作识别等。为了实现高效准确地关键点检测，研究人员需要解决一系列挑战性问题。

1，关键点检测需要解决的问题

　　关键点检测通常涉及以下几个主要问题：

定位准确性： 关键点检测算法需要能够准确地定位物体的关键点，以满足实际应用的需求。算法的精度直接影响到后续任务的效果，如在人体姿态估计中，系统需要准确地标记出关节地位置；在面部特征检测中，则需要准确地标记出眼睛，鼻子，嘴巴等关键部位。
算法鲁棒性： 关键点检测算法需要具有一定的鲁棒性，能够在面对图像中的遮挡、姿态变化、光照变化等情况下仍能准确地检测关键点。
实时性能： 对于许多应用场景，如实时人体姿态跟踪、手势识别等，关键点检测算法需要具有较高的实时性，能够在短时间内完成关键点检测并作出响应。
多人检测： 不同的物体可能具有不同的关键点形态和数量，算法需要能够处理不同种类物体的关键点检测，并具有一定的通用性。在拥挤地场景中，需要同时检测和区分多个个体地关键点。这是非常具有挑战性地，因为个体之间可能存在大量地重叠和交互。
遮挡问题： 在自然场景中，关键点经常会被其他物体或部分遮挡，导致检测困难。关键点检测算法需要在有限的数据条件下表现良好，不仅需要在大规模数据集上训练，还需要能够一些包含大量遮挡地示例，使得模型学会又遮挡地情况下仍然能够检测到关键点。
姿态不变性： 关键点检测算法通常需要具有一定的姿态不变性，能够识别物体在不同姿态下的关键点位置。在真实世界地应用中，图像中的对象可能出现在不同的尺度上。例如远处的人看起来很小，而近处的人看起来很大。这种尺度的变化给关键点检测带来了挑战。

　　解决这些问题需要综合运用计算机视觉、机器学习和深度学习等领域的理论和方法，以及对具体应用场景的理解和分析。随着深度学习技术的发展，我们已经取得了很大的进步，但仍有许多待解决的问题。未来的研究将继续探索新的算法和技术，以提高关键点检测的准确性、鲁棒性和效率。

2，关键点检测的应用领域

　　关键点检测技术作为计算机视觉中的重要组成部分，在诸多领域都有着广泛的应用。从自动驾驶到医学影像分析，从虚拟显示到运行分析，关键点检测都扮演着不可或缺的角色。以下是几个关键点检测技术的主要应用领域。

1，人体姿态估计

应用背景：在人体姿态估计中，关键点通常是指人体的关节位置，例如肩部、肘部、膝盖等。通过检测这些关键点，可以识别和跟踪人体的姿态，从而应用于人体动作识别、运动分析等领域。

应用场景：

健身与康复：在健身和康复治疗中，通过监测患者的姿势，可以提供个性化的指导和反馈。
体育分析：运动员的动作可以通过关键点检测进行分析，以优化技术和战术。
虚拟现实与增强现实：在VR/AR环境中，人体姿态估计可以用于创建更加逼真的交互体验。

2，面部特征识别

应用背景：在面部识别中，关键点通常是指面部的特征点，例如眼睛，鼻子，嘴巴等。通过检测这些关键点，可以进行人脸检测、表情识别、人脸识别等任务。

应用场景：

身份认证：通过面部关键点识别，可以实现安全的身份验证功能。
表情分析：用于情绪识别软件，帮助企业了解消费者的情感反应。
美容应用：通过对面部特征的分析，可以提供个性化的美容建议和服务。

3，手势识别

应用背景：在手势识别中，关键点通常是指手部的关节位置，例如手指的尖端，手掌中心等。通过检测这些关键点，可以识别和跟踪手部的姿态，从而应用于手势控制、手势交互等领域。

应用场景：

智能家居控制：通过手势识别技术，用户可以通过简单的手势来控制家中的智能设备。
游戏交互：在游戏开发中，手势识别可以让玩家通过自然的手势来进行游戏操作。
无障碍技术：对于残障人士来说，手势识别可以作为一种辅助通信手段。

4，医学影像分析

应用背景：在医学图像处理中，关键点可以是指身体器官的特征点，例如心脏的特定区域、肿瘤的位置等。通过检测这些关键点，可以帮助医生进行疾病诊断、手术规划等工作。

应用场景：

肿瘤检测：通过识别肿瘤周围的特征点，帮助医生更准确地诊断肿瘤。
骨骼分析：在X光或CT扫描中，关键点检测可以用于自动测量骨密度或识别骨折位置。
病理学研究：在显微镜图像中识别细胞的关键点，有助于疾病的早期诊断。

5，自动驾驶

应用背景：在自动驾驶技术中，关键点检测可以用于识别道路上的行人、障碍物和其他车辆。

应用场景：

障碍物检测：通过检测道路上行人的关键点，可以提高车辆的安全性。
交通标志识别：识别路标的关键点可以帮助车辆正确地理解和遵守交通规则。

6. 动物行为分析

应用背景：动物行为学研究中，关键点检测可以用来跟踪和分析动物的行为模式。

应用场景：

生态学研究：在野外观察中，通过检测动物的关键点，可以记录它们的活动范围和行为习惯。
农业管理：在农场管理中，通过检测家畜的关键点，可以监控它们的健康状况和行为模式。

关键点检测技术在多个领域都有着广泛的应用前景。随着技术的不断进步，我们可以期待更多的创新应用出现，从而进一步改善人们的生活质量和工作效率。

2，单类别关键点检测和多类别关键点检测（按目标物体的种类数量）

　　在计算机视觉领域中，关键点检测旨在从图像或视频中识别出特定类型的物体及其关键特征点。根据目标物体的种类数量，关键点检测可以分为单类别关键点检测和多类别关键点检测两种类型。这两种方法各有特点，在不同的应用场景下发挥着独特的作用。

1，单类别关键点检测

　　单类别关键点检测是指对某一特定类别的物体进行关键点检测的任务。例如，在人体姿态估计中，只检测人物的身体关键点（如头，肩，肘，膝等）。在面部识别中，可以将所有面部特征点作为单类别关键点。

特点：

针对性强：模型设计时针对特定的物体类别进行优化，因此在该类别上的表现通常较好。
数据集中：训练数据集通常是同一类别的大量标注样本，使得模型可以更深入地学习这一类别的特性。
算法简单：因为只需要处理一类物体，所以算法设计上通常更为简单直观。
应用场景明确：常用于特定场景下的需求，如人体姿态估计、手部关键点检测，动物行为分析等。

应用示例：

人体姿态估计：在健身应用中，通过对人体关键点的检测来评估用户的动作是否标准。
动物行为分析：在生态学研究中，对特定种类动物的行为进行跟踪和分析。

2，多类别关键点检测

　　多类别关键点检测则是指同时对多种类别的物体进行关键点检测的人物，每个物体可能有不同的关键点类别。例如，在多人体姿态估计中，需要检测并定位多个人体的关键位置，每个人体有自己的一组关节位置，因此可以将每个人体的关节位置视为一个独立的关键点类别。

特点

灵活性高：可以同时处理多种类别的物体，适用于更加复杂和多变的应用场景。
数据要求高：训练所需的标注数据更为复杂，需要包含多种类别的物体及相应的关键点信息。
算法复杂度增加：为了同时处理多类物体，算法通常会更加复杂，可能需要使用多级分类和检测策略。
应用场景广泛：适合于需要同时处理多种物体的场景，如自动驾驶中的障碍物检测，即时定位与地图构建等。

应用示例

自动驾驶：在道路上同时检测行人、自行车骑手、汽车等不同物体的关键点，以便更好地理解交通情况。
安防监控：在监控系统中同时检测人、动物等不同类别的物体，用于异常行为的识别

3，单类别和多类别关键点检测的主要区别

数据集差异

单类别：数据集专注于一种类型物体的关键点，标注较为简单且一致。
多类别：数据集包含多种类型物体的关键点，标注更为复杂多样。

模型复杂度

单类别：模型相对简单，专注于单一物体类型的细节。
多类别：模型更为复杂，需要处理不同物体间的差异性和共性。

应用场景

单类别：适用于特定领域或场景，如人体姿态估计、面部表情分析等。
多类别：适用于更为广泛的应用场景，如自动驾驶、智能安防等。

　　单类别关键点通常用于单物体或单类别物体的定位和识别人物。而多类别关键点通常用于多物体或多类别物体的定位和识别人物。在实际应用中，选择使用单类别关键点还是多类别关键点取决于具体的人物需求和场景。

3，top-down方法和Bottom-up方法（按模型分法）

　　现阶段人体姿态识别主流的通常有两个思路：top-down方法和bottom-up方法，这两种方法在处理多个人体的姿态估计问题时有着不同的策略和流程。

1，Top-Down（自上而下）方法

　　Top-down方法首先进行人物检测，然后对每个人物框内的图像进行关键点检测。这种方法的优点在于它能够利用现有的目标检测技术来定位每个人物，从而简化了后续的关键点检测过程。对于每个检测到的人物，可以单独处理，这样可以更加准确地估计关键点地位置。这类方法往往比较慢，但姿态估计准确率较高。目前主流的算法是CPN，Hourglass，CPM，Alpha Pose，HRNet, RMPE, RTMPose等。

步骤

1，目标检测：使用目标检测算法（如Faster RCNN, YOLO, SSD ）先检测出物体，比如人/动物/人脸/椅子等。并获取每个弥补的边界框位置，裁剪出来缩放到固定大小。
2，关键点预测：对于每个检测到的目标，将其边界框内的区域裁剪出来作为输入，然后送入专门训练用于关键点检测的网络中（如Mask RCNN的关键点分支，HRNet或Stacked Hourglass Network）进行计算，关键点检测网络会输出一组热力图，每个热图对应一个关键点的位置，热图上的最高值代表该关键点最可能的位置，通过解码热图得到每个关键点的具体坐标。
3，后处理：对得到的关键点坐标进行非极大值抑制（NMS）等后处理操作，以减少冗余和提高准确u的。可能还需要进一步的矫正步骤，比如使用反向传播调整关键点的位置。

优点：

1，准确性高：由于先进行了精确的目标检测，因此能更准确的定位关键点。

2，灵活性高：可以利用现有的成熟目标检测模型，易于集成和优化。没有复杂地后处理，最后输出就是按照对象分好组地关键点组

3，多目标处理：对多类别多关键点非常友好，算法追加支持地检测类别比较容易，添加新类别支持只需要一阶段地对象检测支持新类别，并添加相应地二阶段关键点检测模型即可，之前已支持地类别不受影响，新加类别对模型性能影响不大。每个目标都可以独立进行关键点检测。

4，多任务兼容性：同一模型可以同时完成目标检测，分割和关键点检测等任务。

缺点：

1，计算复杂度较高：需要进行两次处理（目标检测+关键点检测），增加了计算负担

2，依赖于目标检测的准确性：如果目标检测的准确性不高，可能会导致关键点检测的误差较大

3，速度问题：相对于单阶段方法，Top-down方法的速度较慢，不那么适合实时应用。

4，训练难度：需要同时训练目标检测和关键点检测两个部分，这可能会增加训练的复杂性和时间。

　　Top-down 方法是一种强大的关键点检测手段，尤其适用于需要高精度检测的应用场景。虽然它的计算成本相对较高，但对于那些不需要实时处理或者可以接受一定延迟的应用来说，Top-down 方法仍然是一个很好的选择。随着硬件性能的提升和技术的进步，Top-down 方法的计算效率也在不断提高。

2，Bottom-up（自下而上）方法

　　Bottom-up方法则是先检测所有可能地关键点，然后通过某种关联算法将这些关键点组合成不同地任务。这种方法不需要事先检测人物框，因此可以同时处理密集地人群场景。然而，由于需要解决多个关键点之间地匹配问题，这种方法可能会比较复杂。因为是先检测图像中人体部件，然后将图像中多人人体的部件分别组合成人体，因此这类方法在测试推断的时候往往更快速，准确率稍低。典型的就是COCO2016年人体关键点检测关键Open Pose。

　　网络为单阶段，直接通过网络回归出所有对象地所有关键点，然后将散乱地关键点绑定到各个对象，最终得到不同对象地关键点组。

步骤：

1，关键点检测：使用专门训练的神经网络来预测图像中所有潜在关键点的位置。这些关键点通常是以热图的形式输出，每张热图代表一个关键点的置信度分布。

2，关键点聚类：对于检测到的所有关键点，使用聚类算法（如贪婪聚类，DBSCAN等）来将他们分组为不同的实例。

3，实例关联：对于每个分组的关键点集合，确定他们属于哪个实例，并进行适当的关联。可能会使用一些额外的技术来提高关联的准确性，比如基于图形模型的方法或特定的匹配算法。

4，后处理：对最终的关键点分组结果进行非极大值抑制（NMS）等后处理操作，以减少冗余和提高准确度。可能还需要进一步的校正步骤，比如使用反向传播调整关键点的位置。

优点：

1，处理密集场景的能力：在多人或密集场景中表现优异，因为它不许呀预先进行目标检测

2，计算效率：通常比Top-Down方法更高效，因为它只需要执行一次关键点检测，而不是为每个目标都运行一次

3，灵活性：可以更容易地处理遮挡和重叠地情况，因为它是基于全局视图来检测关键点地。

4，扩展性强：可以轻松扩展到处理多个人物或其他类型地物体。

缺点：

1，关键点聚类地调整：在多人场景中，正确的将关键点聚类到正确地实例是一个难题

2，关联复杂度：关联多个关键点到正确地实例需要复杂地算法，这可能会增加计算复杂度

3，训练数据要求：需要有大量带标签地数据来训练模型，特别是当涉及到多人或多类别地情况

4，后处理难度：后处理阶段可能需要复杂地逻辑来确保正确地关键点分组和关联。

　　 Bottom-up 方法是一种强大且灵活的关键点检测手段，特别适合处理多人或多类别的情况。尽管它在关键点聚类和关联方面存在一些挑战，但随着算法的不断进步和技术的发展，这些问题正在逐步得到解决。Bottom-up 方法因其高效性和在密集场景中的优异表现而在许多实际应用中得到了广泛的应用。

3，bottom-up模式如何将关键点绑定到不同对象

　　常见地将关键点检测绑定到不同对象有两种方法。一种是利用关键点之间地先验关系：比如人地脚和膝盖，图像上就可以看出他们是有关联地。通过构建两个关键点之间地向量场或者别的手段就能判定两个关键点为同一个对象。代表算法有OpenPose， PersonLab， PifPaf等。

　　另一种方法就是直接通过loss回归每个关键点属于哪个对象：回归一张tag图，每个关键点有一个值，不同对象值相差大，同一对象相差小。

4，heatmap-based 和 Regression-based（按预测分法）

　　除了上述地top-down和bottom-up方法之外，关键点检测还可以根据预测方式地不同分为 heatmap-based 和 regression-based 两种方法。二者主要区别在于监督信息的不同，Heatmap-based方法监督模型学习的是高斯概率分布图，即把Ground Truth中每个点渲染成一张高斯热图，最终网络输出为K张特征图对应K个关键点，然后通过argmax或soft-argmax来获取最大值点作为估计结果。这种方法由于需要渲染高斯热图，且由于热图中的最值点直接对应了结果，不可避免的需要维持一个相对高分辨率的热图（常见的是64*64，再小的画误差下界过大会造成严重的精度损失），因此也就自然而然导致了很大的计算量和内存开销。

1，headmap-based

　　Heatmap-based 方法是一种广泛应用于关键点检测地技术，尤其是在人体姿态估计，面部特征点检测等领域有着出色地表现。Heatmap-based 方法的核心思想是利用卷积神经网络（CNN）预测一组热图（heatmaps），每个热图对应于图像中的一个关键点位置。热图中的每个像素值表示该位置包含相应关键点的概率。通过找到热图中的最大响应位置，就可以确定关键点的确切坐标。简单说就是针对每个关键点预测一张热力图（预测出现在每个位置地分数）。

工作流程

1，数据预处理：

准备训练数据集，包括原始图像及其关键点的标注信息。
数据增强，例如旋转、缩放和平移等操作，以增加模型的泛化能力。

2，模型构建与训练：

构建CNN架构，例如ResNet、VGG等作为特征提取器。
设计一个全卷积层，用于从特征图生成热图。
训练模型，使用损失函数（如均方误差损失）来最小化预测热图与真实热图之间的差异。

3，关键点检测：

对输入图像进行前向传播，获取预测热图。
对每个热图应用非极大抑制（NMS）来去除重复的峰值。
定位每个热图的最大响应位置作为关键点的坐标。

4，后处理：

对检测到的关键点进行后处理，例如通过平滑滤波器进一步优化位置。
进行实例分割或关联处理，以区分不同对象的关键点。

优点

1，直观易理解：热图直观展示了关键点的可能性分布，便于理解和解释。

2，鲁棒性：能够较好地处理遮挡和光线变化等问题。

3，高精度：通过热图上的精确峰值定位，可以获得较高的检测精度。

4，灵活性：可以容易地适应不同的关键点数量和类型，只需要调整热图的数量即可。

缺点

1，计算资源消耗：生成和处理多个热图需要较大的计算资源，特别是在高清图像上。

2，训练数据要求：需要大量的带有精细标注的训练样本。

3，后处理复杂性：需要额外的步骤来关联不同关键点，特别是在多人或多对象的情况下。

　　Heatmap-based 关键点检测方法因其直观的结果和良好的性能而被广泛应用。虽然存在一些局限性，如计算成本和训练数据需求，但随着技术的进步和计算资源的提升，这些问题正在逐渐得到缓解。未来的研究将继续探索如何改进热图生成的质量、降低计算成本以及提高在复杂场景下的检测效果。

2，Regression-based

　　Regression-based方法则非常简单粗暴，直接监督模型学习坐标值，计算坐标值的L1或L2 loss。由于不需要渲染高斯热图，也不需要维持高分辨率，网络输出的特征图可以很小（比如14x14甚至7x7），拿Resnet-50来举例的话，FLOPs是Heatmap-based方法的两万分之一，这对于计算力较弱的设备（比如手机）是相当友好的，在实际的项目中，也更多地是采用这种方法。常见地方法有DeepPose, MTCNN以及MobileNet等。

工作流程

1，数据准备：

收集包含关键点位置注释的训练数据集。
对数据进行预处理和增强，如翻转、缩放、旋转等，以提高模型的泛化能力。

2，模型设计与训练：

设计一个CNN架构，用于从输入图像中提取特征。
在网络的最后一层添加回归层，用于输出每个关键点的坐标。
使用适当的损失函数（如L1或L2损失）训练模型，以最小化预测坐标与实际坐标的差异。

3，关键点检测：

将待检测图像输入训练好的模型。
模型直接输出每个关键点的位置坐标。
如果需要，可以通过后处理步骤（如阈值过滤或平滑滤波）进一步优化坐标。

4，后处理：

对检测到的关键点进行可能的关联处理，以便正确地分配到不同的对象或实例。

优点

1，高效性：直接输出坐标值，减少了计算热图所需的时间和资源。

2，简单性：模型结构相对简单，易于实现和部署。

3，实时应用：更适合需要快速响应的应用场景，如实时视频流处理。

4，可扩展性：可以轻松地扩展到更多种类的关键点检测任务，只需调整输出层的维度。

缺点

1，精度限制：相比于 Heatmap-based 方法，可能在某些情况下精度较低。

2，泛化能力：可能对未见过的数据或背景变化敏感。

3，坐标量化误差：由于坐标值通常是连续的，直接回归可能会导致量化误差。

　　Regression-based 关键点检测方法因其高效性和简单性而在许多应用中得到广泛应用。尽管在某些方面可能不如 Heatmap-based 方法准确，但它在实时性和资源效率方面的优势使其成为许多场景下的首选方案。随着算法的发展和技术的进步，我们期待 Regression-based 方法在精度和鲁棒性方面取得更大的进步。

你可能感兴趣的:(关键点检测系列,人工智能,深度学习,视觉检测,python)

如何在YashanDB数据库中实现数据模型的简化数据库
在现代数据库技术领域，数据模型的复杂性经常导致性能瓶颈和维护困惑。随着数据规模的增长和业务诉求的增加，复杂的数据结构、冗余的存储和不必要的关联关系都会影响整体数据库的性能和可维护性。特别是在面对动态变化的业务需求时，灵活性和扩展性成为关键因素。YashanDB提供了一系列功能强大的工具和机制，能够有效简化数据模型，提升数据库性能，并增强数据操作的灵活性。本文章旨在为数据库开发者和架构师提供技术洞见
如何在YashanDB数据库中高效处理海量数据数据库
在现代数据库技术中，海量数据的管理和处理成为了一个普遍存在的挑战。随着数据规模的不断扩大，性能瓶颈、数据一致性问题以及易用性需求等问题日益凸显。这些挑战促使企业寻求更为高效的解决方案，以支撑海量数据的存储、分析与挖掘。YashanDB作为一款专为处理海量数据而设计的数据库，凭借其高可扩展性、高并发性能和高可用性，提供了一系列技术手段以应对这些挑战。本文旨在探讨如何在YashanDB中高效地管理和处
如何设计基于YashanDB数据库的高效查询数据库
在当今数据驱动的业务环境中，提高数据库查询性能已经成为各类企业面临的重大挑战。随着数据量的快速增长，许多机构遭遇了性能瓶颈、数据一致性问题和查询响应延迟等一系列问题。在这样的背景下，优化数据库架构、提高查询效率迫在眉睫。本文将集中在YashanDB数据库的查询设计上，提供技术分析和操作指导，以帮助开发人员设计高效的查询策略，实现优越的性能。YashanDB的体系架构YashanDB支持多种部署形态
Python多线程vs多进程：一场关于效率的“宫斗戏“，谁才是你的真命天子？
清晨的咖啡还冒着热气，你盯着监控面板上飙升的CPU使用率，键盘敲出的代码在"多线程"和"多进程"之间反复横跳——这可能是每个Python开发者都会经历的"效率抉择时刻"。当项目从"能跑就行"进化到"必须快跑"，多线程与多进程这对"欢喜冤家"就会跳出来，用各自的"十八般武艺"让你挑花眼。今天咱们就来扒开表象，从底层机制到实战案例，彻底搞懂这对CP的爱恨纠葛。一、GIL：多线程头顶的"紧箍咒"要聊多线
【mongodb】mongodb数据备份与恢复向往风的男子运维日常 DBA mongodb 数据库
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》暂未更新《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》运维日常《l
【优秀文章】7月优秀文章推荐
优秀文章智能自主运动体与人工智能技术——环境感知、SLAM定位、路径规划、运动控制、多智能体协同作者：fpga和matlabC++之红黑树认识与实现作者：zzh_zao【手把手带你刷好题】–C语言基础编程题(十)作者：草莓熊Lotso飞算JavaAI：从“码农”到“代码指挥官”的终极进化论作者：可涵不会debug前端网页开发学习（HTML+CSS+JS）有这一篇就够！作者：一颗小谷粒
蛋白质结构预测/功能注释/交互识别/按需设计，中国海洋大学张树刚团队直击蛋白质智能计算核心任务 hyperai
蛋白质作为生命活动的主要承担者，在人体生理功能中扮演关键角色。然而传统研究面临结构解析成本高昂、功能注释严重滞后、新型蛋白质设计效率低下等挑战。近年来，生命科学对蛋白质复杂特性解析的需求日益迫切，大数据、深度学习、多模态计算等技术的突破性发展，为构建蛋白质智能计算体系提供了全新的发展契机。蛋白质智能计算体系的构建，使得蛋白质在大规模功能注释、交互预测及三维结构建模等领域取得显著成果，为药物发现与生
摄像头各参数的意义_详解：摄像头参数介绍说明序雨摄像头各参数的意义
摄像头的核心是CCD，由于CCD在生产过程中分不同等级和和生产商获得的途径不同，造成CCD的采集效果也不同。一个简单的检测方法，就是将摄像头通电，不接镜头，用手遮住镜头接口，看图像有没有亮点，雪花大不大，然后接上镜头，将摄像头对准一个色彩鲜明的物体，查看器的颜色是否有偏色，图像有无扭曲现象，色彩和灰度是否平滑。由于摄像头的核心部件是CCD，所以其主要参数大多与CCD有关，下面就列出摄像头的主要参数
【心灵鸡汤】深度学习技能形成树：从零基础到AI专家的成长路径全解析智算菩萨人工智能深度学习
引言：技能树的生长哲学在这个人工智能浪潮汹涌的时代，深度学习犹如一棵参天大树，其根系深深扎入数学与计算科学的沃土，主干挺拔地承载着机器学习的核心理念，而枝叶则繁茂地延伸至计算机视觉、自然语言处理、强化学习等各个应用领域。对于初入此领域的新手而言，理解这棵技能树的生长规律，掌握其形成过程中的关键节点和发展阶段，将直接决定其在人工智能道路上能够走多远、攀多高。技能树的概念源于游戏设计，但在学习深度学习
数据存储：使用Python存储数据到redis详解数据知道爬虫和逆向教程 python redis 数据库非关系型数据库
更多内容请见：爬虫和逆向教程-专栏介绍和目录文章目录一.安装相关库和进行连接二、存储数据到Redis2.1存储字符串2.2存储列表2.3存储集合2.4有序集合类型2.5存储哈希三、数据的持久化与过期设置3.1持久化3.2过期设置四、其它操作4.1删除操作4.2关闭连接4.3使用连接池4.4处理异常五、总结在Python中，我们可以使用redis-py库来与Redis数据库进行交互。以下是如何将数据
Python 中的循环小羊苏八 python 开发语言
目录前言一.for循环二.while循环三.break与continue四.循环与else总结前言Python中的循环：for、while、break、continue与循环中的else。在Python中，循环是控制程序流程的重要结构之一。它允许我们重复执行一段代码，直到满足特定条件为止。Python提供了两种主要的循环结构：for循环和while循环。此外，break和continue语句可以用
视觉设计全栈解析：必知的8大核心方向与应用场景
在数字时代，视觉设计早已渗透到生活的方方面面——从手机APP界面到街头广告牌，从书籍的版式到产品的包装，这些统统离不开视觉设计的支撑！所以，了解视觉设计分类，不仅能帮助我们理清设计的边界与应用场景，更能让初学者找到学习的方向，让从业者精准定位创作目标哦。接下来，我们就来详细解析视觉设计分类中的8大常见类型，一起来享受这场视听盛宴吧~一、视觉识别图形设计在视觉设计分类中，视觉识别图形设计是构建品牌形
Python——pyautogui打地鼠游戏自动化脚本（基于图片定位）
以4399小游戏为例：4399游戏网importpyautoguiimportkeyboardimporttimeimportrandomimportloggingfromPILimportImageGrabimportos#配置日志logging.basicConfig(level=logging.INFO,format='%(asctime)s-%(levelname)s-%(message)
模型微调方法Prefix-Tuning ballball~~ 大模型人工智能算法大数据
简介：个人学习分享，如有错误，欢迎批评指正。随着大规模预训练语言模型（如GPT系列、BERT等）的广泛应用，如何高效、经济地针对特定任务对这些模型进行微调（Fine-Tuning）成为研究热点。传统的微调方法通常需要调整模型的大量参数，导致计算资源消耗大、适应新任务的速度慢。为了解决这一问题，Prefix-Tuning（前缀调优）作为一种高效的微调技术被提出，旨在通过引入少量可训练的前缀参数，达到
设计模式系列（10）：结构型模式 - 桥接模式(Bridge)
系列导读：在学习了接口适配后，我们来看如何处理抽象与实现的分离问题。桥接模式解决的是"多维度变化"的设计难题。解决什么问题：将抽象部分与实现部分分离，使它们都可以独立变化。避免在多个维度上变化时出现类爆炸问题。想象一下，你要设计一个图形绘制系统，既要支持不同的形状（圆形、矩形），又要支持不同的绘制方式（Windows绘制、Linux绘制）。如果用继承，你需要WindowsCircle、LinuxC
最小二乘法(OLS)python 实践
参考链接：1，基本原理：https://zhuanlan.zhihu.com/p/1492809412，python实现：https://zhuanlan.zhihu.com/p/22692029实现结果线性回归：#--coding:utf-8--#简单线性回归demoimportnumpyasnpimportmatplotlib.pyplotaspltimportstatsmodels.apia
【Statsmodels和SciPy介绍与常用方法】机器学习司猫白 scipy statsmodels 统计
Statsmodels库介绍与常用方法Statsmodels是一个强大的Python库，专注于统计建模和数据分析，广泛应用于经济学、金融、生物统计等领域。它提供了丰富的统计模型、假设检验和数据探索工具，适合进行回归分析、时间序列分析等任务。本文将介绍Statsmodels的核心功能，并通过代码示例展示其常用方法。Statsmodels简介Statsmodels建立在NumPy和SciPy的基础上，
（五)PS识别：压缩痕迹挖掘-压缩量化表与 DCT 系数分析超龄超能程序猿机器学习 python 图像处理人工智能计算机视觉
（一)PS识别：Python图像分析PS识别之道（二）PS识别：特征识别-直方图分析的从原理到实现（三)PS识别：基于噪声分析PS识别的技术实现（四)PS识别：基于边缘纹理检测分析PS识别的技术实现一介绍本文将介绍一种基于量化表分析和DCT系数分析的图片PS检测方法，帮助你判断图片是否经过处理。二实现原理量化表分析在JPEG图片的压缩过程中，量化表起着关键作用。不同的软件或处理操作可能会改变量化表
Python高频面试题（四） Irene-HQ 测试 python 自动化测试 python 开发语言面试测试工具 github pycharm
以下是Python研发和自动化测试面试中‌更高阶的专项考点及典型问题‌一、并发与异步编程（高级）‌GIL全局解释器锁的应对策略‌问题：GIL如何影响Python多线程性能？如何绕过GIL限制？答案：GIL使同一时刻仅一个线程执行字节码，CPU密集型任务性能受限绕过方案：使用多进程（multiprocessing）、C扩展（如Cython）、异步IO（asyncio）‌46‌协程异步调用示例‌问题：
Python常考面试题汇总（附答案） TT图图面试职场和发展
写在前面本文面向中高级Python开发，太基本的题目不收录。本文只涉及Python相关的面试题，关于网络、MySQL、算法等其他面试必考题会另外开专题整理。不是单纯的提供答案，抵制八股文！！更希望通过代码演示，原理探究等来深入讲解某一知识点，做到融会贯通。部分演示代码也放在了我的github的该目录下。语言基础篇Python的基本数据类型Python3中有六个标准的数据类型：Number（数字）(
JavaScript Math（算数）详解 lsx202406 开发语言
JavaScriptMath（算数）详解引言JavaScriptMath对象是JavaScript内置的一个对象，用于执行基本的数学运算。它提供了一系列的静态方法，使得进行数学运算变得非常简单。本文将详细介绍JavaScriptMath对象的各个方法及其应用。Math对象概述Math对象是一个静态对象，意味着它不能被实例化。它包含了一些数学常量和方法，可以用来执行各种数学运算。Math对象的常量M
Python 编程基础作业总结
本周主要围绕Python基础编程展开了学习，通过一系列的作业题来巩固所学知识。这些题目涵盖了输入输出、条件判断、循环结构等多个基础知识点，下面将对每道作业题进行详细分析。1.计算指定月份第一天是星期几题目描述编写一个程序，接受用户输入的一个年份和一个月份，输出该月份的第一天是星期几。使用蔡乐公式计算星期。提示：使用蔡乐公式计算星期。W=((26*M-2)/10+D+Y+Y/4+C/4-2*C)%7
交叉编译Python-3.6.0到aarch64/aarch32 —— 支持sqlite3
参考https://datko.net/2013/05/10/cross-compiling-python-3-3-1-for-beaglebone-arm-angstrom/平台主机：ubuntu14.0464bit开发板：qemu+aarch64（参考：http://www.cnblogs.com/pengdonglin137/p/6442583.html）工具链：aarch64-linux-
python# python:3.5 aarch64构建镜像 Ling丶落 centos
构建失败从ubuntu中尝试构建FROMpython:3.5-slimLABELMAINTAINER="[email protected]"#installrelatedpackagesENVENVIRONMENTDOCKER_PRODWORKDIR/workCOPY./dataset.py/work/dataset.pyCOPY./model.py/work/model.pyCOPY./PyA
ViP-LLaVA: 使大型多模态模型理解任意视觉提示 AI专题精讲 Paper阅读多模态人工智能 AI
摘要现有的大型视觉-语言多模态模型主要关注整体图像理解，但在实现区域特定的理解方面仍存在显著差距。目前，使用文本坐标或空间编码的方法通常无法为视觉提示提供用户友好的接口。为了解决这个问题，我们提出了一种新颖的多模态模型，能够解码任意（自由形式）视觉提示。这使得用户可以通过自然提示（如“红色边框”或“指向箭头”）直观地标记图像并与模型互动。我们的简单设计直接将视觉标记叠加在RGB图像上，避免了复杂的
opencv-python与opencv-contrib-python的区别联系剑心缘零碎小知识 python opencv
opencv-python包含基本的opencvopencv-contrib-python是高配版，带一些收费或者专利的算法，还有一些比较新的算法的高级版本,这些算法稳定之后会加入上面那个。官网对contrib模块的简介（点击链接跳转）参考链接
【软件系统架构】系列四：设备驱动与板级支持包（BSP） 34号树洞自学软件系统架构系统架构 php 开发语言
目录1.设备驱动是什么？核心功能：关键特性2.板级支持包是什么？核心组成与功能：关键特性3.系统启动流程中的协作4.设备驱动与BSP的关系与区别5.重要性6.开发实践总结核心目标：让操作系统/应用程序能够透明地、高效地使用硬件资源。1.设备驱动是什么？设备驱动是一段软件代码（通常是内核模块或在某些RTOS中作为任务）。它的核心职责是充当特定硬件设备与操作系统内核或应用程序之间的翻译官和控制器。它直
通信算法之278：数据链/自组网通信设备--MIMO(2T2R)-OFDM系统系列--实际工程应用算法代码--1.系统指标需求及帧结构设计秋风战士无线通信基带处理算法 MATLAB仿真软件无线电算法无人机经验分享
MIMO(2T2R)-OFDM系统系列–实际工程应用算法代码第一章：系统指标需求拆解分析第二章：通信系统帧结构设计和OFDM参数设计第三章：通信业务速率设计及理论解调门限第四章：同步序列设计及同步性能仿真验证第五章：数据业务设计及性能仿真验证第六章：信道模型设计第七章：接收关键算法设计及仿真验证第八章：其它待补充本文目录MIMO(2T2R)-OFDM系统系列--实际工程应用算法代码一、实际项目：系
【计算机毕业设计】基于Springboot的办公用品管理系统+LW 枫叶学长(专业接毕设) Java毕业设计实战案例课程设计 spring boot 后端
博主介绍：✌全网粉丝3W+,csdn特邀作者、CSDN新星计划导师、Java领域优质创作者,掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等设计与开发。主要内容：
MongoDB + Voyage AI 详解：重塑数据库与AI的协同范式 csdn_tom_168 NoSQL 数据库 mongodb 人工智能 AI
MongoDB+VoyageAI详解：重塑数据库与AI的协同范式2025年2月，MongoDB官方宣布收购VoyageAI，这一举措标志着数据库与人工智能技术的深度融合迈入新阶段。通过整合VoyageAI的先进AI检索与嵌入模型能力，MongoDB旨在重新定义AI时代的数据库架构，为企业构建智能应用提供端到端的数据基础设施。一、收购背景与技术战略1.行业趋势驱动AI数据挑战：随着生成式AI与大语言
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI PHP android linux
╔-----------------------------------╗┆
各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。 bozch .net .net mvc
在.net mvc5中，在执行某一操作的时候，出现了如下错误：各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。经查询当前的操作与错误内容无关，经过对错误信息的排查发现，事故出现在数据库迁移上。回想过去：在迁移之前已经对数据库进行了添加字段操作，再次进行迁移插入XXX字段的时候，就会提示如上错误。 &
Java 对象大小的计算 e200702084 java
Java对象的大小如何计算一个对象的大小呢？
Mybatis Spring 171815164 mybatis
ApplicationContext ac = new ClassPathXmlApplicationContext("applicationContext.xml"); CustomerService userService = (CustomerService) ac.getBean("customerService"); Customer cust
JVM 不稳定参数 g21121 jvm
-XX 参数被称为不稳定参数，之所以这么叫是因为此类参数的设置很容易引起JVM 性能上的差异，使JVM 存在极大的不稳定性。当然这是在非合理设置的前提下，如果此类参数设置合理讲大大提高JVM 的性能及稳定性。可以说“不稳定参数”
用户自动登录网站永夜-极光用户
1.目标:实现用户登录后,再次登录就自动登录,无需用户名和密码 2.思路:将用户的信息保存为cookie 每次用户访问网站,通过filter拦截所有请求,在filter中读取所有的cookie,如果找到了保存登录信息的cookie,那么在cookie中读取登录信息,然后直接
centos7 安装后失去win7的引导记录程序员是怎么炼成的操作系统
1.使用root身份(必须)打开 /boot/grub2/grub.cfg 2.找到 ### BEGIN /etc/grub.d/30_os-prober ### 在后面添加 menuentry "Windows 7 (loader) (on /dev/sda1)" {
Oracle 10g 官方中文安装帮助文档以及Oracle官方中文教程文档下载 aijuans oracle
Oracle 10g 官方中文安装帮助文档下载：http://download.csdn.net/tag/Oracle%E4%B8%AD%E6%96%87API%EF%BC%8COracle%E4%B8%AD%E6%96%87%E6%96%87%E6%A1%A3%EF%BC%8Coracle%E5%AD%A6%E4%B9%A0%E6%96%87%E6%A1%A3 Oracle 10g 官方中文教程
JavaEE开源快速开发平台G4Studio_V3.2发布了無為子 AOP oracle mysql javaee G4Studio
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V3.2版本已经正式发布。大家可以通过如下地址下载。访问G4Studio网站 http://www.g4it.org G4Studio_V3.2版本变更日志功能新增 (1).新增了系统右下角滑出提示窗口功能。 (2).新增了文件资源的Zip压缩和解压缩
Oracle常用的单行函数应用技巧总结百合不是茶日期函数转换函数(核心)数字函数通用函数(核心)字符函数
单行函数; 字符函数,数字函数,日期函数,转换函数(核心),通用函数(核心) 一:字符函数: .UPPER(字符串) 将字符串转为大写 .LOWER (字符串) 将字符串转为小写 .INITCAP(字符串) 将首字母大写 .LENGTH (字符串) 字符串的长度 .REPLACE(字符串,'A','_') 将字符串字符A转换成_
Mockito异常测试实例 bijian1013 java 单元测试 mockito
Mockito异常测试实例： package com.bijian.study; import static org.mockito.Mockito.mock; import static org.mockito.Mockito.when; import org.junit.Assert; import org.junit.Test; import org.mockito.
GA与量子恒道统计 Bill_chen JavaScript 浏览器百度 Google 防火墙
前一阵子，统计**网址时，Google Analytics（GA）和量子恒道统计（也称量子统计），数据有较大的偏差，仔细找相关资料研究了下，总结如下：为何GA和量子网站统计（量子统计前身为雅虎统计）结果不同？首先：没有一种网站统计工具能保证百分之百的准确出现该问题可能有以下几个原因：（1）不同的统计分析系统的算法机制不同；（2）统计代码放置的位置和前后
【Linux命令三】Top命令 bit1129 linux命令
Linux的Top命令类似于Windows的任务管理器，可以查看当前系统的运行情况，包括CPU、内存的使用情况等。如下是一个Top命令的执行结果： top - 21:22:04 up 1 day, 23:49, 1 user, load average: 1.10, 1.66, 1.99 Tasks: 202 total, 4 running, 198 sl
spring四种依赖注入方式白糖_ spring
平常的java开发中，程序员在某个类中需要依赖其它类的方法，则通常是new一个依赖类再调用类实例的方法，这种开发存在的问题是new的类实例不好统一管理，spring提出了依赖注入的思想，即依赖类不由程序员实例化，而是通过spring容器帮我们new指定实例并且将实例注入到需要该对象的类中。依赖注入的另一种说法是“控制反转”，通俗的理解是：平常我们new一个实例，这个实例的控制权是我
angular.injector boyitech AngularJS AngularJS API
angular.injector 描述: 创建一个injector对象, 调用injector对象的方法可以获得angular的service, 或者用来做依赖注入. 使用方法: angular.injector(modules, [strictDi]) 参数详解: Param Type Details mod
java-同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待 bylijinnan Integer
public class PC { /** * 题目：生产者-消费者。 * 同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待。 */ private static final Integer[] val=new Integer[10]; private static
使用Struts2.2.1配置 Chen.H apache spring Web xml struts
Struts2.2.1 需要如下 jar包: commons-fileupload-1.2.1.jar commons-io-1.3.2.jar commons-logging-1.0.4.jar freemarker-2.3.16.jar javassist-3.7.ga.jar ognl-3.0.jar spring.jar struts2-core-2.2.1.jar struts2-sp
[职业与教育]青春之歌 comsci 教育
每个人都有自己的青春之歌............但是我要说的却不是青春... 大家如果在自己的职业生涯没有给自己以后创业留一点点机会,仅仅凭学历和人脉关系,是难以在竞争激烈的市场中生存下去的.... &nbs
oracle连接(join)中使用using关键字 daizj JOIN oracle sql using
在oracle连接(join)中使用using关键字 34. View the Exhibit and examine the structure of the ORDERS and ORDER_ITEMS tables. Evaluate the following SQL statement: SELECT oi.order_id, product_id, order_date FRO
NIO示例 daysinsun nio
NIO服务端代码： public class NIOServer { private Selector selector; public void startServer(int port) throws IOException { ServerSocketChannel serverChannel = ServerSocketChannel.open(
C语言学习homework1 dcj3sjt126com c homework
0、课堂练习做完 1、使用sizeof计算出你所知道的所有的类型占用的空间。 int x; sizeof(x); sizeof(int); # include <stdio.h> int main(void) { int x1; char x2; double x3; float x4; printf(&quo
select in order by , mysql排序 dcj3sjt126com mysql
If i select like this: SELECT id FROM users WHERE id IN(3,4,8,1); This by default will select users in this order 1,3,4,8, I would like to select them in the same order that i put IN() values so:
页面校验-新建项目 fanxiaolong 页面校验
$(document).ready( function() { var flag = true; $('#changeform').submit(function() { var projectScValNull = true; var s =""; var parent_id = $("#parent_id").v
Ehcache（02）——ehcache.xml简介 234390216 ehcache ehcache.xml 简介
ehcache.xml简介 ehcache.xml文件是用来定义Ehcache的配置信息的，更准确的来说它是定义CacheManager的配置信息的。根据之前我们在《Ehcache简介》一文中对CacheManager的介绍我们知道一切Ehcache的应用都是从CacheManager开始的。在不指定配置信
junit 4.11中三个新功能 jackyrong java
junit 4.11中两个新增的功能，首先是注解中可以参数化，比如 import static org.junit.Assert.assertEquals; import java.util.Arrays; import org.junit.Test; import org.junit.runner.RunWith; import org.junit.runn
国外程序员爱用苹果Mac电脑的10大理由 php教程分享 windows PHP unix Microsoft perl
Mac 在国外很受欢迎，尤其是在设计/web开发/IT 人员圈子里。普通用户喜欢 Mac 可以理解，毕竟 Mac 设计美观，简单好用，没有病毒。那么为什么专业人士也对 Mac 情有独钟呢？从个人使用经验来看我想有下面几个原因： 1、Mac OS X 是基于 Unix 的这一点太重要了，尤其是对开发人员，至少对于我来说很重要，这意味着Unix 下一堆好用的工具都可以随手捡到。如果你是个 wi
位运算、异或的实际应用 wenjinglian 位运算
一．位操作基础，用一张表描述位操作符的应用规则并详细解释。二．常用位操作小技巧，有判断奇偶、交换两数、变换符号、求绝对值。三．位操作与空间压缩，针对筛素数进行空间压缩。 &n
weblogic部署项目出现的一些问题（持续补充中……） Everyday都不同 weblogic部署失败
好吧，weblogic的问题确实…… 问题一： org.springframework.beans.factory.BeanDefinitionStoreException: Failed to read candidate component class: URL [zip:E:/weblogic/user_projects/domains/base_domain/serve
tomcat7性能调优（01） toknowme tomcat7
Tomcat优化： 1、最大连接数最大线程等设置 <Connector port="8082" protocol="HTTP/1.1" useBodyEncodingForURI="t
PO VO DAO DTO BO TO概念与区别 xp9802 java DAO 设计模式 bean 领域模型
O/R Mapping 是 Object Relational Mapping（对象关系映射）的缩写。通俗点讲，就是将对象与关系数据库绑定，用对象来表示关系数据。在O/R Mapping的世界里，有两个基本的也是重要的东东需要了解，即VO，PO。它们的关系应该是相互独立的，一个VO可以只是PO的部分，也可以是多个PO构成，同样也可以等同于一个PO（指的是他们的属性）。这样，PO独立出来，数据持