Dream_WLB

A CNN-Based Defect Inspection Method for Catenary Split Pins in High-Speed Railway-论文阅读笔记

A CNN-Based Defect Inspection Method for Catenary Split Pins in High-Speed Railway

基于CNN的高速铁路接触网开口销缺陷检测方法

//2022.6.17 17:18开始阅读笔记

论文地址

A CNN-Based Defect Inspection Method for Catenary Split Pins in High-Speed Railway | IEEE Journals & Magazine | IEEE Xplore

论文贡献

本文提出了一种基于改进的深卷积神经网络（CNN）的三级SPs缺陷自动检测系统，称为PVANET++。利用PV-ANET++和Hough变换&Chan–Vese模型对F i r s t、s P s a r e进行了定位，然后将提出的三个准则应用于SPs缺陷检测。在PV-ANET++中，采用一种新的锚定机制为对象生成合适的候选框，并结合多个隐藏层特征构造有区别的超特征。

论文内容

1.介绍

SPs相对较小，有两种类型：一种是A型、一种是B型。

A类型位于U形夹表面，dt_up，dt_down。B型SPs位于U形夹下方。CSD上SP和关节组件的位置如图1所示。SP的局部区域称为pin_区域，它们分为四类，如图2（a）所示。图2（b）–（d）分别显示了不同类型SPs的正常、严重松动和缺失状态。

CSDs采集示意图如下所示。

上述图3中的方法概述：

进行部件定位；
进行缺陷检测；

但是对于微小的SPs很难实现定位，同时为后续处理提供的适当定位框应包含整个对象目标。

对于缺陷检测，由于不同类型的部件有不同的缺陷，根据缺陷的特点提出了检测方法或准则。

接着作者提出了传统缺陷检测方法的不足之处：人工特征提取不能很好地描述一个对象，网络通常需要进行特定的训练。

PV ANET【24】具有区别性的功能，这归功于深度网络架构和来自中高层的串联功能。此外，在低层中应用串联的整流线性单元块以降低计算成本。这些特点使得PVANET能够准确、快速地进行目标定位。基于PVANET，我们提出了一个称为PVANET++的网络来实现SPs的本地化。可以从以下两个方面提高精度。

通过利用底层自然信息，在特征提取网络（FEN）中构建更具鉴别能力的超特征。
利用与CSD组件的规模和形状相关联的新锚定机制，在区域提案网络（RPN）中生成更高质量的提案。

在本文中，我们应用深度CNN和Hough变换&Chan–Vese模型（HT&CVM）在局部SP区域进一步定位SP的某些特定部分，然后使用三个建议的标准来区分SP的状态。

我们将本文的贡献总结如下。

提出了一种适用于高速铁路小型SPs的三级缺陷自动检测方法。
对于本地化，提出了一种更精确的深度学习模型。与最近几家竞争激烈的深度CNN相比，所提出的PVANET++实现了最先进的定位精度。
对于缺陷的检测，我们提出了三个标准来区分SPs的复杂状态。
速度评估表明，我们的三阶段方法具有相当大的速度。

本文的其余部分组织如下。第二节概述了我们的检查方法。第三节描述了SP领域的本地化，并说明了我们的深度学习模型的表现及其改进。第四节介绍了所有类型SP的缺陷检测标准。第五节给出了评估我们的PV ANET++和几个最具竞争力的深度CNN性能的实验。随后对整个三阶段系统进行性能评估。最后，第六节得出了一些结论，并提出了进一步改进的建议。

2.方法概述

由于在拍摄的6600×4400像素图像中，SP相对较小，如果直接处理原始图像，可以学习一些有用的特征或少量信息。因此，我们的方法包括三个阶段，如图4所示。我们将其描述如下。

第一阶段：第一个PVANET++应用于6600×4400原始输入图像，以定位接头组件（U形夹、dt_向上和dt_向下）。本地化结果用蓝色框标记。它们被裁剪并发送到第二阶段的下一个PV ANET++。
第二个PV ANET++用于预测裁剪关节组件图像中的pin_区域。pin_区域是包含SP的关节组件的小局部区域，根据其位置可分为四类。本地化的pin_区域将被裁剪并发送到第三阶段。
对于A类SPs，裁剪的pin_区域1、pin_区域2和pin_区域3被发送到第三个PV ANET++以定位特定零件的头部、车身和尾部。这些特定零件的定义将在第五节中介绍。由于销U区域3中的螺栓引起的堵塞问题，采用了两种不同的标准来分别检测A1型和A2型SPs。对于B型SPs，SPs的旋转会导致二维图像中复杂的SPs状态。使用HT&CVM块定位裁剪的pin_区域4中的某些特定零件，然后应用第三个标准进行缺陷检测。

3. SP区域的定位

为了将SP定位在适当的缺陷检测区域，先后使用了两个PV ANET+。第一个PVANET++用于定位三种关节组件，第二个用于进一步定位每个关节组件图像中的SP区域。

原始PV ANET【24】属于第一类深层CNN，在第一节中介绍。它由三个模块组成，即FEN、区域建议生成（RPG）和C&R。FEN学习称为超特征的鉴别特征，然后RPG通过对锚机制生成的初始框进行分类和回归来生成建议【兴趣区域（ROI）】。最后，通过对C&R中的建议进行分类和回归来实现本地化。为了在原始PVANET中获得更好的本地化性能，我们专注于在RPG中获得更高质量的建议，并在一个FEN中获得更具辨别力的特征表示。因此，在两个方面进行了一些改进。

1. 受超网[32]的启发，我们将低层特征conv2_ 3集成到FEN的超地图中，因为浅层地图具有相对高的分辨率，并且包含可能有助于使超特征更具区分性的自然信息。

2. 在RPG中，锚定非常重要，因为它们提供了最初的提案箱。尽管快速RCNN【21】和PVANET【24】中的锚定机制具有很强的泛化能力，但针对CSDs数据集的新锚定机制可能有助于提高提案质量。

A.PVANET++

1. PV ANET++的基本框架如图5所示。

1.1 特征提取网络：FEN包括16个卷积层（从conv1_ 1到conv5_ 4）和一个池层（pool1_ 1），可以在表1中找到更详细的FEN层规范。

第一阶段和第二阶段的输入图像分别设置为900×600和300×200。m×n输入图像通过卷积层或池层转发，并依次生成激活图。由于FEN的层次结构设计，我们推测感兴趣的信息不仅分布在高、中卷积层上，而且也分布在低卷积层上，因为低层特征地图具有相对高的分辨率，并且包含自然信息，这可能有助于更好地描述对象。因此，我们将conv2_ 3产生的浅层特征集成到拼接中，并构建了超特征，它将高度语义特征、中间但互补的特征和浅层但自然的信息结合在一起。

1.2 RPG（区域建议生成阶段）：该模块为C&R提供了一些建议（ROI）。RPN是RPG的主要部分，它在超特征地图上操作一个3×3的空间滑动窗口。在每个滑动窗口位置，应用锚定机制生成建议的初始框，并将与超特征对应的框特征映射到向量。然后，将向量输入softmax层以估计概率（对象或背景），并将回归器层分别预测到地面真值的坐标偏移。我们选择概率得分排名列表上的前300个回归参考框作为建议。锚的纵横比和比例分别为对象提供初始长方体形状和大小。Faster R-CNN中的锚定机制在基准测试数据集中是有效的，其中对象具有各种形状和姿势。更丰富的纵横比和标度可能有助于产生更高质量的标书，但并非总是如此，这将在第五节中进行验证。如图6所示，原始PVANET锚定比为0.33、0.5、0.67、1.0、1.5、2.0和3.0，具有多个标度32、48、80、144、256和512。然而，本文中CSD组件区域的方框既不是极端的“细长高”也不是“短扁”，它们可能是方形的或在一定程度上扭曲。因此，减少了相邻比率之间的间隔，并给出了新的纵横比，如0.5、0.57、0.67、0.75、1.0、1.33、1.5、1.75和2.0。对于量表，它们被更新为32、48、80、112、144和192，这消除了两个不合适的极端情况，并使量表在中等范围内多样化。实际上，PVANET++中的RPN在每个滑动窗口位置应用了54个锚。从锚点调整的一些方案可能彼此高度重叠，但非最大值抑制（NMS）有助于减少此类冗余。

1.3 分类和回归：在本模块中预测提案的类别和位置。通过ROI池，将384个通道的超地图提案的特征汇集到一个6×6×384张量中，然后张量通过一系列完全连接的“4096”层−4096− 6.− [（k+1）+4（k+1）]“输出节点。“k+1”输出由softmax函数生成，它们具有概率分布（p 0，…，p k−1，p k），表示提案属于一个类别（共有k个类别）或背景的概率。“4（k+1）”输出由平滑函数生成，它们是相对于提案坐标的预测框偏移。对应于最大概率的类别标签和偏移量分配给测试方案。然后将NMS应用于所有预测，以减少冗余并生成最终预测框，其形式如下所示：

其中，Pconf是预测类别的置信度，（x1，y1，x2，y2）是预测框的坐标。

2.训练损失函数：PV ANET++通过多任务损失的随机梯度下降进行端到端训练，损失函数表示如下：

它结合了RPG中的损失和C&R中的检测损失。

注意：具体的RPN损失和最后的class regression损失函数的具体形式可以参考Faster RCNN论文。

B.前两个阶段的定位展示

前两个阶段的定位展示分别如图7（a）和（b）所示。第五节将详细介绍每个阶段大量图像的性能评估方案。

4.缺陷检测

SPs的缺陷可根据严重程度分为不同的形式。然而，除了缺失状态外，这些形式之间没有严格的区别，因为SPs的放松是一个逐渐增长的过程。我们大致将三种状态定义为正常、松散和缺失，并将一些特定部分指定为头部、身体、尾部和虚拟尾部，如图8和9所示。对于缺陷检测，对pin_区域应用深度分类CNN可能是所有类型SP的潜在解决方案。然而，不同可能模式的缺陷SP样本数量很少。当使用有限的样本学习分类器时，可能会发生过度拟合，因为CNN在图像分类任务中的成功与大规模图像集有关。幸运的是，大多数SPs状态下，pin_areas中特定部分的分布是可以区分的，我们仍然可以利用深度CNN快速准确地定位A型SPs的特定部分。对于B型SPs，如图10（左）所示，由于SPs的旋转，HT&CVM块用于定位SPs零件。本地化后，根据本地化特定零件的分布情况，检测所有类型SPs的缺陷。

A.A类SPs的缺陷检测

SPs在第二阶段生成的小pin_areas中很明显。对于A1型SPs，如图8所示，头部、身体、尾部和虚拟尾部的存在条件对于不同的状态是不同的。将存在条件与头部和身体之间的距离特性相结合，可以通过标准1区分每个状态，如表II所示。

在表II中，H、B、T和VT分别是局部零件头部、身体、尾部和虚拟尾部的缩写。d是头部和身体之间的距离，L是身体的对角线长度，如图8所示。α是一个重要的参数，它的值为1.4 empiricly。

对于A2型SPs，如图9所示，在某些情况下可能会发生部分遮挡。因此，我们使用标准2来区分每个状态模式，如表III所示。

提出的两个标准基于PV ANET++模型的高精度和召回率，如图16所示。我们使用第三节描述的PVANET++作为深度CNN模型来实现特定部件的定位，输入设置为160×160。类型A的本地化演示如图11所示。

B.B型SPs缺陷检测

如图10所示，B型SP可能绕其轴和螺栓旋转，并且我们的二维CSD图像上缺少一些重要的鉴别信息，这将导致复杂的状态。

为这种全面的缺陷检测提供统一的标准似乎不切实际。在本节中，使用Hough变换（HT）[33]将SPs零件和螺栓零件从前景中分离出来，然后使用Chan–V ese模型[34]（CVM）获得分离零件的面积。最后，基于HT和CVM的结果，应用一个准则来检测可疑的缺失状态。步骤介绍如下。

步骤1：增强图像，然后将其设置为否定。

第二步：采用HT提取在一定角度范围内产生的前15个最大值[−5.5◦, 5.◦]. 将这15个最大值分为两组，如图12（a）所示，并将每组的平均长度ρa和角度θa作为相应的近似垂直直线。

步骤3：操作与步骤2相似，但角度范围设置为[70◦, 89.5◦] 对于近似水平线检测，仅提取一个最大值，如图12（b）所示。

步骤4：通过在步骤2和3中提取的三条直线将SPs零件和螺栓零件与前景分离。

步骤5：使用CVM提取分离的部分，并获得每个区域为S1、S2和S，如图12（c）所示，然后按照表IV中的准则3进行状态区分。

5.实验与分析

为了评估该方法的性能，在一个60公里长的铁路线上采集的数据集上进行了实验。我们将我们的PV-ANET++与最近几个具有竞争力的深度CNN在本地化方面进行了比较，并验证了整个三阶段系统的有效性。

A.设置

1）数据集：我们系统中使用的数据集包括约9210张35 540张SP的捕获图像，这些图像由特定检查车辆从两条60公里的高速铁路线上采集。我们在第1行中使用4630张图像进行训练，在第2行中使用4580张图像进行测试。不同阶段培训和测试集的图像编号如表5所示。对训练和测试集中SPs的具体状态事先手动检查并标记，如表6所示。

为了建立一个可直接用于深层CNN模型的数据集，我们使用MATLAB工具实现了一个GUI，以在训练集和测试集（仅用于评估）中对每个图像进行注释。在注释中，手动为每个对象指定一个矩形框、一个类别标记和一个状态标记。

2）平台：本文实现的所有深度CNN的实验环境如下：深度学习框架Caffe【35】、Linux Ubuntu14.04、Intel Xeon CPU E3-1230 V2时钟频率为3.3 GHz、12 GB RAM和GTX1080Ti GPU，11 GB内存。

B. 深层CNN的性能评估

我们比较了八种深度CNN模型Faster RCNN【21】、Faster RCNN1、Faster RCNN2、R-FCN ResNet-101【23】、SSD【25】、PV ANET【24】、PV ANET+、PV ANET+。

由于Faster RCNN的框架类似于PVANET++，因此实现了Faster RCNN1和Faster RCNN2来研究锚机制变化的影响。各模型中的锚如表VII所示。

1）培训流程：已实施的深层CNN中的培训参数设置相同。参数设置如下。

动量设置为0.9，权重衰减设置为0.0005，迭代总数为40000。接下来的两个阶段的集合与第一阶段相似，只是迭代总数被指定为30000，因为图像没有第一阶段复杂。倾斜率（LR）初始化为0.0001，然后在2000次迭代后将其变为0.001，以避免在开始时的短时间内不收敛。在第10000次、20000次和30000次（对于第一阶段）迭代中，通过乘以0.5将LR设置为更小。

我们在图中显示了PVANET++在第1-3阶段的训练过程。分别为13（a）–（c）。在图13（a）中，列车损失在第10000次和20000次迭代时减小，但在第30000次迭代时没有进一步减小。在图13（b）和（c）中，列车损失在第10000次迭代时减少，但在第200000次迭代时不会进一步减少。这表明，即使LR设置得更小，模型也无法了解更多信息，列车损耗也会收敛。因此，模型经过了良好的训练。其他七个比较深的CNN的训练过程与PV ANET++相似。

3）测试指数：根据预测的类别标签和与基本真值边界框的重叠，将训练模型生成的预测视为真阳性、假阳性或假阴性。当预测标签符合真值标签且预测边界框Bpre和地面真值边界框Bgt之间的重叠a0超过Lmin时，预测是正确的。

其中对于AP mAP Recall Precision指标的公式解释详见对应论文，这里不再赘述。

为了评估深度CNN的速度性能，我们将平均时间成本（ATC）定义为：

其中k是阶段指数，Tk是深度CNN在阶段k的总时间涂层，a n d Nk是阶段k的图像数。

3）测试结果比较和讨论：在测试中，我们只接受与地面真值高度重叠的预测，因此，三个阶段的重叠阈值Lmin分别设置为0.7、0.74和0.78。各阶段试验模型的P-R曲线如图所示。14–16，其垂直坐标范围设置为[0.5 1.01]，以便清晰观察。类的AP对应于P-R曲线下的面积，可以通过公式（8）计算。可以通过公式（9）计算所有类的映射。详细评价结果见表八。结果比较可从图中进行。14–16和表VIII。

1）在第一阶段，图14中的P-R曲线表明，我们的PV ANET++和PV ANET+具有类似的性能。它们在U形夹和dt_down时表现最好，在dt_up时略差于SSD。将PV-ANET+与PV-ANET进行比较，我们发现锚定机制产生的改善是明显的，尤其是在dt_-up和dt_-down中。

2）在后两个阶段中，PV ANET++在所有pin_区域、头部和身体上表现最佳。对于这两个阶段的PV ANET++的所有本地化，当召回达到0.95时，相应的精度也超过0.9或更高。这表明PV ANET++可以检测到大多数标记对象，并为标准提供可靠的输出。通过图中PV ANET++和PV ANET+之间的比较，可以观察到早期层特征conv2_ 3带来的改进。15和16。

3）尾部的精度比头部和身体的精度差。这主要是由于虚尾的错误预测造成的。然而，我们仍然可以通过尾巴和虚拟尾巴相对于头部和身体的位置来区分它们。因此，我们可以利用这些错误预测来区分标准1和2中的缺陷，如第IV-A节所示。

4）与快速RCNN相比，快速RCNN1具有更丰富的宽高比和尺度，但两种模型在各个阶段的映射都很接近。使用我们的锚机制的更快的RCNN2在第一阶段的性能要好于更快的RCNN和更快的RCNN1。因此，我们推测，锚机制改变带来的性能改善是基于良好的FEN。

5）如表VIII所示，我们的PV ANET++和PV ANET+在大多数类中获得了最高的AP，并且PV ANET++在所有三个阶段都具有最高的mAP。此外，PV ANET++的A TC为0.666秒，比SSD慢0.042秒，仅比PVANET慢 0.008秒。看来这些改进并没有给我们的系统带来时间成本的增加。

C.整个系统的性能评估

表VIII中的评估结果表明，我们的PV ANET++在准确性方面优于其他比较深的CNN。我们使用该数据集进一步评估基于PV ANET++的整个三级系统的性能，结果如表IX所示。我们数据集中的缺陷样本数量如表VI所示，测试数据集中有69个松散缺陷样本和37个缺失缺陷样本。

如表IX所示，在评估期间跟踪所有阶段的缺陷样本。在第一阶段，定位所有缺失病例，定位两个SPs松动的关节组件失败。在第二阶段，定位所有缺陷pin_areas。在第三阶段，检测到所有缺失病例，但有三个松散病例被视为正常SPs，这可能是由于正常和中等松散状态相似所致。还评估了不同阶段和整个系统的运行速度（标准的时间成本可以忽略不计）。整个系统的每秒帧数为0.43，这是一种高速。整个系统速度很快，因为三级系统的大部分部分是由PV ANET++实现的。评估结果表明，该系统对SPs缺陷检测是有效的，并且具有相当的速度。

6.结论

深度学习算法在许多领域显示出了巨大的能力。本文主要基于深度CNN实现SPs的有效自动缺陷检测。所提出的PVANET++在准确性上优于最近竞争的几个深度CNN，并且具有相当的速度。然而，为了在这一领域取得进一步进展，仍有几个问题需要考虑。

1. 对于B型SP，由于SP的旋转，其状态在我们的二维图像上非常复杂。一些潜在的松散病例无法判断。所提出的准则3可以检测到可疑失踪状态，但一些正常或松散的案件也可以被视为可疑失踪案件。因此，基于深度学习的三维检测可以尝试解决这个问题。

2. 可以判断正常和严重松动之间的更精细状态。因此，铁路人员可以针对这些潜在的松散病例采取措施，而不仅仅是针对严重松散和缺失病例。

本文仅作为日后复习之用，并无他用。

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
求是网：“内卷式”竞争的突出表现和主要危害有哪些？加百力财经研究科技知识人工智能大数据
"内卷式"竞争主要表现为：企业层面的低价竞争、同质化竞争和营销"逐底竞争"；地方政府层面的违规优惠政策、盲目重复建设和设置市场壁垒。危害体现在三个层面：微观上导致"劣币驱逐良币"，损害消费者利益；中观上破坏行业生态，挤压产业链利润空间；宏观上扭曲资源配置，抑制创新活力。什么是“内卷式”竞争？概括其一般特征，是指经济主体为了维持市场地位或争夺有限市场，不断投入大量精力和资源，却没有带来整体收益增长的
深入剖析OpenJDK 18 GA源码：Java平台最新发展想法臃肿
本文还有配套的精品资源，点击获取简介：OpenJDK18GA作为Java开发的关键里程碑，提供了诸多新特性和改进。本文章深入探讨了OpenJDK18GA源码，揭示其内部机制，帮助开发者更好地理解和利用这个版本。文章还涵盖了PatternMatching、SealedClasses、Records、JEP395、JEP406和JEP407等特性，以及HotSpot虚拟机、编译器、垃圾收集器、内存模型
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
计算机网络技术 CZZDg 计算机网络
目录一.网络概述1.网络的概念2.网络发展是3.网络的四要素4.网络功能5.网络类型6.网络协议与标准7.网络中常见的概念8.网络拓补结构二.网络模型1.分层思想2.OSI七层模型3.TCP/IP五层模型4.数据的封装与解封装过程三.IP地址1.进制转换2.IP地址定义3.IP地址组成成分4.IP地址分类5.地址划分6、相关概念一.网络概述1.网络的概念两个主机通过传输介质和通信协议实现通信和资源
cesium添加原生MVT矢量瓦片方案 zhu_zhu_xia cesium vue arcgis cesium webgl javascript
项目中需要基于cesium接入mvt格式的服务并支持属性拾取查询，通过一系列预研测试，最后选择cesium-mvt-imagery-provider开源插件完成，关键源码信息如下：npmicesiumcesium-mvt-imagery-provider//安装依赖包//加载图层importCesiumMVTImageryProviderfrom"cesium-mvt-imagery-provid
ThinkSound V2版 - 一键给无声视频配音，为AI视频生成匹配音效支持50系显卡一键整合包下载昨日之日2006 ai语音音视频人工智能
ThinkSound是阿里通义实验室开源的首个音频生成模型，它能够让AI像专业“音效师”一样，根据视频内容生成高度逼真、与视觉内容完美契合的音频。ThinkSound可直接应用于影视后期制作，为AI生成的视频自动匹配精准的环境噪音与爆炸声效；服务于游戏开发领域，实时生成雨势变化等动态场景的自适应音效；同时可以无障碍视频生产，为视障用户同步生成画面描述与环境音效。今天分享的ThinkSoundV2版
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
Kimi Chat 1.5 与 2.0 架构升级对比 charles666666 人工智能 transformer 深度学习产品经理 chatgpt
1.5版的MoE架构优化KimiChat1.5采用了优化后的MoE架构，其核心在于“专家网络动态路由”。这一机制类似于快递系统智能选择最优路径，能够根据输入数据的特性动态分配计算资源。这种优化显著提升了模型的计算效率，同时降低了硬件资源的浪费。在实际应用中，这意味着开发者可以在相同的硬件配置下处理更复杂的任务，或者在有限的资源下实现更高的性能。2.0的混合专家系统创新点与1.5版相比，KimiCh
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求可曾去过倒悬山 java 前端架构
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求三年经验是Java程序员的分水岭，技术栈深度决定你成为“业务码农”还是“架构师候选人”。本文整合阿里、美团、滴滴等大厂招聘要求，为你绘制可落地的进阶路线。一、Java核心：从语法糖到JVM底层三年经验与初级的核心差异在于系统级理解，大厂面试常考以下能力：JVM与性能调优内存模型（堆外内存、元空间）、GC算法（G1/ZGC适用场
反光衣识别漏检率 30%？陌讯多尺度模型实测优化
在建筑工地、交通指挥等场景中，反光衣是保障作业人员安全的重要装备，对其进行精准识别是智能监控系统的核心功能之一。但传统视觉算法在实际应用中却屡屡碰壁：强光下反光衣易与背景混淆、远距离小目标漏检率高达30%、复杂场景下模型泛化能力不足[实测数据来源：某智慧工地项目2024年Q1日志]。这些问题直接导致安全监控系统预警滞后，给安全生产埋下隐患。一、技术解析：反光衣识别的核心难点与陌讯算法创新反光衣识别
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（Advanced RAG[1]）基于历史对话重新生成Query？ 985小水博一枚呀 AI大模型学习路线人工智能学习 langchain RAG
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Query？【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Query？文章目录【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Q
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（Advanced RAG[1]）其他Query优化相关策略？ 985小水博一枚呀 AI大模型学习路线人工智能学习 langchain
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？文章目录【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？一
盲超分的核心概念小冷爱读书数学建模盲超分超分重建
一、盲超分的本质与数学建模1.退化过程的数学表达低分辨率图像（LR）可看作高分辨率图像（HR）经过退化模型后的结果：：观测到的低分辨率图像：待恢复的高分辨率图像：模糊核（BlurKernel）⊗：卷积操作↓：下采样（步长为）：加性噪声（如高斯噪声、泊松噪声等）盲超分的核心问题：在未知、、的情况下，从估计。2.为什么传统超分方法会失效？传统方法（如SRCNN、EDSR）假设退化是固定的（如双三次下采
【证明】对极几何：本质矩阵内在性质 Powerful_QI slam 线性代数矩阵
--这是目录--1.本质矩阵内在性质表述2.预备知识2.1线性代数基础2.1.1奇异值与特征值的关系2.1.2矩阵加减单位阵后特征值的变化2.2引理：一个常用的矩阵变换3.证明1.本质矩阵内在性质表述本质矩阵(EssentialMatrix)EEE是一个3阶方阵，满足E=t∧RE=t^{\land}RE=t∧R其中RRR为旋转矩阵，ttt为平移量，t∧t^{\land}t∧运算定义如下（参考了
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
AI 图像编辑提示词参考之：背景替换
在AI图像编辑中（以FluxKontext为例），“替换背景”（BackgroundReplacement）是提升图像表现力的关键手段之一。但背景更换不仅仅是简单的视觉置换，更重要的是：确保人物主体外观不变，并与新背景在色温、色调、光影等方面自然融合。只有这样，最终图像才会呈现出“原本拍摄于该背景环境”的真实感。建议使用以下结构组织提示词：Replacethebackgroundwith[新背景]
LLM中最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息吗？ ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 机器学习算法深度学习人工智能
LLM中最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息吗？在大语言模型（LLM）中，最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息，这是由LLM的核心架构（以Transformer为基础）决定的，具体可以从以下角度理解：1.核心机制：自注意力（Self-Attention）的作用现代LLM（如GPT系列、Qwen等）均基于Transformer架构，其核心是自注意力机制。在
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
AI Agent开发学习系列 - langchain之Chains的使用(7)：用四种处理文档的预制链轻松实现文档对话 alex100 AI Agent 学习人工智能 langchain prompt 语言模型 python
在LangChain中，四种文档处理预制链（stuff、refine、mapreduce、mapre-rank）是实现文档问答、摘要等任务的常用高阶工具。它们的核心作用是：将长文档切分为块，分步处理，再整合结果，极大提升大模型处理长文档的能力。stuff直接拼接所有文档内容到prompt，一次性交给大模型处理。适合文档较短、token不超限的场景。refine递进式摘要。先对第一块文档生成初步答案
LLM的表征做减法的是什么，自然语言是一个矩阵，怎么进行减法的 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 计算机视觉人工智能机器学习算法深度学习
LLM的表征做减法的是什么，自然语言是一个矩阵，怎么进行减法的有个假设：就是最后一个词语融合了前面词语的信息减法操作主要用于提取模型内部表征中的"诚实性"概念向量。具体来说，这是通过对比诚实和不诚实场景下的模型隐藏状态实现的。importtorchfromtransformersimportAutoModelForCausalLM,AutoTokenizer,AutoConfigimportnum
什么是RFM模型走过冬季学习笔记大数据数据分析
RFM模型是客户价值分析中一种经典且实用的量化模型，它通过三个关键维度评估用户价值，帮助企业识别最有价值的客户群体。名称RFM由三个核心指标的英文首字母组成：R（Recency）-最近一次消费时间定义：用户上一次发生交易行为距今的时间长度（如多少天前）。意义：衡量用户的活跃度和流失风险。R值越小（最近有消费），说明用户越活跃，流失风险越低；R值越大（很久没消费），用户流失风险越高。母婴场景示例：一
Spring WebFlux 响应式编程原理与实战指南
SpringWebFlux响应式编程原理与实战指南一、技术背景与应用场景随着微服务与高并发的迅速发展，传统的阻塞式编程模型在处理大量并发请求时容易导致线程资源耗尽、响应延迟增高。SpringWebFlux基于ReactiveStreams规范，通过非阻塞、背压机制，实现高吞吐、低延迟的Web服务。典型应用场景包括：实时数据推送：WebSocket或Server-SentEvents场景。高并发AP
JavaScript之DOM操作与事件处理详解 AA-代码批发V哥 JavaScript javascript
JavaScript之DOM操作与事件处理详解一、DOM基础：理解文档对象模型二、DOM元素的获取与访问2.1基础获取方法2.2集合的区别与注意事项三、DOM元素的创建与修改3.1创建与插入元素3.2修改元素属性与样式3.2.1属性操作3.2.2样式操作3.3元素内容的修改四、DOM元素的删除与替换4.1删除元素4.2替换元素五、事件处理：实现页面交互5.1事件绑定的三种方式5.1.1HTML属性
zookeeper etcd区别 sun007700 zookeeper etcd 分布式
ZooKeeper与etcd的核心区别体现在设计理念、数据模型、一致性协议及适用场景等方面。‌ZooKeeper基于ZAB协议实现分布式协调，采用树形数据结构和临时节点特性，适合传统分布式系统；而etcd基于Raft协议，以高性能键值对存储为核心，专为云原生场景优化，是Kubernetes等容器编排系统的默认存储组件。‌‌1‌‌2‌架构与设计目标差异‌‌ZooKeeper‌。‌设计定位‌:专注于分
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
游戏开发日记 future1412 学习数据结构 c#
如何用数据表来储存，位置坐标（XYZ）：决定了对象在世界中的摆放资源ID/图片URL：决定了使用什么模型或贴图事件ID/特效：是否触发某些事件（例如点击、交互）逻辑索引（GridIndex）：用于程序检索和映射用途这在策略类、模拟类、RPG游戏中非常常见，例如建筑布局、怪物摆放、地图资源点等。这个表格决定的是玩家事件，使用了的图片名称URL，格子的出入口设置，格子的类型，是否为检察点，场景id，副
redis学习笔记——不仅仅是存取数据 Everyday都不同 returnSource expire/del incr/lpush 数据库分区 redis
最近项目中用到比较多redis，感觉之前对它一直局限于get/set数据的层面。其实作为一个强大的NoSql数据库产品，如果好好利用它，会带来很多意想不到的效果。（因为我搞java，所以就从jedis的角度来补充一点东西吧。PS：不一定全，只是个人理解，不喜勿喷） 1、关于JedisPool.returnSource(Jedis jeids) 这个方法是从red
SQL性能优化-持续更新中。。。。。。 atongyeye oracle sql
1 通过ROWID访问表--索引你可以采用基于ROWID的访问方式情况,提高访问表的效率, , ROWID包含了表中记录的物理位置信息..ORACLE采用索引(INDEX)实现了数据和存放数据的物理位置(ROWID)之间的联系. 通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高. 2 共享SQL语句--相同的sql放入缓存 3 选择最有效率的表
[JAVA语言]JAVA虚拟机对底层硬件的操控还不完善 comsci JAVA虚拟机
如果我们用汇编语言编写一个直接读写CPU寄存器的代码段，然后利用这个代码段去控制被操作系统屏蔽的硬件资源，这对于JVM虚拟机显然是不合法的，对操作系统来讲，这样也是不合法的，但是如果是一个工程项目的确需要这样做，合同已经签了，我们又不能够这样做，怎么办呢？那么一个精通汇编语言的那种X客，是否在这个时候就会发生某种至关重要的作用呢？ &n
lvs- real 男人50 LVS
#!/bin/bash # # Script to start LVS DR real server. # description: LVS DR real server # #. /etc/rc.d/init.d/functions VIP=10.10.6.252 host='/bin/hostname' case "$1" in sta
生成公钥和私钥 oloz DSA 安全加密
package com.msserver.core.util; import java.security.KeyPair; import java.security.PrivateKey; import java.security.PublicKey; import java.security.SecureRandom; public class SecurityUtil {
UIView 中加入的cocos2d，背景透明 374016526 cocos2d glClearColor
要点是首先pixelFormat:kEAGLColorFormatRGBA8，必须有alpha层才能透明。然后view设置为透明glView.opaque = NO;[director setOpenGLView:glView];[self.viewController.view setBackgroundColor:[UIColor clearColor]];[self.viewControll
mysql常用命令香水浓 mysql
连接数据库 mysql -u troy -ptroy 备份表 mysqldump -u troy -ptroy mm_database mm_user_tbl > user.sql 恢复表（与恢复数据库命令相同） mysql -u troy -ptroy mm_database < user.sql 备份数据库 mysqldump -u troy -ptroy
我的架构经验系列文章 - 后端架构 - 系统层面 agevs JavaScript jquery css html5
系统层面：高可用性所谓高可用性也就是通过避免单独故障加上快速故障转移实现一旦某台物理服务器出现故障能实现故障快速恢复。一般来说，可以采用两种方式，如果可以做业务可以做负载均衡则通过负载均衡实现集群，然后针对每一台服务器进行监控，一旦发生故障则从集群中移除；如果业务只能有单点入口那么可以通过实现Standby机加上虚拟IP机制，实现Active机在出现故障之后虚拟IP转移到Standby的快速
利用ant进行远程tomcat部署 aijuans tomcat
在javaEE项目中，需要将工程部署到远程服务器上，如果部署的频率比较高，手动部署的方式就比较麻烦，可以利用Ant工具实现快捷的部署。这篇博文详细介绍了ant配置的步骤（http://www.cnblogs.com/GloriousOnion/archive/2012/12/18/2822817.html），但是在tomcat7以上不适用，需要修改配置，具体如下： 1.配置tomcat的用户角色
获取复利总收入 baalwolf 获取
public static void main(String args[]){ int money=200; int year=1; double rate=0.1; &
eclipse.ini解释 BigBird2012 eclipse
大多数java开发者使用的都是eclipse，今天感兴趣去eclipse官网搜了一下eclipse.ini的配置，供大家参考，我会把关键的部分给大家用中文解释一下。还是推荐有问题不会直接搜谷歌，看官方文档，这样我们会知道问题的真面目是什么，对问题也有一个全面清晰的认识。 Overview 1、Eclipse.ini的作用 Eclipse startup is controlled by th
AngularJS实现分页功能 bijian1013 JavaScript AngularJS 分页
对于大多数web应用来说显示项目列表是一种很常见的任务。通常情况下，我们的数据会比较多，无法很好地显示在单个页面中。在这种情况下，我们需要把数据以页的方式来展示，同时带有转到上一页和下一页的功能。既然在整个应用中这是一种很常见的需求，那么把这一功能抽象成一个通用的、可复用的分页（Paginator）服务是很有意义的。 &nbs
[Maven学习笔记三]Maven archetype bit1129 ArcheType
archetype的英文意思是原型，Maven archetype表示创建Maven模块的模版，比如创建web项目，创建Spring项目等等. mvn archetype提供了一种命令行交互式创建Maven项目或者模块的方式， mvn archetype 1.在LearnMaven-ch03目录下，执行命令mvn archetype:gener
【Java命令三】jps bit1129 Java命令
jps很简单，用于显示当前运行的Java进程，也可以连接到远程服务器去查看 [hadoop@hadoop bin]$ jps -help usage: jps [-help] jps [-q] [-mlvV] [<hostid>] Definitions: <hostid>: <hostname>[:
ZABBIX2.2 2.4 等各版本之间的兼容性 ronin47
zabbix更新很快，从2009年到现在已经更新多个版本，为了使用更多zabbix的新特性，随之而来的便是升级版本，zabbix版本兼容性是必须优先考虑的一点客户端AGENT兼容 zabbix1.x到zabbix2.x的所有agent都兼容zabbix server2.4：如果你升级zabbix server，客户端是可以不做任何改变，除非你想使用agent的一些新特性。 Zabbix代理（p
unity 3d还是cocos2dx哪个适合游戏？ brotherlamp unity自学 unity教程 unity视频 unity资料 unity
unity 3d还是cocos2dx哪个适合游戏？问：unity 3d还是cocos2dx哪个适合游戏？答：首先目前来看unity视频教程因为是3d引擎，目前对2d支持并不完善，unity 3d 目前做2d普遍两种思路，一种是正交相机，3d画面2d视角，另一种是通过一些插件，动态创建mesh来绘制图形单元目前用的较多的是2d toolkit，ex2d，smooth moves，sm2，
百度笔试题：一个已经排序好的很大的数组，现在给它划分成m段，每段长度不定，段长最长为k，然后段内打乱顺序，请设计一个算法对其进行重新排序 bylijinnan java 算法面试百度招聘
import java.util.Arrays; /** * 最早是在陈利人老师的微博看到这道题： * #面试题#An array with n elements which is K most sorted，就是每个element的初始位置和它最终的排序后的位置的距离不超过常数K * 设计一个排序算法。It should be faster than O(n*lgn)。
获取checkbox复选框的值 chiangfai checkbox
<title>CheckBox</title> <script type = "text/javascript"> doGetVal: function doGetVal() { //var fruitName = document.getElementById("apple").value;//根据
MySQLdb用户指南 chenchao051 mysqldb
原网页被墙，放这里备用。 MySQLdb User's Guide Contents Introduction Installation _mysql MySQL C API translation MySQL C API function mapping Some _mysql examples MySQLdb
HIVE 窗口及分析函数 daizj hive 窗口函数分析函数
窗口函数应用场景：（1）用于分区排序（2）动态Group By （3）Top N （4）累计计算（5）层次查询一、分析函数用于等级、百分点、n分片等。函数说明 RANK() &nbs
PHP ZipArchive 实现压缩解压Zip文件 dcj3sjt126com PHP zip
PHP ZipArchive 是PHP自带的扩展类，可以轻松实现ZIP文件的压缩和解压，使用前首先要确保PHP ZIP 扩展已经开启，具体开启方法就不说了，不同的平台开启PHP扩增的方法网上都有，如有疑问欢迎交流。这里整理一下常用的示例供参考。一、解压缩zip文件 01 02 03 04 05 06 07 08 09 10 11
精彩英语贺词 dcj3sjt126com 英语
I'm always here 我会一直在这里支持你 &nb
基于Java注解的Spring的IoC功能 e200702084 java spring bean IOC Office
java模拟post请求 geeksun java
一般API接收客户端（比如网页、APP或其他应用服务）的请求，但在测试时需要模拟来自外界的请求，经探索，使用HttpComponentshttpClient可模拟Post提交请求。此处用HttpComponents的httpclient来完成使命。 import org.apache.http.HttpEntity ; import org.apache.http.HttpRespon
Swift语法之 ---- ?和!区别 hongtoushizi ?swift !
转载自： http://blog.sina.com.cn/s/blog_71715bf80102ux3v.html Swift语言使用var定义变量，但和别的语言不同，Swift里不会自动给变量赋初始值，也就是说变量不会有默认值，所以要求使用变量之前必须要对其初始化。如果在使用变量之前不进行初始化就会报错： var stringValue : String //
centos7安装jdk1.7 jisonami jdk centos
安装JDK1.7 步骤1、解压tar包在当前目录 [root@localhost usr]#tar -xzvf jdk-7u75-linux-x64.tar.gz 步骤2：配置环境变量在etc/profile文件下添加 export JAVA_HOME=/usr/java/jdk1.7.0_75 export CLASSPATH=/usr/java/jdk1.7.0_75/lib
数据源架构模式之数据映射器 home198979 PHP 架构数据映射器 datamapper
前面分别介绍了数据源架构模式之表数据入口、数据源架构模式之行和数据入口数据源架构模式之活动记录，相较于这三种数据源架构模式，数据映射器显得更加“高大上”。一、概念数据映射器（Data Mapper）：在保持对象和数据库（以及映射器本身）彼此独立的情况下，在二者之间移动数据的一个映射器层。概念永远都是抽象的，简单的说，数据映射器就是一个负责将数据映射到对象的类数据。 &nb
在Python中使用MYSQL pda158 mysql python
缘由　　近期在折腾一个小东西须要抓取网上的页面。然后进行解析。将结果放到数据库中。　　了解到 Python在这方面有优势，便选用之。　　由于我有台 server上面安装有 mysql，自然使用之。在进行数据库的这个操作过程中遇到了不少问题，这里记录一下，大家共勉。　　 python中mysql的调用　　百度之后能够通过MySQLdb进行数据库操作。
单例模式 hxl1988_0311 java 单例设计模式单件
package com.sosop.designpattern.singleton; /* * 单件模式：保证一个类必须只有一个实例，并提供全局的访问点 * * 所以单例模式必须有私有的构造器，没有私有构造器根本不用谈单件 * * 必须考虑到并发情况下创建了多个实例对象 * */ /** * 虽然有锁，但是只在第一次创建对象的时候加锁，并发时不会存在效率
27种迹象显示你应该辞掉程序员的工作 vipshichg 工作
1、你仍然在等待老板在2010年答应的要提拔你的暗示。 2、你的上级近10年没有开发过任何代码。 3、老板假装懂你说的这些技术，但实际上他完全不知道你在说什么。 4、你干完的项目6个月后才部署到现场服务器上。 5、时不时的，老板在检查你刚刚完成的工作时，要求按新想法重新开发。 6、而最终这个软件只有12个用户。 7、时间全浪费在办公室政治中，而不是用在开发好的软件上。 8、部署前5分钟才开始测试。