AI科技大本营

如何在标准的机器学习流程上玩出新花样？

演讲嘉宾 | 谢迪，海康威视研究院前沿技术部负责人

整理 | 夕颜

导读：近日，CSDN与数字经济人才发展中心联合主办的第一届CTA核心技术及应用峰会在杭州开启。首届CTA核心技术及应用峰会围绕人工智能，邀请技术领航者，与开发者共同探讨机器学习和知识图谱的前沿研究及应用。在本次机器学习专场中，来自海康威视研究院前研技术部的负责人谢迪为我们带来了题为《How to Explore in Machine Learning Pipeline》（机器学习流程研究）的精彩演讲。

在机器学习时代，AI相关工作都是聚焦于具体的流程，如数据收集、模型训练、模型配置等。AI从业/从事人员众多，但大家做的事情很多都大同小异，这其实可以总结成一个标准的pipeline。但是，如何在机器学习的流水线上做出和别人不一样的工作，还是需要很多技巧。这次，谢迪将会为大家分享如何在标准的机器学习流水线上，通过多年积累获得的洞见，提升对于具体应用的认识。

标准机器学习Pipeline

如图所示，这是一个标准的机器学习流水线，我们可以收集数据、提取特征、训练分类器等。几年前深度学习还没有火的时候，我们靠人工提取算子，之后进行训练，最后得到我们想要的模型，去解决具体问题。

随着深度学习的兴起，中间的两块已经被神经网络统一，但是我们认为在工业界，要得到真正工作的机器学习pipeline，还有两个环节我们需要特别注意。其中包括数据的环节，因为数据并不是现成的，实际上现在人工智能深入发展，对公司来说很大部分的工作还是集中在数据标定上，有了标定的数据之后才能进行训练，最后得到一个模型。在海康威视，很多的应用以前是放在后端的，但现在都在逐渐向往边缘端转移，所以我们有相当一部分的工作是在边缘端的深度神经模型以及工业机器人的配置上。

机器学习pipeline实践

今天，我将和大家分享三个方面的工作，聚焦于标注、训练和部署，这三个环节分别代表了信息的生成、提炼、重新整合以及信息的去冗余。

▌1. 标注

通用函数近似器

这是第一项工作。我们知道，深度神经网络相比于传统的 SVM 或其他的线性模型，更类似于全局函数近似器，即输入 ground truth，它就能输出你想要的结果。

我们可以给定一个标注，输入更多信息量，比如一个人在图中的位置、关键点集合，甚至是一个非常稠密的网格。这是一个信息从少到多的过程，无论信息多复杂，在神经网络下都可以输出你想要的结果。换一个角度理解，神经网络对数据是非常敏感的。

多尺度对GT的影响

在安防场景中，我们最关心的是人和车。以行人检测为例，在一个场景中，我们会关心各个尺度的行人，但是神经网络对不同对象比较敏感，我们现在检测的框架是基于边界框的，对于大尺度的行人来说，红框标定行人没有问题，但是小尺度的行人标定存在两个问题，第一个问题是小尺度的对象本身提供的信息非常有限，第二个是小尺度对象的真值框差异非常大。

如右图所示，我们做了一个实验，让10个标定人员进行标定，蓝色表示 Bounding-box （边界框）标定方法，黄色是基于线段的标定方法，对于大尺度对象和小尺度对象，ground truth 的平均 IOU显示如图所示。可以看到，大尺度对象明显优于小尺度对象。基于神经网络对信息产生的方式非常敏感的前提来说，我们认为影响小目标检测的问题之一，可能是在于信息生成方式的歧义性。

TLL小尺度行人检测

为此我们提出了TLL。它的核心想法非常简单，即 Bounding-box 表示方法会影响极小目标的检出率，所以我们需要为小目标单独设计一种生成信息的方式，我们通过 Bounding-box 上下两点中心，做了一个连线，即把原来用一个 Bounding-box 表示一个物体的表示方式，变成了用一个线段表示一个人体，上端表示头，下端表示人与头之间的中心。

网络结构我们使用了 Hourglass 的沙漏结构。当然，多尺度是影响目标检测的原因，所以我们也是使用了多尺度信息聚合的方式。

我们的网络输出是三个特征图，分别表示人头、两脚和人体的分图。最后，我们用后处理的方法，通过二分图匹配得到最终的匹配结果，即图中虚线所示直线。

但在实际场景中，我们发现当人群密度比较密的时候，使用二分图匹配会出现如图所示的交叉结果，所以我们引入了马尔科夫随机场，不鼓励交叉情况的产生，这样就可以获得更好的结果，有效地避免了交叉产生。

在测试中，我们希望小目标的分辨率能够在10像素以下，越小越好，因为越小越能体现算法的优势，而对于检测过程中的帧漏检，相比基于光流的显示聚合方法，隐式的信息聚合方法可以进一步的提高检出率。

这是量化的结果，显示性能非常好。有个非常有趣的现象，我们仅仅是简单地改变了标注的方式，本质上即信息生成的方式，在严重遮挡的情况下，依然取得了更好的性能。

可以看到，无论在严重遮挡、远景，还是不规则的长宽比的配置下，这个方法还是有一定的优势。

这是定性的一些结果，像图中这样检测难度非常大的情况也可以检测出，稠密的行人也没有漏检。我们在一些目标项目中落地了这一方法，如在上海陆家嘴的环形天桥上，摄像头能够精确地统计天桥上行人的数量。

这个工作我们从 2017 年开始做，最初的目标检测用到了两阶段的方法，代表有 FastCNN。一步检测的代表框架有 SSD 和 YOLO，现在甚至有人在关注 Anchor-free 的方法，包括 FCOS、ReqPoints 等。这都是大家尝试找到一种不一样的边界框产生方式，能够更好地指导网络进行训练，并挖掘出原始数据中有价值的信息并用到具体的应用中。

▌2. 训练

神经网络训练洞见

我分享的第二个工作是如何训练神经网络，或者神经网络的本质是什么。训练神经网络有很多初始化方法和优化器，在训练中对信息进行归一化。

从信息传播的角度看，我们认为这些方法本质上是保持训练过程中或训练初始阶段的恒常性。恒常性可以分为两种，一种是静态恒常性，一种是动态恒常性。静态恒常性一般用在初始阶段，也就是初始化即可；动态恒常性就是优化的过程中，每一轮迭代都让信息的某种统计量保持不变。大家比较熟悉的初始化方法，包括Xavier、MSra、LSUV都属于静态恒常性，所有层保持在固定的数量级上，让初始权重的某些统计量保持在统一数量级上；动态恒常性包括 WN、BN、LN 等。但无论是哪种方式，无非就是设计某种规划，能够让信息的量级在某一个传播方向上保持不变，当然不是数字上的不变，而是统计量上的不变，因为神经网络的训练有点类似于蝴蝶效应，所以恒常性非常重要。

四个观点

先讲我们的四个观点：

第一，我们训练一个真正深的网络，批归一化是一个必要条件；
第二，相较于静态恒常性，动态恒常性更加重要；
第三，相较于单个方向保持动态恒常性，在训练时保持两个方向，同时保持动态的恒常性，才是解决这个问题的关键；
最后，如果模型非常深，可能还需要显示对传播的信号进行调控。

退化问题

大家可能说，用了ResNet 好像没有发生很难训练的情况，但是康奈尔大学的一篇文章指出，ResNet 本质上是指数级浅网络的聚合，如左图所示，我们的工作是对没有任何残差结构网络的训练方法。这种方法训练过程中会产生退化问题，即当以网络的层数作为横坐标、性能作为纵坐标，结果会如右图所示，网络层数小于等于20层时，简单堆叠网络层数会产生增益性能，但层数超过20，收敛率会大大下降，性能变差，这就是著名的深度神经网络训练退化的问题。我们的工作其实没有解决这个问题，只是缓解了这一问题，但希望可以给从业人员一些启发。

内在因素

我们认为原因可能有两个，第一是批归一化的伪归一化问题，前面的信号传递没有问题，在每一层卷积以后，信号虽然有时会被放大，有时会被缩小，但是经过批归一化以后，分布又能够被拉回来。但是如果推导反向评估显示，会发现当层数非常深时，误差累积的效应会让反向传播误差的分布越来越偏，造成训练出问题。

第二个原因可能更加深刻一点，我们知道反向传播的信号其实是和输出相对于输入息息相关。一般的工作可能推导到卷积层，我们还考虑了 BN 层，推导如图所示，在 MXM 层的方阵里面，左上角两个数值很有可能取到 0 或近似 0。底部的示意图表示一个信息量比较丰富的信号，在反向传播时，一层一层往回传会造成信号特定维度上的信息丢失。我们认为信息的丢失也会破坏动态恒常性，造成没有残差结构深度网络难以训练。

解决方案1：正规化

找到实用且有效的方法非常难，我们首先想到了一个数学公式，如果线性变化位于一个正交权上，就能获得输入和输出向量之间范数上的幅值等价性。但是我们发现，如果强制要求权重位于正交基上，很大程度会限制神经网络解空间的范围。我们用正交正则的思路替代 LR，去解决这个问题。

我们希望在反向传播时，信号的幅值能够位于比较稳定的范围内。由于各种应用不同，卷积神经网络会对应不同的超参数，输入和输出通道的不同等原因也会使得维度上出现一些问题。比如，在三维空间中找到四个相互正交的向量，在数学上是不可行的。对于输入维度小于输出的情况，需要要进行分组，让每个组的 din 大于等于 dout。

解决方案2：调制

第二个解决方案想法比较简单，就是对信号进行调制。在我们推导的公式中，为每一层设计一个符合该层的放大因子或缩小因子，该因子取值由该层的误差输出和输入的比值决定。此方法可以在训练一个没有残差的一百层网络的初始阶段使用。

实验结果

这是我们的一些实验的结果，最左图是每一层的 weights 相关度的曲线图，大家可以看到，绿色表示正交正则，蓝色表示权重衰减，用了正交正则以后，位置之间的夹角较大，夹角越大，相关度越低，此方法有效地保持了 weights 之间的低相关度。

右边的两幅图是反向传播的误差性浮值的曲线。同样地，蓝色是权重衰减的方法，绿色是正交正则方法，可以看到正交正则可以适当放大信号，有效保留反向传播中有用的信号，这些有用的部分，我们认为是能够让网络正常训练的关键因素。

我们对 SGD、正交正则和其他的一些自适应方法等进行比较，发现我们的方法能够获得较好的性能，当层数到达 110 层时，很多方法已经无法训练了，但我们的方法还是可以继续收敛，并可以用在残差网络里，但是对性能的提升不是很明显。

在其他人的工作中，我们也发现了类似的结论。BigGan 提到正交正则有利于 Gan 网络的稳定性。LARS 也提出了分层学习力的思想，只不过它使用了 weight 幅值与其梯度幅值的比值。

部署

▌模型压缩方法

以下的工作是模型部署。我们有很多摄像头产品，所以压缩方法是重中之重。

我今天要讲的是轻量级算子的相关工作，动机在于卷积是信息聚合的一种方式，可以分成两个阶段，一个是确定感受野，第二是确定两个向量之间的内积。3X3 的卷积既能满足感受野，也能兼顾 flops，所以大多数卷积是 3X3。

但是，我们是否能找到一个 1X1 的方式替代原来的卷积神经网络呢？答案是有的。那就是Shift操作，它可以把某一层的特征图进行平移，然后用 1X1 进行信息聚合，好处是没有额外的计算量。

因为最初的 shift CNN 需要人工确定平移的方向和大小，但我们想要通过自适应去学习平移方向，同时保持特征图不动，因为特征图移动会产生一定代价，所以我们用双向性插值，把平移的量切换为连续的浮点值，然后增加了一个鼓励稀疏的正则。

我们根据这个基本思想设计了一些基本模块，结合了下采样、多尺度融合等。

这是基于Unsigned Block做融合，用 4 领域的 shift 操作代替了 8 领域的 shift 操作。

我们还设计了兼顾效率的网络结构，以一种反规约的顺序进行 shift 卷积，增加了感受野的复杂度和聚合的复杂度，产生更好的效果，效率提升，跑得速度更快。

这是与 Mobilenet 和 ShuffleNet 性能比较。

这是我们对随机选取的六层网络进行可视化的结果，圈越大表示特征图越多，占比越高。统计显示，约 70% 的分类问题特征图是不需要移动的，这非常有趣。

这是上个月 MobileNetV3 的工作，我们的想法与之不谋而合：模块放置在深度滤波器的拓展之后，以将注意力应用于最大的表示......

最后是四点总结：

第一点，我们认为现在的深度学习框架中，模型对信息生成的方式非常敏感，可以考虑在把信息“喂”给模型之前，如何让信息的呈现方式歧义变小，这样可以获得更好的结果。
第二点，边界框可能已经过时了，我们需要想一些更加优雅、优美的表示方式。
第三点，我们认为训练神经网络时，动态恒常性是一个关键因素。
最后一点，对于芯片设计者来说，过多的算子会导致电路更复杂，就像检测框架会趋向于过程简化，我们认为算子也会进行收敛，以后的神经网络可能只有 1X1 的卷积，加上其他的操作就能够进行各种智能应用。

最后是我们发表的论文，大家有兴趣可以下载讨论，感谢大家的聆听，谢谢大家！

参考论文

Action Recognition:
- HCN: https://arxiv.org/pdf/1804.06055
- MV-CNN: https://arxiv.org/pdf/1903.01197
Model Compression:
- Channel Pruning: https://arxiv.org/pdf/1812.06611
- FENet: https://arxiv.org/pdf/1903.05285
- FGA: https://arxiv.org/pdf/1807.11254
Detection:
- TLL: https://arxiv.org/pdf/1807.01438
- https://arxiv.org/pdf/1710.10749
ReID: https://arxiv.org/pdf/1812.06576
- Optimization: https://arxiv.org/pdf/1703.01827

嘉宾介绍：

谢迪，海康威视研究院前沿技术部负责人，2012年毕业于浙江大学计算机学院，获得计算机视觉方向博士学位。现任海康威视研究院前沿技术部负责人，资深算法专家。主要负责计算机视觉、增量学习、深度网络优化等领域技术路线与方向的制定、前沿技术的研发以及算法创新及落地等工作。带领团队成员在计算机视觉及深度学习领域持续深耕，相继在视觉领域的各个世界级评测及竞赛中获得多项第一，包括KITTI、MOT Challenge、PASCAL VOC、LSVRC2016、Caltech等。在公司期间，于CVPR、ECCV、IJCAI、AAAI、ICIP等国际顶级会议上发表论文近20篇，其中提出的许多思想和方法被广泛应用于公司的各类平台和产品中。

（*本文为 AI科技大本营整理文章，转载请联系 1092722531）

◆

精彩推荐

◆

《程序员大本营》6月刊来啦~

更多福利限时免费领取：CSDN重磅技术大会精选视频以及200+PPT；机器学习、知识图谱、计算机视觉、区块链等100+技术公开课及PPT全奉送...

推荐阅读：

刷新记录，算法开源！字节跳动获人体姿态估计竞赛双冠 | CVPR 2019
ACL 2019 | 精选8篇微软ACL论文解读，一览最新研究进展
吐血总结！100个Python面试问题集锦（下）
六维图见过么？Python 画出来了
Facebook 发币 Libra；谷歌十亿美金为穷人造房；第四代树莓派 Raspberry Pi 4 发布 | 开发者周刊
华为“舵手”任正非
独家 | Vitalik Buterin：以太坊2.0之跨分片交易
面试官：你简历中写用过docker，能说说容器和镜像的区别吗？
想换行做 5G 的开发者到底该咋办？
如何向妹子解释：为啥 5G 来了需要换 SIM卡！

你点的每个“在看”，我都认真当成了喜欢

（五)PS识别：压缩痕迹挖掘-压缩量化表与 DCT 系数分析超龄超能程序猿机器学习 python 图像处理人工智能计算机视觉
（一)PS识别：Python图像分析PS识别之道（二）PS识别：特征识别-直方图分析的从原理到实现（三)PS识别：基于噪声分析PS识别的技术实现（四)PS识别：基于边缘纹理检测分析PS识别的技术实现一介绍本文将介绍一种基于量化表分析和DCT系数分析的图片PS检测方法，帮助你判断图片是否经过处理。二实现原理量化表分析在JPEG图片的压缩过程中，量化表起着关键作用。不同的软件或处理操作可能会改变量化表
数据库MySQL与SQLite afab 数据库数据库 sqlite
常用数据库及Qt中的用法一、常用数据库数据库管理系统（DBMS）是旨在使用、检索和定义规则以验证和操作数据库中的数据的软件。有四种DBMS类型：关系型、面向对象型、分层型和网络型。有很多开源数据库，包括MySQL、SQLite等。SQLite：是一个开源的关系型数据库管理系统（RDBMS）。RDBMS在多个二维表中存储数据，而不是一个大表。每张表由包含唯一值的行组成，该值被称为键，用于连接各表。这
算法分析与设计实验2：实现克鲁斯卡尔算法和prim算法表白墙上别挂我算法笔记经验分享
实验原理（一）克鲁斯卡尔算法：一种用于求解最小生成树问题的贪心算法，该算法的基本思想是按照边的权重从小到大排序，然后依次选择边，并加入生成树中，同时确保不会形成环路，直到生成树包含图中所有的顶点为止。具体步骤：边的排序：将所有边按照权重从小到大排序。初始化：创建一个空的生成树（可以是一个空的图结构），以及一个用于记录每个顶点所属集合（或称为连通分量）的数据结构（例如并查集）。边的选择：依次选择排序
【Rust】数据类型 Panda-gallery Rust rust 算法开发语言
目录思维导图1.数据类型概述1.1标量类型1.1.1整数类型1.1.2浮点数类型1.1.3布尔类型1.1.4字符类型1.2复合类型1.2.1元组类型1.2.2数组类型2.类型注解与类型推断3.整数溢出处理4.数字运算5.示例思维导图1.数据类型概述Rust是一种静态类型语言，所有变量的类型在编译时必须明确。Rust支持两种主要的数据类型：标量类型和复合类型。1.1标量类型标量类型表示单一值，Rus
MySQL与SQLite区别 GoKu~ mysql sqlite
MySQL和SQLite都是关系型数据库管理系统（RDBMS），它们都使用SQL（结构化查询语言）作为标准查询语言。然而，尽管它们共享许多共同点，但它们在语法、功能、性能和存储机制方面存在一些差异。以下是一些主要的差异：1.存储引擎：-MySQL：支持多种存储引擎，如InnoDB、MyISAM、Memory等，每种存储引擎都有不同的特性，如事务支持、索引类型、数据存储方式等。-SQLite：只有一
Python高频面试题（四） Irene-HQ 测试 python 自动化测试 python 开发语言面试测试工具 github pycharm
以下是Python研发和自动化测试面试中‌更高阶的专项考点及典型问题‌一、并发与异步编程（高级）‌GIL全局解释器锁的应对策略‌问题：GIL如何影响Python多线程性能？如何绕过GIL限制？答案：GIL使同一时刻仅一个线程执行字节码，CPU密集型任务性能受限绕过方案：使用多进程（multiprocessing）、C扩展（如Cython）、异步IO（asyncio）‌46‌协程异步调用示例‌问题：
SQLite和MySQL数据库的区别与应用坚持学习的小菜鸟数据库
简单来说，SQLITE功能简约，小型化，追求最大磁盘效率；MYSQL功能全面，综合化，追求最大并发效率。如果只是单机上用的，数据量不是很大，需要方便移植或者需要频繁读/写磁盘文件的话，就用SQLite比较合适；如果是要满足多用户同时访问，或者是网站访问量比较大是使用MYSQL比较合适。下面详细介绍两者的区别和应用：SQLiteSQLite是非凡的数据库，他可以进程在使用它的应用中。作为一个自包含、
（面经总结）一篇文章带你整理面试过程中常考的九大排序算法南淮北安冲刺大厂之面经总结面经排序算法二分插入冒泡快速
文章目录一、二分插入排序1.原理2.代码二、冒泡排序1.原理2.代码三、插入排序算法1.原理2.代码四、快速排序算法1.原理2.代码五、希尔排序1.原理2.代码六、归并排序1.原理2.代码七、桶排序八、基数排序九、堆排序1.原理2.代码十、总结1.算法分类2.性能分析一、二分插入排序首先必须是排好序的数组，然后通过二分查找，找到合适的位置，插入1.原理二分查找算法又叫作折半查找，要求待查找的序列有
Python常考面试题汇总（附答案） TT图图面试职场和发展
写在前面本文面向中高级Python开发，太基本的题目不收录。本文只涉及Python相关的面试题，关于网络、MySQL、算法等其他面试必考题会另外开专题整理。不是单纯的提供答案，抵制八股文！！更希望通过代码演示，原理探究等来深入讲解某一知识点，做到融会贯通。部分演示代码也放在了我的github的该目录下。语言基础篇Python的基本数据类型Python3中有六个标准的数据类型：Number（数字）(
Docker项目部署(黑马商城项目为例)
1.网络管理（容器互联）#创建自定义网络（项目隔离）dockernetworkcreatehmall-net//加入自定义网络的容器可以通过容器名互相访问#查看所有网络dockernetworkls#将现有容器加入网络（如MySQL）dockernetworkconnecthmall-netmysql--aliasdb2.MySQL容器部署（数据持久化）#启动MySQL容器dockerrun-d\
JavaScript Math（算数）详解 lsx202406 开发语言
JavaScriptMath（算数）详解引言JavaScriptMath对象是JavaScript内置的一个对象，用于执行基本的数学运算。它提供了一系列的静态方法，使得进行数学运算变得非常简单。本文将详细介绍JavaScriptMath对象的各个方法及其应用。Math对象概述Math对象是一个静态对象，意味着它不能被实例化。它包含了一些数学常量和方法，可以用来执行各种数学运算。Math对象的常量M
HTTP 响应头信息详解 lsx202406 开发语言
HTTP响应头信息详解引言HTTP（超文本传输协议）是互联网上应用最为广泛的网络协议之一。在HTTP协议中，响应头信息是服务器向客户端发送的重要信息之一。响应头信息包含了关于响应的元数据，如状态码、内容类型、缓存策略等。本文将详细介绍HTTP响应头信息的概念、类型、作用以及常见响应头信息的解析。HTTP响应头信息概述HTTP响应头信息是服务器在发送HTTP响应时，除了响应体之外，附加在响应体前面的
Rust 注释 froginwe11 开发语言
Rust注释引言Rust编程语言以其内存安全、并发支持和高性能等特点在软件开发领域获得了广泛的关注。在Rust编程中，注释是一种非常重要的元素，它不仅可以帮助程序员理解代码，还可以提高代码的可维护性和可读性。本文将详细介绍Rust中的注释类型、语法及其应用场景。一、Rust注释类型Rust中的注释主要分为两种类型：单行注释和多行注释。1.单行注释单行注释用于对代码的某一小部分进行简要说明。其语法格
Scala 简介 froginwe11 开发语言
Scala简介引言Scala是一种多范式编程语言，它结合了面向对象和函数式编程的特性。自从2003年由MartinOdersky教授在EPFL开发以来，Scala已经成为了在Java虚拟机（JVM）上运行的高效编程语言。本文将为您详细介绍Scala的起源、特点、应用场景以及学习资源。Scala的起源与发展起源Scala的灵感来源于多种编程语言，包括Java、C++、Self、Haskell和ML。
Swift 下标脚本 froginwe11 开发语言
Swift下标脚本引言Swift是一种强大的编程语言，广泛应用于iOS、macOS、watchOS和tvOS等平台。在Swift中，下标脚本（Subscript）是一种非常实用的特性，它允许你为结构体（Struct）和类（Class）提供类似数组或字典的下标访问方式。本文将深入探讨Swift下标脚本的使用方法、优势以及注意事项。下标脚本的基本概念在Swift中，下标脚本是一种简化访问集合中元素的方
SQLite 数据库与其他数据库的对比分析数据库管理艺术数据库专家之路大数据AI人工智能 MCP&Agent 数据库 sqlite ai
SQLite数据库与其他数据库的对比分析关键词：SQLite数据库、其他数据库、对比分析、数据库特性、应用场景摘要：本文旨在对SQLite数据库与其他常见数据库进行全面的对比分析。首先介绍了数据库对比分析的背景和目的，让读者了解为何需要进行这样的对比。接着详细阐述了SQLite以及其他具有代表性数据库（如MySQL、Oracle、PostgreSQL等）的核心概念和架构，通过Mermaid流程图展
Python 编程基础作业总结
本周主要围绕Python基础编程展开了学习，通过一系列的作业题来巩固所学知识。这些题目涵盖了输入输出、条件判断、循环结构等多个基础知识点，下面将对每道作业题进行详细分析。1.计算指定月份第一天是星期几题目描述编写一个程序，接受用户输入的一个年份和一个月份，输出该月份的第一天是星期几。使用蔡乐公式计算星期。提示：使用蔡乐公式计算星期。W=((26*M-2)/10+D+Y+Y/4+C/4-2*C)%7
SQLite - C/C++编程环境搭建与使用指南 lsx202406 开发语言
SQLite-C/C++编程环境搭建与使用指南引言SQLite是一款轻量级的数据库管理系统，广泛应用于嵌入式系统、移动设备、Web应用等场景。其独特的架构和易用性使其成为许多开发者的首选。本文将详细介绍如何搭建SQLite的C/C++编程环境，并探讨如何在C/C++程序中集成SQLite数据库。环境搭建1.获取SQLite首先，我们需要从SQLite的官方网站（https://www.sqlite
star31.6k，Aider：让代码编写如虎添翼的终端神器
ider是一款运行在终端中的AI结对编程工具，它能与大型语言模型（LLM）无缝协作，直接在您的本地Git仓库中编辑代码。无论是启动新项目，还是优化现有代码库，Aider都能成为您最得力的助手。它支持Claude3.5Sonnet、DeepSeekV3、GPT-4o等顶级AI模型，几乎可以连接任何LLM，让编程体验如虎添翼。Stars数35,188Forks数3,230主要特点Git操作：Aider
C# 上位机开发指南：高效学习建议 IT趣编程学习
C#作为一种编程语言，以其强大的功能、易学易用等特点，在工业自动化领域得到了广泛应用。特别是在上位机软件开发中，C#语言在.NET框架的强大生态系统，能够快速构建出高效、稳定的工业控制系统。本文将介绍C#在上位机开发中的应用并提供一些学习建议，希望通过本指南，能够帮助大家更好的学习上位机开发。前言上位机概念基础知识1、C#语言基础2、.NET框架3、桌面应用开发4、设备通信5、数据操作6、多线程和
如何自定义R语言函数？参数中的省略号`...`有什么用？「已注销」 python 编程语言 java 人工智能 c++
学习R未必要学习很多工具包，有时候根据自己的理解去自定义函数也是一个不错的选择。本篇推文主要介绍两方面的内容：在R语言中自定义函数的一般方法；函数参数中...的作用。在看函数的帮助文档时会发现许多函数的参数中都有...符号，它是表示被省略的参数吗？如果是，作者为什么会省略它？如果不是，那又表示什么含义呢？不久前，学堂君分享了自己编写的计算空间可达性的函数，详见推文：两步移动搜索法（2SFCA）计算
陈强《计量经济学及Stata应用》学习笔记——持续更新 WangSoooCute 学习笔记
1导论1.1什么是计量经济学econometrics几种关系：相关关系、因果关系、逆向因果关系reversecausality、双向因果关系被解释变量dependentvariable解释变量explanatoryvariable=regressor=自变量independentvariable=协变量covariateunobservable的误差项errorterm=随机扰动项stochast
【C#之模块化】C#和C++之不同的模块化形式子夏i C#C/C++c#c++
C#和C++之不同的模块化理念一、前言二、C++和C#的模块化方式1.C++2.C#一、前言C++和C#都支持面向对象编程，但C#通过简化模块化组织，移除了C++中诸如头文件和预处理器等被认为是冗余的设计元素。这种简化使得C#在面向对象方面更为直观和易于管理，能够获得更加清晰和一致的代码结构。二、C++和C#的模块化方式1.C++在C++中，模块化结构通常涉及头文件和源文件的分离。头文件包含类的声
php输出扶墙而立的三角形,扶墙而立的成长历程——涉县五中刘嘉巍王克丹 php输出扶墙而立的三角形
两周，我们就犹如一个婴儿，从母亲的怀抱实现了能够扶墙而立的成长历程。经过两周的实践，我基本能按照教案的要求，将一堂体育课较为完整执行开展，而且最重要的是我们每个人从心理上实现了从学生到教师的转变，当然这也体现在我们的举止、仪表、谈吐和教态间。相信，每一个实习老师在上完一节体育课后，心中总有那么股成就感和无限的自信。这就是我们成长与进步的最好体现。实践的操作、指导老师的传授、自己的亲身经验、使我们在
C# OPC UA 客户端开发实战：与PLC的数据交互仰望尾迹云
本文还有配套的精品资源，点击获取简介：本压缩包提供了一个利用C#与OPCUA和KepServerEX实现与PLC数据交互的项目案例。介绍了OPCUA协议的工业通信标准、KepServerEX的使用、C#在工业自动化中的应用、OPCUA客户端API的基本功能，以及相关的DLL文件和工具，旨在简化OPCUA客户端的开发流程，帮助开发者快速创建能够与PLC进行数据交互的C#应用程序。1.OPCUA（OP
MavenHelper插件：解决IntelliJ IDEA中Maven依赖冲突的利器
本文还有配套的精品资源，点击获取简介：MavenHelper是一款专门针对IntelliJIDEA设计的Maven插件，旨在帮助开发者快速识别和解决Maven项目中的依赖冲突问题。该插件能生成项目的依赖树，标记版本冲突的依赖项，并提供建议解决方案和可视化界面来管理依赖。此外，它还包括一键升级或降级依赖、清理Maven缓存和自定义配置功能，以确保与团队规范的一致性。通过使用MavenHelper，开
行业案例| MongoDB在腾讯零售优码中的应用 MongoDB中文社区 MongoDB 数据库 mongodb
本文主要分享腾讯智慧零售团队优码业务在MongoDB中的应用，采用腾讯云MongoDB作为主存储服务给业务带来了较大收益，主要包括：高性能、快捷的DDL操作、低存储成本、超大存储容量等收益，极大的降低了业务存储成本，并提高了业务迭代开发效率。一.业务场景腾讯优码从连接消费者到连接渠道终端，实现以货的数字化为基础的企业数字化升级，包含营销能力升级和动销能力升级。腾讯优码由正品通、门店通和会员通三个子
如何解决ubuntu 中DNS无法修改导致无法联网的问题 BTU_YC linux ubuntu ubuntu linux 服务器
写在前面：在刚开始遇到这个问题的时候，在网上搜了很多资料，都无法解决DNS总是无法修改，一些文章中提到过，直接修改的/etc/resolv.conf，之后确实能够通过pingwww.baidu.com的方式解决，但是当重启电脑的时候，网络有无法使用了。之前的方法就不提了，直接介绍一下我这解决的方法吧如何解决：先使用这个命令进入编辑页面vim/etc/systemd/resolved.conf输入命
ViP-LLaVA: 使大型多模态模型理解任意视觉提示 AI专题精讲 Paper阅读多模态人工智能 AI
摘要现有的大型视觉-语言多模态模型主要关注整体图像理解，但在实现区域特定的理解方面仍存在显著差距。目前，使用文本坐标或空间编码的方法通常无法为视觉提示提供用户友好的接口。为了解决这个问题，我们提出了一种新颖的多模态模型，能够解码任意（自由形式）视觉提示。这使得用户可以通过自然提示（如“红色边框”或“指向箭头”）直观地标记图像并与模型互动。我们的简单设计直接将视觉标记叠加在RGB图像上，避免了复杂的
opencv-python与opencv-contrib-python的区别联系剑心缘零碎小知识 python opencv
opencv-python包含基本的opencvopencv-contrib-python是高配版，带一些收费或者专利的算法，还有一些比较新的算法的高级版本,这些算法稳定之后会加入上面那个。官网对contrib模块的简介（点击链接跳转）参考链接
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &

如何在标准的机器学习流程上玩出新花样？

▌1. 标注

▌2. 训练

刷新记录，算法开源！字节跳动获人体姿态估计竞赛双冠 | CVPR 2019

你可能感兴趣的:(如何在标准的机器学习流程上玩出新花样？)