喜欢打酱油的老鸟

如何在标准的机器学习流程上玩出新花样？

https://www.toutiao.com/a6709031112284307980/

演讲嘉宾 | 谢迪，海康威视研究院前沿技术部负责人

整理 | 夕颜

导读：近日，CSDN与数字经济人才发展中心联合主办的第一届CTA核心技术及应用峰会在杭州开启。首届CTA核心技术及应用峰会围绕人工智能，邀请技术领航者，与开发者共同探讨机器学习和知识图谱的前沿研究及应用。在本次机器学习专场中，来自海康威视研究院前研技术部的负责人谢迪为我们带来了题为《How to Explore in Machine Learning Pipeline》（机器学习流程研究）的精彩演讲。

在机器学习时代，AI相关工作都是聚焦于具体的流程，如数据收集、模型训练、模型配置等。AI从业/从事人员众多，但大家做的事情很多都大同小异，这其实可以总结成一个标准的pipeline。但是，如何在机器学习的流水线上做出和别人不一样的工作，还是需要很多技巧。这次，谢迪将会为大家分享如何在标准的机器学习流水线上，通过多年积累获得的洞见，提升对于具体应用的认识。

标准机器学习Pipeline

如图所示，这是一个标准的机器学习流水线，我们可以收集数据、提取特征、训练分类器等。几年前深度学习还没有火的时候，我们靠人工提取算子，之后进行训练，最后得到我们想要的模型，去解决具体问题。

随着深度学习的兴起，中间的两块已经被神经网络统一，但是我们认为在工业界，要得到真正工作的机器学习pipeline，还有两个环节我们需要特别注意。其中包括数据的环节，因为数据并不是现成的，实际上现在人工智能深入发展，对公司来说很大部分的工作还是集中在数据标定上，有了标定的数据之后才能进行训练，最后得到一个模型。在海康威视，很多的应用以前是放在后端的，但现在都在逐渐向往边缘端转移，所以我们有相当一部分的工作是在边缘端的深度神经模型以及工业机器人的配置上。

机器学习pipeline实践

今天，我将和大家分享三个方面的工作，聚焦于标注、训练和部署，这三个环节分别代表了信息的生成、提炼、重新整合以及信息的去冗余。

▌1. 标注

通用函数近似器

这是第一项工作。我们知道，深度神经网络相比于传统的 SVM 或其他的线性模型，更类似于全局函数近似器，即输入 ground truth，它就能输出你想要的结果。

我们可以给定一个标注，输入更多信息量，比如一个人在图中的位置、关键点集合，甚至是一个非常稠密的网格。这是一个信息从少到多的过程，无论信息多复杂，在神经网络下都可以输出你想要的结果。换一个角度理解，神经网络对数据是非常敏感的。

多尺度对GT的影响

在安防场景中，我们最关心的是人和车。以行人检测为例，在一个场景中，我们会关心各个尺度的行人，但是神经网络对不同对象比较敏感，我们现在检测的框架是基于边界框的，对于大尺度的行人来说，红框标定行人没有问题，但是小尺度的行人标定存在两个问题，第一个问题是小尺度的对象本身提供的信息非常有限，第二个是小尺度对象的真值框差异非常大。

如右图所示，我们做了一个实验，让10个标定人员进行标定，蓝色表示 Bounding-box （边界框）标定方法，黄色是基于线段的标定方法，对于大尺度对象和小尺度对象，ground truth 的平均 IOU显示如图所示。可以看到，大尺度对象明显优于小尺度对象。基于神经网络对信息产生的方式非常敏感的前提来说，我们认为影响小目标检测的问题之一，可能是在于信息生成方式的歧义性。

TLL小尺度行人检测

为此我们提出了TLL。它的核心想法非常简单，即 Bounding-box 表示方法会影响极小目标的检出率，所以我们需要为小目标单独设计一种生成信息的方式，我们通过 Bounding-box 上下两点中心，做了一个连线，即把原来用一个 Bounding-box 表示一个物体的表示方式，变成了用一个线段表示一个人体，上端表示头，下端表示人与头之间的中心。

网络结构我们使用了 Hourglass 的沙漏结构。当然，多尺度是影响目标检测的原因，所以我们也是使用了多尺度信息聚合的方式。

我们的网络输出是三个特征图，分别表示人头、两脚和人体的分图。最后，我们用后处理的方法，通过二分图匹配得到最终的匹配结果，即图中虚线所示直线。

但在实际场景中，我们发现当人群密度比较密的时候，使用二分图匹配会出现如图所示的交叉结果，所以我们引入了马尔科夫随机场，不鼓励交叉情况的产生，这样就可以获得更好的结果，有效地避免了交叉产生。

在测试中，我们希望小目标的分辨率能够在10像素以下，越小越好，因为越小越能体现算法的优势，而对于检测过程中的帧漏检，相比基于光流的显示聚合方法，隐式的信息聚合方法可以进一步的提高检出率。

这是量化的结果，显示性能非常好。有个非常有趣的现象，我们仅仅是简单地改变了标注的方式，本质上即信息生成的方式，在严重遮挡的情况下，依然取得了更好的性能。

可以看到，无论在严重遮挡、远景，还是不规则的长宽比的配置下，这个方法还是有一定的优势。

这是定性的一些结果，像图中这样检测难度非常大的情况也可以检测出，稠密的行人也没有漏检。我们在一些目标项目中落地了这一方法，如在上海陆家嘴的环形天桥上，摄像头能够精确地统计天桥上行人的数量。

这个工作我们从 2017 年开始做，最初的目标检测用到了两阶段的方法，代表有 FastCNN。一步检测的代表框架有 SSD 和 YOLO，现在甚至有人在关注 Anchor-free 的方法，包括 FCOS、ReqPoints 等。这都是大家尝试找到一种不一样的边界框产生方式，能够更好地指导网络进行训练，并挖掘出原始数据中有价值的信息并用到具体的应用中。

▌2. 训练

神经网络训练洞见

我分享的第二个工作是如何训练神经网络，或者神经网络的本质是什么。训练神经网络有很多初始化方法和优化器，在训练中对信息进行归一化。

从信息传播的角度看，我们认为这些方法本质上是保持训练过程中或训练初始阶段的恒常性。恒常性可以分为两种，一种是静态恒常性，一种是动态恒常性。静态恒常性一般用在初始阶段，也就是初始化即可；动态恒常性就是优化的过程中，每一轮迭代都让信息的某种统计量保持不变。大家比较熟悉的初始化方法，包括Xavier、MSra、LSUV都属于静态恒常性，所有层保持在固定的数量级上，让初始权重的某些统计量保持在统一数量级上；动态恒常性包括 WN、BN、LN 等。但无论是哪种方式，无非就是设计某种规划，能够让信息的量级在某一个传播方向上保持不变，当然不是数字上的不变，而是统计量上的不变，因为神经网络的训练有点类似于蝴蝶效应，所以恒常性非常重要。

四个观点

先讲我们的四个观点：

第一，我们训练一个真正深的网络，批归一化是一个必要条件；
第二，相较于静态恒常性，动态恒常性更加重要；
第三，相较于单个方向保持动态恒常性，在训练时保持两个方向，同时保持动态的恒常性，才是解决这个问题的关键；
最后，如果模型非常深，可能还需要显示对传播的信号进行调控。

退化问题

大家可能说，用了ResNet 好像没有发生很难训练的情况，但是康奈尔大学的一篇文章指出，ResNet 本质上是指数级浅网络的聚合，如左图所示，我们的工作是对没有任何残差结构网络的训练方法。这种方法训练过程中会产生退化问题，即当以网络的层数作为横坐标、性能作为纵坐标，结果会如右图所示，网络层数小于等于20层时，简单堆叠网络层数会产生增益性能，但层数超过20，收敛率会大大下降，性能变差，这就是著名的深度神经网络训练退化的问题。我们的工作其实没有解决这个问题，只是缓解了这一问题，但希望可以给从业人员一些启发。

内在因素

我们认为原因可能有两个，第一是批归一化的伪归一化问题，前面的信号传递没有问题，在每一层卷积以后，信号虽然有时会被放大，有时会被缩小，但是经过批归一化以后，分布又能够被拉回来。但是如果推导反向评估显示，会发现当层数非常深时，误差累积的效应会让反向传播误差的分布越来越偏，造成训练出问题。

第二个原因可能更加深刻一点，我们知道反向传播的信号其实是和输出相对于输入息息相关。一般的工作可能推导到卷积层，我们还考虑了 BN 层，推导如图所示，在 MXM 层的方阵里面，左上角两个数值很有可能取到 0 或近似 0。底部的示意图表示一个信息量比较丰富的信号，在反向传播时，一层一层往回传会造成信号特定维度上的信息丢失。我们认为信息的丢失也会破坏动态恒常性，造成没有残差结构深度网络难以训练。

解决方案1：正规化

找到实用且有效的方法非常难，我们首先想到了一个数学公式，如果线性变化位于一个正交权上，就能获得输入和输出向量之间范数上的幅值等价性。但是我们发现，如果强制要求权重位于正交基上，很大程度会限制神经网络解空间的范围。我们用正交正则的思路替代 LR，去解决这个问题。

我们希望在反向传播时，信号的幅值能够位于比较稳定的范围内。由于各种应用不同，卷积神经网络会对应不同的超参数，输入和输出通道的不同等原因也会使得维度上出现一些问题。比如，在三维空间中找到四个相互正交的向量，在数学上是不可行的。对于输入维度小于输出的情况，需要要进行分组，让每个组的 din 大于等于 dout。

解决方案2：调制

第二个解决方案想法比较简单，就是对信号进行调制。在我们推导的公式中，为每一层设计一个符合该层的放大因子或缩小因子，该因子取值由该层的误差输出和输入的比值决定。此方法可以在训练一个没有残差的一百层网络的初始阶段使用。

实验结果

这是我们的一些实验的结果，最左图是每一层的 weights 相关度的曲线图，大家可以看到，绿色表示正交正则，蓝色表示权重衰减，用了正交正则以后，位置之间的夹角较大，夹角越大，相关度越低，此方法有效地保持了 weights 之间的低相关度。

右边的两幅图是反向传播的误差性浮值的曲线。同样地，蓝色是权重衰减的方法，绿色是正交正则方法，可以看到正交正则可以适当放大信号，有效保留反向传播中有用的信号，这些有用的部分，我们认为是能够让网络正常训练的关键因素。

我们对 SGD、正交正则和其他的一些自适应方法等进行比较，发现我们的方法能够获得较好的性能，当层数到达 110 层时，很多方法已经无法训练了，但我们的方法还是可以继续收敛，并可以用在残差网络里，但是对性能的提升不是很明显。

在其他人的工作中，我们也发现了类似的结论。BigGan 提到正交正则有利于 Gan 网络的稳定性。LARS 也提出了分层学习力的思想，只不过它使用了 weight 幅值与其梯度幅值的比值。

部署

▌模型压缩方法

以下的工作是模型部署。我们有很多摄像头产品，所以压缩方法是重中之重。

我今天要讲的是轻量级算子的相关工作，动机在于卷积是信息聚合的一种方式，可以分成两个阶段，一个是确定感受野，第二是确定两个向量之间的内积。3X3 的卷积既能满足感受野，也能兼顾 flops，所以大多数卷积是 3X3。

但是，我们是否能找到一个 1X1 的方式替代原来的卷积神经网络呢？答案是有的。那就是Shift操作，它可以把某一层的特征图进行平移，然后用 1X1 进行信息聚合，好处是没有额外的计算量。

因为最初的 shift CNN 需要人工确定平移的方向和大小，但我们想要通过自适应去学习平移方向，同时保持特征图不动，因为特征图移动会产生一定代价，所以我们用双向性插值，把平移的量切换为连续的浮点值，然后增加了一个鼓励稀疏的正则。

我们根据这个基本思想设计了一些基本模块，结合了下采样、多尺度融合等。

这是基于Unsigned Block做融合，用 4 领域的 shift 操作代替了 8 领域的 shift 操作。

我们还设计了兼顾效率的网络结构，以一种反规约的顺序进行 shift 卷积，增加了感受野的复杂度和聚合的复杂度，产生更好的效果，效率提升，跑得速度更快。

这是与 Mobilenet 和 ShuffleNet 性能比较。

这是我们对随机选取的六层网络进行可视化的结果，圈越大表示特征图越多，占比越高。统计显示，约 70% 的分类问题特征图是不需要移动的，这非常有趣。

这是上个月 MobileNetV3 的工作，我们的想法与之不谋而合：模块放置在深度滤波器的拓展之后，以将注意力应用于最大的表示......

最后是四点总结：

第一点，我们认为现在的深度学习框架中，模型对信息生成的方式非常敏感，可以考虑在把信息“喂”给模型之前，如何让信息的呈现方式歧义变小，这样可以获得更好的结果。
第二点，边界框可能已经过时了，我们需要想一些更加优雅、优美的表示方式。
第三点，我们认为训练神经网络时，动态恒常性是一个关键因素。
最后一点，对于芯片设计者来说，过多的算子会导致电路更复杂，就像检测框架会趋向于过程简化，我们认为算子也会进行收敛，以后的神经网络可能只有 1X1 的卷积，加上其他的操作就能够进行各种智能应用。

最后是我们发表的论文，大家有兴趣可以下载讨论，感谢大家的聆听，谢谢大家！

参考论文

Action Recognition:
HCN: https://arxiv.org/pdf/1804.06055
MV-CNN: https://arxiv.org/pdf/1903.01197
Model Compression:
Channel Pruning: https://arxiv.org/pdf/1812.06611
FENet: https://arxiv.org/pdf/1903.05285
FGA: https://arxiv.org/pdf/1807.11254
Detection:
TLL: https://arxiv.org/pdf/1807.01438
https://arxiv.org/pdf/1710.10749
ReID: https://arxiv.org/pdf/1812.06576
Optimization: https://arxiv.org/pdf/1703.01827

嘉宾介绍：

谢迪，海康威视研究院前沿技术部负责人，2012年毕业于浙江大学计算机学院，获得计算机视觉方向博士学位。现任海康威视研究院前沿技术部负责人，资深算法专家。主要负责计算机视觉、增量学习、深度网络优化等领域技术路线与方向的制定、前沿技术的研发以及算法创新及落地等工作。带领团队成员在计算机视觉及深度学习领域持续深耕，相继在视觉领域的各个世界级评测及竞赛中获得多项第一，包括KITTI、MOT Challenge、PASCAL VOC、LSVRC2016、Caltech等。在公司期间，于CVPR、ECCV、IJCAI、AAAI、ICIP等国际顶级会议上发表论文近20篇，其中提出的许多思想和方法被广泛应用于公司的各类平台和产品中。

探秘IO分布式模块设计：让大数据处理更高效清水湾落车分布式
一、引言随着互联网的飞速发展，大数据、云计算、人工智能等技术逐渐成为时代的主流。在这个数据爆炸的时代，如何高效地处理海量数据成为企业面临的重大挑战。IO分布式模块设计作为一种有效的解决方案，越来越受到关注。本文将带您了解IO分布式模块设计的基本概念、原理及其在实际应用中的优势。二、什么是IO分布式模块设计？IO分布式模块设计，是指将数据存储、数据处理、数据传输等IO操作进行分布式处理的一种设计方法
【人工智能】Python实战：构建高效的多任务学习模型蒙娜丽宁 Python杂谈 AI 人工智能 python 学习
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界多任务学习（Multi-taskLearning,MTL）作为机器学习领域中的一种重要方法，通过在单一模型中同时学习多个相关任务，不仅能够提高模型的泛化能力，还能有效利用任务间的共享信息。本文深入探讨了多任务学习的基本概念、优势及其在实际应用中的重要性。
以Python构建ONE FACE管理界面：从基础至进阶的实战探索 Allen_LVyingbo python python pyqt
一、引言1.1研究背景与意义在人工智能技术蓬勃发展的当下，面部识别技术凭借其独特优势，于安防、金融、智能终端等众多领域广泛应用。在安防领域，可助力监控系统精准识别潜在威胁人员，提升公共安全保障水平；金融行业中，实现刷脸支付、远程开户等便捷服务，优化用户体验并强化交易安全。智能终端方面，为设备解锁、身份验证等功能提供支持，提升设备使用的便捷性与安全性。然而，现有面部识别系统在数据安全、检索效率及用户
明达云：赋能化工园区，智绘安全高效新蓝图明达技术物联网网络
在日新月异的科技浪潮中，数字化转型已成为各行各业转型升级的关键驱动力。尤其在化工这一关乎国家经济命脉与安全环保的重要领域，如何实现智能化管理、提升运营效率、确保生产安全，成为了摆在众多化工园区面前的重大课题。在此背景下，明达云平台以其卓越的技术实力与深厚的行业经验，正逐步成为化工园区智慧化升级的首选伙伴。智慧监管，安全先行化工生产，安全为先。明达云平台通过集成物联网、大数据、人工智能等先进技术，为
AI大模型：开启智能革命新纪元洋洋科创星球 AI项目管理赋能实战人工智能
1.AI大模型技术：智能革命的新引擎自2022年11月30日OpenAI推出ChatGPT以来，这一大型语言模型（LLM）迅速走红，标志着AI领域进入了一个新的发展阶段，即AI大模型时代。这一时代预示着AI正朝着通用人工智能（AGI）的方向发展。尽管业界对大模型的定义尚未统一，但通常指的是基于Transformer框架的大型语言模型，广义上也包括了多模态大模型，如涉及语言、声音、图像、视频等，技术
比亚迪进军具身智能：未来实验室的战略布局与挑战前端
比亚迪，这家以新能源汽车闻名全球的企业，正在悄然布局一个全新的领域——具身智能及机器人技术。近日，比亚迪成立未来实验室的消息引发广泛关注，其战略意义和未来发展前景值得我们深入探讨。在人工智能技术飞速发展的今天，选择合适的AI写代码工具对于项目的成功至关重要。比亚迪未来实验室的战略意义：汽车基因与智能融合比亚迪进军机器人领域并非偶然之举。其深厚的汽车制造经验和规模化生产能力，为其在机器人研发方面奠定
苹果携手腾讯字节跳动：AI代码生成器赋能iPhone，开启移动智能新时代？前端
近年来，人工智能技术飞速发展，其在移动设备上的应用也日益普及。近日，路透社爆料称苹果公司正在与腾讯和字节跳动商谈，计划将它们的AI模型整合到在中国销售的iPhone中，这一消息迅速引发了业界广泛关注。这不仅预示着苹果在AI领域的战略布局进一步深化，也标志着AI技术在移动设备应用领域迈入了一个新的里程碑。这篇文章将深入探讨苹果此举的意义、挑战以及对整个AI产业的影响。整合AI模型：机遇与挑战并存苹果
关于2025年人工智能agent的5个预测大模型微调实战人工智能语言模型机器学习自然语言处理
2024年是人工智能agent走向主流的一年。从年初黑客们那些笨拙、昂贵且充满激情的项目开始，agent现在已经得到了科技巨头、SaaS公司、学术研究人员等更多人的接纳。与此同时，他们的形式也在不断增多，从文本扩展到多种模式，并在现实世界中执行行动的能力也变得更强大。在这里，我预测2025年agent领域的轨迹，因为它开始在人工智能社区之外产生影响力。1.对agent的兴趣持续激增今年，对人工智能
《AGI：开启智能新纪元的钥匙》空云风语人工智能深度学习神经网络 agi 人工智能深度学习 AIGC
一、AGI：人工智能的进阶之路在科技飞速发展的当下，人工智能（AI）已逐渐渗透到我们生活的各个角落，从智能手机中的语音助手，到自动驾驶汽车，再到医疗领域的疾病诊断辅助，AI的身影无处不在。然而，在AI的宏大版图中，当前被广泛应用的大多属于狭义人工智能（NarrowAI），它专注于特定领域的任务执行，而通用人工智能（ArtificialGeneralIntelligence，简称AGI）则代表着人工
零售业的AI赋能与前端开发效率革命：ScriptEcho 的助力前端
零售业正经历着前所未有的数字化转型，但同时也面临着巨大的挑战。库存管理混乱、个性化客户体验不足等问题，严重制约着零售企业的盈利能力。而人工智能（AI）的兴起，为解决这些问题提供了新的思路。通过AI驱动的实时库存管理和客户行为分析，零售企业可以显著提升运营效率和客户满意度。然而，构建这些AI赋能的零售应用，需要强大的前端开发能力，这正是AI代码生成器ScriptEcho能够发挥关键作用的地方。AI赋
人工智能时代，企业如何搭建自己的AI知识库知识库知识库管理知识库软件
随着人工智能技术的迅猛发展，企业越来越意识到构建AI知识库的重要性。AI知识库不仅能够高效管理企业的海量知识资源，还能通过智能检索和推荐，提升员工的工作效率，促进企业的创新与发展。本文将详细探讨企业如何搭建自己的AI知识库，包括前期准备、技术选型、构建过程及后续维护等方面。一、前期准备在构建AI知识库之前，企业需要进行充分的前期准备，明确需求和目标。确定需求和目标企业首先需要明确知识库的服务对象、
科技早报｜OpenAI的人工智能模型销售收入超过微软类似业务；荣耀中国区CMO辟谣将采用麒麟芯片 | 最新快讯最新科技快讯科技人工智能 microsoft
科大讯飞新模型在测试集结果中超越GPT-4Turbo6月27日，科大讯飞发布讯飞星火大模型V4.0。与此前的版本相比，新模型在文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等七大能力上都有提升。例如，讯飞星火可以根据用户的语言描述，结合空间和常识推断描述对象所在的位置。而在图文识别上，讯飞星火大模型V4.0能力也进一步升级，在科研、金融、医疗、司法、办公等场景的应用效果已领
产生式系统实验头歌实验测试不通过解决（人工智能）兜里没有一毛钱人工智能 python numpy 数据分析人工智能机器学习
任务描述本关任务：编写一个使用产生式方法识别动物的系统。编程要求根据提示，在右侧编辑器补充代码，完成产生式系统——动物识别系统的操作，最后达到输入动物特征，输出动物类型的结果。特别说明在这个实验中，存在一个实验现象,就是你的自测运行输出结果与实验要求输出结果一模一样也不能通过，为什么呢？答：这个不知道算不算是头歌实验平台存在bug，一般我们在编写程序代码中，要求格式都是英文格式，但是在这个实验测试
改进yolov8工业缺陷检测+swin+transformer qq1309399183 计算机视觉实战项目集合 YOLO transformer 深度学习人工智能计算机视觉机器学习神经网络
使用NEU-DET数据集进行缺陷检测的YOLOv8改进模型应用详解在现代工业生产过程中，质量控制是至关重要的一个环节。随着机器视觉技术和人工智能算法的发展，基于深度学习的方法已经成为自动化缺陷检测的重要工具。本篇将介绍一种基于NEU-DET数据集，利用YOLOv8及其改进版本（包含坐标注意力机制和SwinTransformer）进行缺陷检测的应用开发过程。我们将详细探讨从数据准备到模型训练，再到最
智能体（AI Agent）全解析：概念、原理至应用深度探索网安猫叔人工智能语言模型自然语言处理 AIGC 机器学习
一、智能体概念的深度剖析1.1智能体（Agent）的本质智能体，作为人工智能领域的一颗璀璨明珠，是那些能够主动感知周遭环境、自主决策并付诸实践的系统实体。它们不仅拥有自主性、交互性、反应灵敏及高度适应性等鲜明特征，更在复杂多变的情境中展现出卓越的自我管理与任务执行能力。智能体的诞生，标志着人工智能技术从机械式的规则遵循迈向了更为灵活、智能的自主决策新时代。智能体的核心精髓在于其内置的学习与决策引擎
改进yolov8缺陷检测+swin+transformer QQ_1309399183 计算机视觉实战项目集锦 YOLO transformer 深度学习人工智能计算机视觉 opencv 机器学习
使用NEU-DET数据集进行缺陷检测的YOLOv8改进模型应用详解在现代工业生产过程中，质量控制是至关重要的一个环节。随着机器视觉技术和人工智能算法的发展，基于深度学习的方法已经成为自动化缺陷检测的重要工具。本篇将介绍一种基于NEU-DET数据集，利用YOLOv8及其改进版本（包含坐标注意力机制和SwinTransformer）进行缺陷检测的应用开发过程。我们将详细探讨从数据准备到模型训练，再到最
全网最全Stable diffusion保姆级教程「安装-配置-画图」，小白必收藏！！ AI想象家 stable diffusion AI作画 midjourney 人工智能深度学习
随着chatgpt爆火之后，越来越多的人开始关注人工智能，人工智能相关的其他应用如AI绘画，也再次得到人们的关注。AI绘画的确很上头，最近几天小编也研究一下，这里把研究的过程以及中间遇到的问题整理一下，我这里遇到的问题，相信新入门的小白也会遇到，希望本文对你能有一定的帮助。给大家带来了全新保姆级教程资料包（文末可获取）目前常用的AI绘画工具主要有两种：stablediffusion和midjour
AI赋能：高职院校实验实训教学如何拥抱人工智能浪潮？武汉唯众智创人工智能实训人工智能实验实训教学
随着信息技术的迅猛发展，人工智能技术已成为推动社会各行业转型升级的核心力量。它不仅在提升生产效率、优化管理流程、提高服务质量方面发挥着关键作用，也深刻影响着高职教育的专业发展和课程教学内容的改革。作为培养专业技术技能人才的摇篮，高职院校必须创新其教学模式和方法，以适应新的发展需求，从而培育出能够适应未来技术变革的高素质人才。特别是在实验实训教学领域，人工智能的融入为职业教育改革提供了新的思路和工具
“数据飞轮” 理念焕新，助力 2025 企业数智化发展大数据大模型
2024年，全球科技领域在人工智能浪潮的席卷下加速前行，数字化转型进程也随之踏入全新阶段。在这一背景下，数据飞轮理念延续“以数据消费促资产建设，以数据消费助业务发展”的核心内涵，实现焕新升级。在2025年，升级后的数据飞轮2.0，将AI视作数智化的核心竞争力，借助AI技术推动企业更普惠的数据消费。“数据飞轮”2.0的理念，带来了多方面的显著升级。其一，它将AI技术深度融入数据生产、管理与应用各环节
用大数据“喂养”出来的AI模型ChatGPT 爆火是大数据、大算力、强算法的支撑，中国缺乏的什么？ Ai17316391579 深度学习服务器人工智能
先来了解一下ChatGPT的基本情况ChatGPT本质属于生成式人工智能，属于无监督或半监督的机器学习。与之相关的还有Discriminativemodeling区分式模型，区分式模型大多属于监督式学习。生成性人工智能目前有两种主要的框架：GAN（GenerativeAdversarialNetwork）和GPT（GenerativePre-trainedTransformer）。GAN目前广泛应
英伟达最新的算力芯片Blackwell芯片名为GB200 算力资源比较多算力智算大模型人工智能 gpu算力语言模型大数据推荐算法
英伟达最新的算力芯片相关信息如下：Blackwell芯片：英伟达在2024年6月2日由创始人兼CEO黄仁勋宣布，其Blackwell芯片已开始投产。第一款Blackwell芯片名为GB200，被宣称为目前“全球最强大的芯片”。Blackwell芯片基于新的BlackwellGPU架构，专为人工智能模型设计。每个B200GPU包含2080亿个晶体管，GB200由两个这样的GPU和一个GraceCPU
Python语言的编程范式 AI向前看包罗万象 golang 开发语言后端
Python语言的编程范式Python是一种广泛使用的高级编程语言，它因其简单易读的语法和强大的功能而受到程序员的喜爱。自1991年由荷兰人GuidolvanRossum首次发布以来，Python的发展迅速，其应用范围涵盖了Web开发、数据分析、人工智能、科学计算、自动化等多个领域。本文将深入探讨Python的编程范式，帮助读者更好地理解该语言的特性和优势。1.什么是编程范式编程范式是对程序设计风
火山引擎数据飞轮2.0：聚焦Data+AI，驱动企业数智化转型大数据
数字化浪潮席卷全球，数据与人工智能的融合正给各行各业带来巨大变革，不仅重塑数据处理流程，更在决策支持、业务优化、产品创新等多个维度上展现巨大的潜力。近期，火山引擎数智平台技术和产品专家受邀出席DataFun首届“数据与人工智能解决方案大会”，围绕数据飞轮2.0模式，及Data+AI领域热门话题ChatBI、多模态数据湖展开分享。据介绍，2023年4月火山引擎发布了数据飞轮，其内核为“以数据消费促资
AI未来趋势：AIGC浪潮下看AI训练师如何塑造智能未来（技术变革）用心去追梦前端 html css
在AIGC（AIGeneratedContent，人工智能生成内容）浪潮下，AI训练师扮演着至关重要的角色，他们不仅推动了技术的发展，还在确保这些技术能够安全、高效地服务于社会方面发挥了重要作用。以下是AI训练师如何塑造智能未来的几个关键方面：1.技术变革与创新算法与模型训练预训练：通过大规模无标注数据的学习，构建具备基础语言理解和生成能力的基座模型。这一过程为后续更精细的任务打下了坚实的基础。指
深入理解AIGC背后的核心算法：GAN、Transformer与Diffusion Models 忘梓. 杂文 AIGC 算法生成对抗网络
深入理解AIGC背后的核心算法：GAN、Transformer与DiffusionModels前言随着人工智能技术的发展，AIGC（AIGeneratedContent，人工智能生成内容）已经不再是科幻电影中的幻想，而成为了现实生活中的一种新兴力量。无论是自动生成文章、绘制图像、生成音乐还是创作视频，AIGC都在各个内容创作领域崭露头角。然而，这些“智能创作”的背后究竟依赖于哪些算法？今天，我们将
AIGC - 深度洞察如何对大模型进行微调以满足特定需求网罗开发 AI 大模型人工智能 AIGC
网罗开发（视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：COC上海社区主理
如何使用LangChain内置工具和工具包 jkgSFS langchain microsoft python
在当今快速发展的人工智能应用开发中，利用现有的工具和工具包能大幅加快开发进程，提高应用的效率和功能性。本文将带您深入了解LangChain中的内置工具和工具包的使用方法，并通过示例代码进行演示。技术背景介绍LangChain是一个旨在简化应用程序创建的框架，其拥有丰富的第三方工具集成。这些工具可以帮助开发者轻松访问和操作如Wikipedia等大型数据集。核心原理解析LangChain工具通过API
亮相AICon，火山引擎边缘云揭秘边缘AI Agent探索与实践边缘计算智能硬件ai开发
12月13-14日，AICon全球人工智能开发与应用大会在北京成功举办。火山引擎边缘智能技术负责人谢皓受邀出席大会，以《AIAgent在边缘云的探索与实践》为主题，与全球AI领域的资深专家，共同深入探讨大模型落地、具身智能、多模态大模型、AIAgent等前沿技术如何推动行业变革、引领未来发展。火山引擎边缘智能技术负责人谢皓指出，随着AI时代的到来，边缘智能由传统的物联网、智慧物联，逐渐演变成智能体
论文阅读笔记：AI+RPA 几道之旅人工智能
文章目录论文题目下载地址论文摘要论文题目Challengesandopportunities:ImplementingRPAandAIinfrauddetectioninthebankingsector下载地址点击这里下载论文摘要在银行业中，将机器人流程自动化（RPA）和人工智能（AI）集成用于欺诈检测是一项重大变革，既带来了挑战，也带来了机遇。随着金融机构面临日益复杂的欺诈企图，RPA和AI成为
PyTorch 基础数据集：从理论到实践的深度学习基石那年一路北 Pytorch理论+实践深度学习 pytorch 人工智能
一、引言深度学习作为当今人工智能领域的核心技术，在图像识别、自然语言处理、语音识别等众多领域取得了令人瞩目的成果。而在深度学习的体系中，数据扮演着举足轻重的角色，它是模型训练的基础，如同建筑的基石，决定了模型的性能和泛化能力。PyTorch作为当下最流行的深度学习框架之一，为开发者提供了丰富且强大的工具来处理数据集。本文将深入探讨PyTorch中的基础数据集，从深度学习中数据的重要性出发，详细介绍
xml解析小猪猪08 xml
1、DOM解析的步奏准备工作： 1.创建DocumentBuilderFactory的对象 2.创建DocumentBuilder对象 3.通过DocumentBuilder对象的parse(String fileName)方法解析xml文件 4.通过Document的getElem
每个开发人员都需要了解的一个SQL技巧 brotherlamp linux linux视频 linux教程 linux自学 linux资料
对于数据过滤而言CHECK约束已经算是相当不错了。然而它仍存在一些缺陷，比如说它们是应用到表上面的，但有的时候你可能希望指定一条约束，而它只在特定条件下才生效。使用SQL标准的WITH CHECK OPTION子句就能完成这点，至少Oracle和SQL Server都实现了这个功能。下面是实现方式： CREATE TABLE books ( id &
Quartz——CronTrigger触发器 eksliang quartz CronTrigger
转载请出自出处：http://eksliang.iteye.com/blog/2208295 一.概述 CronTrigger 能够提供比 SimpleTrigger 更有具体实际意义的调度方案，调度规则基于 Cron 表达式，CronTrigger 支持日历相关的重复时间间隔（比如每月第一个周一执行），而不是简单的周期时间间隔。二.Cron表达式介绍 1）Cron表达式规则表 Quartz
Informatica基础 18289753290 Informatica Monitor manager workflow Designer
1. 1）PowerCenter Designer：设计开发环境，定义源及目标数据结构；设计转换规则，生成ETL映射。 2）Workflow Manager：合理地实现复杂的ETL工作流，基于时间，事件的作业调度 3）Workflow Monitor：监控Workflow和Session运行情况，生成日志和报告 4）Repository Manager：
linux下为程序创建启动和关闭的的sh文件，scrapyd为例酷的飞上天空 scrapy
对于一些未提供service管理的程序每次启动和关闭都要加上全部路径，想到可以做一个简单的启动和关闭控制的文件下面以scrapy启动server为例，文件名为run.sh： #端口号，根据此端口号确定PID PORT=6800 #启动命令所在目录 HOME='/home/jmscra/scrapy/' #查询出监听了PORT端口
人--自私与无私永夜-极光
今天上毛概课,老师提出一个问题--人是自私的还是无私的,根源是什么? 从客观的角度来看,人有自私的行为,也有无私的
Ubuntu安装NS-3 环境脚本随便小屋 ubuntu
将附件下载下来之后解压，将解压后的文件ns3environment.sh复制到下载目录下（其实放在哪里都可以，就是为了和我下面的命令相统一）。输入命令： sudo ./ns3environment.sh >>result 这样系统就自动安装ns3的环境，运行的结果在result文件中，如果提示 com
创业的简单感受 aijuans 创业的简单感受
2009年11月9日我进入a公司实习，2012年4月26日，我离开a公司，开始自己的创业之旅。今天是2012年5月30日，我忽然很想谈谈自己创业一个月的感受。当初离开边锋时，我就对自己说：“自己选择的路，就是跪着也要把他走完”，我也做好了心理准备，准备迎接一次次的困难。我这次走出来，不管成败
如何经营自己的独立人脉 aoyouzi 如何经营自己的独立人脉
独立人脉不是父母、亲戚的人脉，而是自己主动投入构造的人脉圈。“放长线，钓大鱼”，先行投入才能产生后续产出。现在几乎做所有的事情都需要人脉。以银行柜员为例，需要拉储户，而其本质就是社会人脉，就是社交！很多人都说，人脉我不行，因为我爸不行、我妈不行、我姨不行、我舅不行……我谁谁谁都不行，怎么能建立人脉？我这里说的人脉，是你的独立人脉。以一个普通的银行柜员
JSP基础百合不是茶 jsp 注释隐式对象
1,JSP语句的声明 <%! 声明 %> 　　声明：这个就是提供java代码声明变量、方法等的场所。表达式 <%= 表达式 %> 　　这个相当于赋值，可以在页面上显示表达式的结果，程序代码段/小型指令　<% 程序代码片段 %> 2,JSP的注释
web.xml之session-config、mime-mapping bijian1013 java web.xml servlet session-config mime-mapping
session-config 1.定义： <session-config> <session-timeout>20</session-timeout> </session-config> 2.作用：用于定义整个WEB站点session的有效期限，单位是分钟。 mime-mapping 1.定义： <mime-m
互联网开放平台（1） Bill_chen 互联网 qq 新浪微博百度腾讯
现在各互联网公司都推出了自己的开放平台供用户创造自己的应用，互联网的开放技术欣欣向荣，自己总结如下： 1.淘宝开放平台(TOP) 网址：http://open.taobao.com/ 依赖淘宝强大的电子商务数据，将淘宝内部业务数据作为API开放出去，同时将外部ISV的应用引入进来。目前TOP的三条主线： TOP访问网站：open.taobao.com ISV后台：my.open.ta
【MongoDB学习笔记九】MongoDB索引 bit1129 mongodb
索引可以在任意列上建立索引索引的构造和使用与传统关系型数据库几乎一样,适用于Oracle的索引优化技巧也适用于Mongodb 使用索引可以加快查询,但同时会降低修改,插入等的性能内嵌文档照样可以建立使用索引测试数据 var p1 = { "name":"Jack", "age&q
JDBC常用API之外的总结白糖_ jdbc
做JAVA的人玩JDBC肯定已经很熟练了，像DriverManager、Connection、ResultSet、Statement这些基本类大家肯定很常用啦，我不赘述那些诸如注册JDBC驱动、创建连接、获取数据集的API了，在这我介绍一些写框架时常用的API，大家共同学习吧。 ResultSetMetaData获取ResultSet对象的元数据信息
apache VelocityEngine使用记录 bozch VelocityEngine
VelocityEngine是一个模板引擎，能够基于模板生成指定的文件代码。使用方法如下： VelocityEngine engine = new VelocityEngine();// 定义模板引擎 Properties properties = new Properties();// 模板引擎属
编程之美-快速找出故障机器 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; public class TheLostID { /*编程之美假设一个机器仅存储一个标号为ID的记录，假设机器总量在10亿以下且ID是小于10亿的整数，假设每份数据保存两个备份，这样就有两个机器存储了同样的数据。 1.假设在某个时间得到一个数据文件ID的列表，是
关于Java中redirect与forward的区别 chenbowen00 java servlet
在Servlet中两种实现： forward方式：request.getRequestDispatcher(“/somePage.jsp”).forward(request, response); redirect方式：response.sendRedirect(“/somePage.jsp”); forward是服务器内部重定向，程序收到请求后重新定向到另一个程序，客户机并不知
[信号与系统]人体最关键的两个信号节点 comsci 系统
如果把人体看做是一个带生物磁场的导体,那么这个导体有两个很重要的节点,第一个在头部,中医的名称叫做百汇穴, 另外一个节点在腰部,中医的名称叫做命门如果要保护自己的脑部磁场不受到外界有害信号的攻击,最简单的
oracle 存储过程执行权限 daizj oracle 存储过程权限执行者调用者
在数据库系统中存储过程是必不可少的利器，存储过程是预先编译好的为实现一个复杂功能的一段Sql语句集合。它的优点我就不多说了，说一下我碰到的问题吧。我在项目开发的过程中需要用存储过程来实现一个功能，其中涉及到判断一张表是否已经建立，没有建立就由存储过程来建立这张表。 CREATE OR REPLACE PROCEDURE TestProc IS fla
为mysql数据库建立索引 dengkane mysql 性能索引
前些时候，一位颇高级的程序员居然问我什么叫做索引，令我感到十分的惊奇，我想这绝不会是沧海一粟，因为有成千上万的开发者（可能大部分是使用MySQL的）都没有受过有关数据库的正规培训，尽管他们都为客户做过一些开发，但却对如何为数据库建立适当的索引所知较少，因此我起了写一篇相关文章的念头。最普通的情况，是为出现在where子句的字段建一个索引。为方便讲述，我们先建立一个如下的表。
学习C语言常见误区如何看懂一个程序如何掌握一个程序以及几个小题目示例 dcj3sjt126com c 算法
如果看懂一个程序，分三步 1、流程 2、每个语句的功能 3、试数如何学习一些小算法的程序尝试自己去编程解决它，大部分人都自己无法解决如果解决不了就看答案关键是把答案看懂，这个是要花很大的精力，也是我们学习的重点看懂之后尝试自己去修改程序，并且知道修改之后程序的不同输出结果的含义照着答案去敲调试错误
centos6.3安装php5.4报错 dcj3sjt126com centos6
报错内容如下: Resolving Dependencies --> Running transaction check ---> Package php54w.x86_64 0:5.4.38-1.w6 will be installed --> Processing Dependency: php54w-common(x86-64) = 5.4.38-1.w6 for
JSONP请求 flyer0126 jsonp
使用jsonp不能发起POST请求。 It is not possible to make a JSONP POST request. JSONP works by creating a <script> tag that executes Javascript from a different domain; it is not pos
Spring Security（03）——核心类简介 234390216 Authentication
核心类简介目录 1.1 Authentication 1.2 SecurityContextHolder 1.3 AuthenticationManager和AuthenticationProvider 1.3.1 &nb
在CentOS上部署JAVA服务 java--hhf java jdk centos Java服务
本文将介绍如何在CentOS上运行Java Web服务，其中将包括如何搭建JAVA运行环境、如何开启端口号、如何使得服务在命令执行窗口关闭后依旧运行第一步：卸载旧Linux自带的JDK ①查看本机JDK版本 java -version 结果如下 java version "1.6.0"
oracle、sqlserver、mysql常用函数对比[to_char、to_number、to_date] ldzyz007 oracle mysql SQL Server
oracle &n
记Protocol Oriented Programming in Swift of WWDC 2015 ningandjin protocol WWDC 2015 Swift2.0
其实最先朋友让我就这个题目写篇文章的时候，我是拒绝的，因为觉得苹果就是在炒冷饭，把已经流行了数十年的OOP中的“面向接口编程”还拿来讲，看完整个Session之后呢，虽然还是觉得在炒冷饭，但是毕竟还是加了蛋的，有些东西还是值得说说的。通常谈到面向接口编程，其主要作用是把系统设计和具体实现分离开，让系统的每个部分都可以在不影响别的部分的情况下，改变自身的具体实现。接口的设计就反映了系统
搭建 CentOS 6 服务器(15) - Keepalived、HAProxy、LVS rensanning keepalived
（一）Keepalived （1）安装 # cd /usr/local/src # wget http://www.keepalived.org/software/keepalived-1.2.15.tar.gz # tar zxvf keepalived-1.2.15.tar.gz # cd keepalived-1.2.15 # ./configure # make &a
ORACLE数据库SCN和时间的互相转换 tomcat_oracle oracle sql
SCN（System Change Number 简称 SCN）是当Oracle数据库更新后，由DBMS自动维护去累积递增的一个数字，可以理解成ORACLE数据库的时间戳，从ORACLE 10G开始，提供了函数可以实现SCN和时间进行相互转换；　　用途：在进行数据库的还原和利用数据库的闪回功能时，进行SCN和时间的转换就变的非常必要了；　　操作方法：　　1、通过dbms_f
Spring MVC 方法注解拦截器 xp9802 spring mvc
应用场景，在方法级别对本次调用进行鉴权，如api接口中有个用户唯一标示accessToken,对于有accessToken的每次请求可以在方法加一个拦截器，获得本次请求的用户，存放到request或者session域。 python中，之前在python flask中可以使用装饰器来对方法进行预处理，进行权限处理先看一个实例,使用@access_required拦截： ?

如何在标准的机器学习流程上玩出新花样？

你可能感兴趣的:(人工智能)