胖胖大海

深度学习实际使用经验总结

以下仅是个人在使用过程中的经验总结，请谨慎参考。

常用算法总结

图像分类

常用算法（可作为其他任务的骨干网络）：
服务端：VGG、ResNet、ResNeXt、DenseNet
移动端：MobileNet、ShuffleNet等
适用场景：识别区分场景类型

目标检测

常用算法：Yolo系列
适用场景：检测识别场景中的目标类型及位置

目标跟踪

单目标：SiamFC、SiamRPN、SiamRPN++
多目标：ByteTrack、deep sort
适用场景：在上下文连续多帧中持续定位目标位置变化，如跟踪人的位置变化

人脸识别

人脸检测：MTCNN、RetinaFace
特征提取：ArcFace
特征匹配：Nmslib、Annoy
适用场景：直播、点播场景下人脸坐标定位和人物身份识别

度量学习

常用算法：神经网络模型 + Contrastive Learning
适用场景：将输入转换为高维特征，根据特征相似度完成具体任务，如音乐识别等

音频识别

常用算法：音频频谱 + 神经网络模型
适用场景：如识别音频中是否出现音乐，以及出现的是哪一首音乐

传统图像算法

常用算法：边缘检测、直线检测、透视变化、坐标映射
适用场景：如识别足球场地边缘，根据球员实时位置构建赛场态势图

常用技术总结

网络设计

卷积网络
池化
全连接网络
残差网络
分组卷积
深度可分离卷积
Inception网络
BatchNorm/LayerNorm
循环神经网络
Transformer网络

特征融合

FPN特征金字塔
PAN特征融合
UNet细粒度特征融合
Attention全局注意力
多分支融合叠加

激活函数

Sigmoid
ReLU
Tanh
Leakey-ReLU
PReLU
Swish

优化算法

随机梯度下降
批量梯度下降
小批量梯度下降
动量梯度下降
自适应梯度下降

损失函数

单分类损失Logistic Loss
多分类损失CE
多标签分类损失BCE
类别不均衡损失Focal Loss
回归损失MSE、L1 Smoothing
多任务损失
Contrastive Loss
Label Smoothing

数据增强

平移/旋转/翻转/缩放
添加高斯噪声
亮度/对比度/饱和度变换
数据融合MixUp
随机掩码Cutout
频谱掩码（音频数据增强）

模型压缩

模型剪枝
模型重参数化
模型蒸馏
模型量化

训练策略

迁移学习
权重衰减
学习率衰减
WarmUp预热
DropOut/DropBlock
并行训练
Early Stopping

使用经验总结

数据预处理：在数据预处理阶段，通常包含以下流程

数据加载：这部分可能涉及到大规模训练数据的高性能加载，消除数据读取造成的性能瓶颈
数据增强：根据具体任务选择合适的数据增强策略
数据归一化：将数据的数值做归一化处理，加速模型的收敛速度

网络模型设计：根据具体的业务场景，选择/设计合适的网络架构，通常遵循以下原则：

优先选择开源的预训练模型参数，使用自有数据进行微调训练
使用开源预训练模型的基础部分，修改模型的上层适配自有的业务场景
根据业务场景自行设计模型架构（通常只在没有开源参考模型的条件下使用，模型效果很难得到保证）
通常情况下对于图像、视频数据，追求模型效果一般使用ResNet34、ResNet50等模型架构，追求处理性能一般使用ResNet18、MobileNet、ShuffleNet模型架构

损失函数设计：根据具体业务场景，选择/设计合适的损失函数，通常遵循以下原则：

分类场景一般使用交叉熵损失Cross Entropy
类别极度不均衡的分类场景（不均衡比例超过1000以上），分类损失尝试Focal Loss
在分类损失场景下使用Label Smoothing软化模型的学习能力
回归损失根据使用场景可选MSE、MAE、L1 Smoothing等
表征学习（也叫对比学习或度量学习）优先使用Circle Loss、ArcFace Loss、Triplet Loss等损失函数，模型训练时根据具体业务场景适当增大训练批量batch size，提升表征学习的特征区分度

训练策略：迭代训练更新模型参数，逐步提升模型效果

优先使用小批量梯度下降 + Momentum动量 + LR decay学习率衰减 + Weight Decay权重衰减训练策略
如果使用多GPU并行训练，训练的批量大小batch size和学习率LR要同比例改变
先使用极少的训练数据验证模型训练效果，排除模型在设计上的问题和工程化问题，然后再迁移到大数据量，避免造成无效的资源和时间浪费
模型训练过程中保存每轮迭代预测异常的数据，通过bad case分析，逐步提升数据质量或调整模型策略
保存模型每轮迭代的准确率、召回率、loss变化曲线，监控是否发生过拟合、欠拟合等问题

模型验证：使用实际场景数据验证模型的预测性能，包括效果和速度

优先检查网络架构和模型参数的匹配情况，防止参数不匹配带来的潜在错误（问题较难定位）
使用训练数据验证模型的预测效果，排除训练和验证阶段数据处理不一致带来的差异
保证验证数据和训练数据具有相同或相似的数据分布
将模型转换为推理模式，固化BatchNorm、Dropout等具有随机性的操作
避免不必要的资源消耗，如使用torch.no_grad避免不必要的显存占用
关注模型在推理阶段的显卡内存占用，保证分配的内存资源大于波动的峰值

常见问题和思考——模型训练阶段

模型训练效果差

常见问题：神经网络模型在训练过程中，没有学习到有效的信息，模型收敛慢或者不收敛
原因分析：
- 训练数据中存在脏数据（首要排除的因素）
- 没有使用预训练模型和数据归一化
- 训练集过大，模型容量小，出现欠拟合
- 训练集过小，模型容量大，出现过拟合
- 学习率设置过大，导致参数更新过快，结果出现震荡
- 学习率设置过小，导致参数更新过慢，学习进展缓慢
- 数值稳定性问题导致数值溢出，出现梯度爆炸
- 网络设计问题导致梯度消失
- 使用了不合理的批量大小
- 使用了不合理的训练迭代次数及停止策略
- 使用了不合理的学习率衰减策略
- 使用了不合理的参数初始化策略
- 使用了不合理的数据增强，比如检测人体时对图像做了上下翻转
- 使用了不合理的损失函数，比如分类问题使用回归损失函数
- 使用了不合理的网络架构，根据一维、二维、多维、时序数据选择合适的架构
- 使用了较强的正则化，限制模型的学习能力，出现欠拟合
- 使用了较弱的正则化，过渡学习训练集，出现过拟合

模型训练速度慢

常见问题：神经网络模型训练慢，主要体现在收敛慢、资源使用率低等方面
原因分析：
- 没有使用GPU资源进行模型训练
- 模型训练时使用过小的学习率，导致参数更新慢
- 模型训练时使用了过大的batch size，导致参数更新频次少
- 模型训练时使用了过小的batch size，没有充分利用计算资源
- 没有使用预训练参数，重头训练效率低
- 没有使用Batch Norm等做数据归一化
- 训练过程中存在过多的内存、磁盘访问
- 模型过于简单，不具备学习复杂任务的能力
- 使用了过强的正则化，限制了模型的学习能力
- 没有使用单机多卡、多机多卡并行训练
- 模型复杂度高，参数量大，以及使用过大的图像分辨率
- 训练数据量大，数据加载成为性能瓶颈

常见问题和思考——模型预测阶段

模型预测指标

分类模型：准确率、召回率、PR曲线、ROC曲线（类别不均衡）
检测模型：mAP、准确率、召回率
特征提取模型：top 1、top K、r_precision

模型预测效果差

常见问题：神经网络模型训练效果较好，但是在预测阶段模型表现较差
原因分析：
- 模型训练和测试的数据处理pipeline不一致，比如训练时做了Normalize，测试时没做Normalize
- 模型在测试时没有切换到推理模式，如pytorch中的eval()转换
- 输入的数据维度不正确，比如训练时使用[N, C, H, W]，测试时也要使用同样的数据维度顺序，有些模型即使输入的数据尺寸和训练时不一样也不会报错
- 模型参数加载不完全，以pytorch框架为例，加载模型时设置完全匹配的参数为False，在加载过程中即使参数和模型不匹配也不会报错，但是会使用默认的随机参数

模型预测资源占用高

常见问题：神经网络模型在预测阶段GPU使用率低，CPU使用率高，或者出现显卡内存溢出
原因分析：
- 数据预处理在CPU上进行，没有充分利用GPU算力
- 在预测阶段模型没有设置成推理模式，计算产生无用的中间结果占用资源
- 深度学习框架如Pytorch自动搜索最优算子导致显存占用短暂飙升

模型处理未知类别

常见问题：如何让分类模型对未见过的数据类别说“不知道，不认识”，提升鲁棒性
解决方案：
- 给分类模型添加一个其他类别，此种方法不适用于真实开放环境
- 使用BCE（Binary Cross Entropy）多标签二分类损失函数，以猫狗分类为例，分别输出是猫狗的概率，如果输出既不是猫也不是狗，则表示未知
- 使用表征学习（度量学习）方法通过特征匹配进行分类识别，将输入的数据与已知类别进行相似度匹配

模型效果提升

bad case分析：数据决定了模型的上限，提升模型性能首先应当从数据层面入手，避免脏数据带来的负面影响
数据增强：通过给训练数据增加异常扰动提升模型效果的鲁棒性
- 图像数据增强：随机裁剪、旋转、翻转、缩放、颜色/亮度/对比度调整、多图像融合等
- 音频数据增强：频谱随机连续掩码、多频谱融合等
选择合适的网络架构：针对具体的使用场景选择合适的网络架构，如图像使用2D卷积、音频使用1D卷积等
选择合适的损失函数：针对具体任务使用合适的损失函数，常见的是分类损失、回归损失及混合损失
选择合适的评价指标：如分类使用准确率、召回率，类别不均衡使用ROC，目标检测使用mAP等
使用开源预训练模型：预训练模型通常具备较好的参数基础，在此基础上进行训练有助于提升性能
多模型融合：使用不同的弱模型训练多个效果稍弱的模型，融合多个模型结果提升最终性能
知识蒸馏：使用知识蒸馏将大模型学习到的知识迁移到小模型，在提升效果的同时还可以提升速度

常见问题与思考——模型推理加速

模型推理加速

数据处理层面
- 将数据预处理、后处理等操作在GPU上进行
- 避免在CPU和GPU之间频繁进行数据拷贝
- 避免保存大量的中间结果，如磁盘写入
网络模型层面
- 模型剪枝：根据具体业务场景，裁剪掉与业务不相关的计算模块
- 算子融合：将多个算子融合成一个，减少内存访问次数，如将Conv + BN融合成Conv
- 半精度推理：使用float16进行模型推理
- 分组卷积：使用分组卷积降低网络模型的参数量和计算量，但是会增加内存访问次数
- 模型蒸馏：将大模型学习到的知识迁移到小模型，在提升效果的同时还可以提升速度
部署工具层面
- 服务端：ONNX、TensorRT
- 移动端：NCNN、MNN

影响模型速度的主要因素

数据处理层面
- 没有使用GPU资源进行推理
- 输入数据尺寸大，如高分辨率图像
模型架构层面
- 网络模型参数量大
- 网络模型计算量大
- 网络模型并行度低，如存在多分支结构等
- 内存访问次数多，如大量使用分组卷积
工程实现层面
- 没有使用批量推理，没有充分利用GPU的并行计算能力
- 不合理的数据复用导致频繁拷贝

常见问题与思考——工程化问题

工程化常见问题

算法集群扩容
- kafka topic的partition数量要大于算法消费者数量
直播场景混流和AI算法结果对齐
- 算法解码处理直播流内容，获取每帧的dts、pts时间戳
- 混流侧根据算法返回结果以及dts、pts时间戳对齐到原流，将算法结果压制到直播流中
- 算法侧和混流侧使用pts解码时间戳对齐，不用dts时间戳，否则会造成画面闪烁
Kafka、Redis数据保存周期
- 根据业务场景和处理性能设定保存周期，保存周期过长造成额外资源占用，保存周期过短造成数据丢失
Restful API高稳定性、高并发
- 算法模型对外提供API接口需要关注高并发、高稳定性，通常使用gunicorn进行部署
- 算法模型高并发部署需要成倍的资源，重点关注显存、内存和CPU资源占用情况
容器化部署
- 关注容器CUDA版本与主机显卡驱动，以及深度学习框架之间的匹配问题

【SoC基础】单片机之寄存器解析望闻问嵌 #SoC 单片机嵌入式硬件
：如果你也对机器人、人工智能感兴趣，看来我们志同道合✨：不妨浏览一下我的博客主页【https://blog.csdn.net/weixin_51244852】：文章若有幸对你有帮助，可点赞收藏⭐不迷路：内容若有错误，敬请留言指正！原创文，转载注明出处文章目录1、寄存器位置2、寄存器种类2.1通用用途寄存器2.2CPU执行相关寄存器2.3外设控制寄存器3.寄存器在CPU访问外设过程中起到的作用1、寄
什么时候用到jupyter notebook的NBConvert 老光私享 jupyter python 人工智能 windows 机器学习
JupyterNotebook的NBConvert功能是用来将JupyterNotebook文件转换为其他格式的工具。通常情况下，我们会用到NBConvert功能来将JupyterNotebook文件转换为HTML、LaTeX、PDF或其他文本格式。这样可以方便地将JupyterNotebook分享给他人，或者将其用于报告、文章、文档或其他写作目的。要使用NBConvert功能，需要在命令行中运行
UNI-APP+VUE3+VITE+VSCode开发经验及填坑记录（持续更新ING）集成显卡前端项目实践 uni-app vscode ide
uni-app是一个使用Vue.js开发所有前端应用的框架，开发者编写一套代码，可发布到iOS、Android、Web（响应式）、以及各种小程序（微信/支付宝/百度/头条/飞书/QQ/快手/钉钉/淘宝）、快应用等多个平台。快速开发模板unibest：最好的uniapp开发框架，由uniapp+Vue3+Ts+Vite5+UnoCss+VSCode(可选webstorm)+uni插件+wot-ui（
QT引用资源qrc 我该叫什么名字好呢？ QT开发 QT qtcreator 文本编辑控件
1.在工程文件夹下面添加一个文件夹，如images，保存图标文件.2.在工程那里新建一个qrc文件，右键选择文本编辑器打开添加如下语句：images/file_128.icoimages/open_128.icoimages/save_128.ico这样工程就能读取到这些资源，在要设置图标的控件的icon选项，选择资源文件，就可以使用图标了。3.假如是利用QTcreator编写的，那就比较简单，直
一文搞懂Nginx: 域名配置、SSL、HTTP转HTTPS 千层冷面知识类 http nginx ssl linux
本文将在Centos系统下详解Nginx服务器，从概念、下载、安装、编译、配置(含域名和证书)到启动。本文先讲Nginx如何使用，然后再谈概念。一、实践1.下载下载通常有2种方式：Centos自带的包管理工具、源码编译安装(推荐，拓展性强)，本文使用源码编译安装的形式下载从Nginx官网（nginx.org）下载Nginx的源代码。亦可以使用wget命令或者浏览器下载后通过FTP等方式传输到服务器
大模型时代的知识焦虑机载软件与适航机器学习-建模算法-代理模型人工智能大数据
引言：浪潮之巅，焦虑暗涌大模型时代已经浩荡而来，如同奔腾的浪潮，以令人惊叹的速度重塑着世界的面貌。从智能客服的温声细语，到AI绘画的妙笔生花，再到自动驾驶的日趋成熟，大型语言模型、图像模型等人工智能技术以前所未有的姿态，渗透进我们生活的方方面面。信息获取前所未有的便捷，知识创造空前高效，人机交互焕然一新，一个充满无限可能的智能化未来似乎触手可及。然而，在这令人眼花缭乱的技术盛景之下，一股无形的焦虑
python assert()函数欢天喜地小姐姐 python编程学习 python
1.断言函数作用断言函数是对表达式布尔值的判断，要求表达式计算值必须为真。可用于自动调试。如果表达式为假，触发异常；如果表达式为真，不会报错。2.使用assert判断数组是否相等np.array.any()和numpy.array.all()np.array.any()是或操作，任意一个元素为True，输出为True。np.array.all()是与操作，所有元素为True，输出为True。当我们
Jupyter文件转换-nbconvert命令行工具简介 madao10086+ 奇技淫巧 python linux
Jupyternbconvert简介前言安装使用查考前言jupyter这个格式使用起来确实很方便，但是有的时候需要将jupyter转换为其他的格式，用的比较方便的方式就是nbconvert这个工具，这里参考的是官网的教程，做一个记录，防止自己每次要转换文件的时候都忘记这个命令行。安装安装nbconvert很简单，直接一条命令行就可以了：#pippipinstallnbconvert#condaco
力扣Hot100——136. 只出现一次的数字飞奔的马里奥 leetcode 算法职场和发展
难点在于时间与空间复杂度的要求，一般遇到这样的限制，就要考虑使用位运算，位运算效率最高了。异或当且仅当两个输入值不同时，异或运算输出为真（1），否则输出为假（0），即“同为0，异为1”。这是针对二进制运算的规则，整数进行异或运算，需要转换为二进制，一样遵循这个运算规则。异或的运算律：交换律：p⊕q=q⊕p结合律：p⊕(q⊕r)=(p⊕q)⊕r恒等律：p⊕0=p归零律：p⊕p=0对合运算：p⊕q⊕q
stm32基于HAL库的串口UART中断接收不定长数据代码实现 ls20010901 stm32 单片机 mcu
总体分析：代码使用的串口USART1，GPIO的复用引脚分别是：PA9复用为RX引脚；PA10复用为TX引脚。数据接收标志符为"\r\n"即回车按键按下，当接收到\r\n时接收停止。接收数据缓冲区只能容纳一个字节数据，设置的接收一个字节数据产生一次接收中断，在中断回调函数中进行串口接收协议的编写。代码现象：将接受的数据重新发送至串口进行回显。代码实现uart.h#ifndef__USART_H#d
本地源代码运行bun install时报错星火燎猿 C#疑难杂症处理方案 Bun Bun.js
最近使用Ubuntu系统运行Bun的时候报，Failedtospawnscriptinstallduetoerroros.linux.errno.generic.E.PERMPERM的错误，查看官方文档也没有这个错误描述，最终找到解决方案进行分享。报错问题如下：errorloadingcurrentdirectoryInstalling[2637/2230]error:failedtospawnl
大数据最新大数据StarRocks(七)：数据表创建(2) 2401_84182271 程序员大数据
2.1表分为内部表和外部表默认未内部表，3.0版本开始集成外部数据建议使用catalog，外部表的建表方式将被弃用2.2列定义语法：col_namecol_type[agg_type][NULL|NOTNULL][DEFAULT"default\_value"][AUTO_INCREMENT][ASgeneration_expr]col_name：列名称注意，在一般情况下，不能直接创建以以__op
Beekeeper Studio：高颜值且免费的SQL开发工具开源项目精选 sql 数据库
BeekeeperStudio是一款免费开源的SQL开发和数据库管理工具，具有美观高效、简单易用的特点。BeekeeperStudio基于Vue.js开发，遵循MIT开源协议，支持Windows、Linux以及macOS平台。Stars数17842Forks数1170主要特点安全连接：除了正常的连接，也可以使用SSL加密连接或通过SSH隧道连接；SQL自动补全：代码编辑器支持语法高亮和表名自动补全
鸿蒙HarmonyOS开发：应用程序静态包-HAR 让开，我要吃人了鸿蒙开发 OpenHarmony HarmonyOS harmonyos 华为移动开发前端 html 开发语言鸿蒙
HAR（HarmonyArchive）是静态共享包，可以包含代码、C++库、资源和配置文件。通过HAR可以实现多个模块或多个工程共享ArkUI组件、资源等相关代码。使用场景作为二方库，发布到OHPM私仓，供公司内部其他应用使用。作为三方库，发布到OHPM中心仓，供其他应用使用。约束限制HAR不支持在设备上单独安装/运行，只能作为应用模块的依赖项被引用。HAR不支持在配置文件中声明UIAbility
CTF杂项挑战：使用已知字典破解ZIP文件密码 0dayNu1L Web安全 CTF web安全网络安全
在CTF比赛中，杂项挑战通常包含一些非传统的题目，其中破解ZIP文件密码是一个常见的任务。本文将介绍两种在已知密码字典文件的情况下，破解ZIP文件密码的方法：一种是使用Python脚本进行暴力破解，另一种是通过zip2john和john命令结合进行破解。0dayNu1L-CSDN博客请一键三连吧！！！❤❤❤目录方法一：使用Python脚本进行暴力破解步骤方法二：使用zip2john和john命令结
近期计算机领域的热点技术 0dayNu1L 云计算量子计算人工智能
随着科技的飞速发展，计算机领域的新技术、新趋势层出不穷。本文将探讨近期计算机领域的几个热点技术趋势，并对它们进行简要的分析和展望。一、人工智能与机器学习人工智能（AI）和机器学习（ML）是近年来计算机领域最为热门的话题之一。AI和ML技术已经广泛应用于图像识别、自然语言处理、智能推荐等领域，并取得了显著的成果。随着技术的不断进步，AI和ML将更深入地渗透到各个行业，为人类社会带来更多便利和效益。在
Python助力区块链互通——跨链桥接的实现与实践 Echo_Wish Python！实战！区块链 python 开发语言
Python助力区块链互通——跨链桥接的实现与实践区块链技术的繁荣发展带来了巨大的生态创新，但也因各链之间的割裂局面限制了它们的潜力。例如，你或许想在以太坊上使用来自比特币的资产，却因两条链不互通而不得不求助于中心化交易所。要打破“链间壁垒”，跨链桥接（Cross-chainBridge）应运而生。今天，我以Echo_Wish的视角，通过Python代码实践，带你深入了解跨链桥接的工作原理，技术实
关于STM32如何选择：HAL与标准库的抉择及初学者建议笑靥藏情. stm32 嵌入式硬件单片机
STM32是意法半导体（STMicroelectronics）推出的一系列基于ARMCortex-M内核的32位微控制器，因其高性能、多功能性和成本效益而广受嵌入式系统开发者的欢迎。对于初学者而言，学习STM32编程时面临的第一个重要抉择往往是如何选择编程方式：是使用硬件抽象层（HAL），还是选择标准外设库（StandardPeripheralLibrary）？本文将围绕这一问题展开，详细比较HA
某智慧医养服务平台Uploads存在任意文件上传漏洞(DVB-2025-8968) Byp0ss403 漏洞复现集合文件上传 web安全
免责声明本文所描述的漏洞及其复现步骤仅供网络安全研究与教育目的使用。任何人不得将本文提供的信息用于非法目的或未经授权的系统测试。作者不对任何由于使用本文信息而导致的直接或间接损害承担责任。如涉及侵权，请及时与我们联系，我们将尽快处理并删除相关内容。0x01产品介绍广西金中软件集团有限公司前身成立于1999年，隶属于广西电信下的三产公司金中信息产业有限公司，是一家集软件开发、网站建设、网络工程、系统
Python Pyttsx3模块墨水云烟 Python python 开发语言
大家有没有让电脑“说话”的欲望，如果我说可以帮大家实现这个愿望的话，大家肯定会说我又要用print函数，但是今天我们就可以真的让电脑说话。让电脑说话其实很简单，使用python第三方库pyttsx3模块就行了。使用之前还需要安装pyttsx3模块，安装方法：python终端或cmd输入：pipinstallpyttsx3然后就是导入pyttsx3模块：importpyttsx3后面就是使用这个模块
大整数加、减法（Java实现）与debug找错 gfu_ java 算法数据结构
前言这篇文章主要内容涉及大整数加法的实现以及debug使用的简单记录。以前当我碰到程序报错时，总是想找别人帮忙，感觉debug太难了，自己根本看不懂。这次，自己在做一道算法题时，程序能够运行，结果却出错了。本来想找别人帮忙，但想着学习还是要脚踏实地，于是自己硬着头皮上了，先在网上了解如何debug，然后一步一步找到了错误所在。主要是想记录下第一次debug找到问题的快乐。一、大整数加法（java）
谷歌准备斥资 230 亿收购网络安全初创公司 Wiz 网络研究观网络研究观谷歌
Alphabet正在就收购Wiz进行深入谈判，这将显著增强其安全能力。这将是谷歌母公司有史以来最大规模的收购。这是路透社根据匿名消息来源撰写的内容。目标收购金额为230亿美元，即211亿欧元。Wiz拥有实时检测和响应网络威胁的技术。通过实施人工智能，Wiz能够在短时间内吸引许多公司作为客户。Alphabet的收购目标定于2020年初。到2023年，Wiz的收入将达到3.5亿美元。当时，全球40%的
怎么看股指期货多空单数量？财财有个期权懂金融财经
查看期货多空持仓量是投资者判断市场走势、制定投资策略的重要依据。股指期货多空单数据股指期货的多空单数据是可以查询到的，老板们可以通过自己使用的期货公司交易软件，或者是交易所官网，或者金融网站都可以可能到的。首先是期货公司的交易软件，一般来说交易软件上面都会有多空单的信息，老板们只需要登录软件，进入股指期货的页面，然后选择要看的合约，接着选择多空持仓选项就可以看到股指期货的多空持仓情况。其次就是交易
使用python seaborn创建配对图：从核心概念到实战案例梦想画家数据分析工程 #python 人工智能 python 机器学习
Seaborn的配对图（Pairplot）是一种用于探索多变量数据关系的可视化工具，尤其适合分析数据集中多个特征之间的相关性、分布模式或异常值。本文介绍如何生成数据集数值变量之间的配对图，并通过参数设置色系。配对图的核心作用矩阵式可视化生成一个N×N的网格图（N为特征数），每个单元格展示两列特征之间的关系。默认对角线显示单变量分布（直方图或KDE曲线），非对角线显示散点图或其他关系图。快速发现模式
如何用Python和Selenium实现表单的自动填充与提交？字节王德发 python python selenium 开发语言
在今天的数字化时代，自动化工具可以极大地提高工作效率。很多人可能会觉得填表单是个繁琐的任务，不过你知道吗？用Python和Selenium可以轻松解决这一问题！本文将带你走进如何利用这两个强大的工具，实现表单的自动填充和提交，让你省去不少时间。什么是Selenium？Selenium是一个广泛使用的自动化测试工具，它能够模拟用户在浏览器中的操作。通过它，我们可以自动化执行诸如点击按钮、输入文本、选
使用 Python 的 pyttsx3 库进行文本转语音 Bingjia_Hu python 开发语言 pyttsx3
1.什么是pyttsx3？1.1pyttsx3是一个Python库，它可以将文本转换为语音。与其他文本转语音库（如gTTS）不同，pyttsx3不依赖于网络服务，它使用本地的TTS（Text-to-Speech）引擎，这使得它在离线状态下也能正常工作1.2pyttsx3支持多平台（Windows、Linux和macOS），且可以对语音的音量、语速以及语音类型等进行控制2.安装pyttsx3要使用p
数学领域的跨时代进化与升级：从公理化到智能化的破茧之路夏末之花算法
作者：夏末之花|发布时间：2025-03-16|阅读量：10万+|点赞数：5.6万引言：数学的“破茧时刻”与文明跃迁人类历史上，数学的每一次重大突破都像一次“破茧时刻”，推动文明跨越式发展。从古希腊的几何公理化到牛顿的微积分，再到20世纪的计算机理论，数学始终是科学革命的基石。而在21世纪的今天，随着量子计算、人工智能、生物信息等技术的爆发，数学正迎来新一轮的进化与升级——从纯粹的逻辑工具，演变为
std::forward与std::move详解 _DCG_ c++算法
在阅读代码时遇到了std::forward与std::move，对这两个方法含义及使用场景有点不太清楚，在此写文章进行记录加深印象。std::forward概念保持传递值的类别不变，顾名思义，即传入一个左值，那么经过forward传递后还是一个左值；传入一个右值，经过forward转换后还是一个右值。它保持了原始实参的值类别，而不是强制进行转换，如果原始实参是左值，它就会转发为左值；如果原始实参为
大话C++之：左右值引用和std::move Kelvin7_Feng c++
大话C++之：左右值引用和std::move什么是左值和右值什么是左值引用和右值引用std::move的应用场景在C++11引入右值引用后，一直对其使用缺乏深入理解，特别是结合std::move移动语义。恰逢最近工作里有相关优化代码使用到，可以趁机会重新学习，加深理解。什么是左值和右值从命名来理解，既然命名区分左右，左右值是相对于赋值号“=”来作锚点。左值(LValue)：可以位于等号左边，有持久
如何在 Python 中将语音转换为文本无水先生语音处理人工智能综合 python xcode 开发语言
一、说明学习如何使用语音识别Python库执行语音识别，以在Python中将音频语音转换为文本。想要更快地编码吗？我们的Python代码生成器让您只需点击几下即可创建Python脚本。现在就现在试试！二、语言AI库2.1相当给力的转文字库语音识别是计算机软件识别口语中的单词和短语并将其转换为人类可读文本的能力。在本教程中，您将学习如何使用SpeechRecognition库在Python中
如何用ruby来写hadoop的mapreduce并生成jar包 wudixiaotie mapreduce
ruby来写hadoop的mapreduce，我用的方法是rubydoop。怎么配置环境呢： 1.安装rvm：不说了网上有 2.安装ruby：由于我以前是做ruby的，所以习惯性的先安装了ruby，起码调试起来比jruby快多了。 3.安装jruby： rvm install jruby然后等待安
java编程思想 -- 访问控制权限百合不是茶 java 访问控制权限单例模式
访问权限是java中一个比较中要的知识点,它规定者什么方法可以访问,什么不可以访问一:包访问权限; 自定义包: package com.wj.control; //包 public class Demo { //定义一个无参的方法 public void DemoPackage(){ System.out.println("调用
[生物与医学]请审慎食用小龙虾 comsci 生物
现在的餐馆里面出售的小龙虾,有一些是在野外捕捉的,这些小龙虾身体里面可能带有某些病毒和细菌,人食用以后可能会导致一些疾病,严重的甚至会死亡..... 所以,参加聚餐的时候,最好不要点小龙虾...就吃养殖的猪肉,牛肉,羊肉和鱼,等动物蛋白质
org.apache.jasper.JasperException: Unable to compile class for JSP: 商人shang maven 2.2 jdk1.8
环境： jdk1.8 maven tomcat7-maven-plugin 2.0 原因： tomcat7-maven-plugin 2.0 不知吃 jdk 1.8，换成 tomcat7-maven-plugin 2.2就行，即 <plugin>
你的垃圾你处理掉了吗?GC oloz GC
前序:本人菜鸟，此文研究学习来自网络，各位牛牛多指教　 1.垃圾收集算法的核心思想　　Java语言建立了垃圾收集机制，用以跟踪正在使用的对象和发现并回收不再使用(引用)的对象。该机制可以有效防范动态内存分配中可能发生的两个危险：因内存垃圾过多而引发的内存耗尽，以及不恰当的内存释放所造成的内存非法引用。　　垃圾收集算法的核心思想是：对虚拟机可用内存空间，即堆空间中的对象进行识别
shiro 和 SESSSION 杨白白 shiro
shiro 在web项目里默认使用的是web容器提供的session，也就是说shiro使用的session是web容器产生的，并不是自己产生的，在用于非web环境时可用其他来源代替。在web工程启动的时候它就和容器绑定在了一起，这是通过web.xml里面的shiroFilter实现的。通过session.getSession()方法会在浏览器cokkice产生JESSIONID，当关闭浏览器，此
移动互联网终端淘宝客如何实现盈利小桔子移動客戶端淘客淘寶App
2012年淘宝联盟平台为站长和淘宝客带来的分成收入突破30亿元，同比增长100%。而来自移动端的分成达1亿元，其中美丽说、蘑菇街、果库、口袋购物等App运营商分成近5000万元。可以看出，虽然目前阶段PC端对于淘客而言仍旧是盈利的大头，但移动端已经呈现出爆发之势。而且这个势头将随着智能终端(手机，平板)的加速普及而更加迅猛
wordpress小工具制作 aichenglong wordpress 小工具
wordpress 使用侧边栏的小工具，很方便调整页面结构小工具的制作过程 1 在自己的主题文件中新建一个文件夹(如widget)，在文件夹中创建一个php(AWP_posts-category.php) 小工具是一个类,想侧边栏一样，还得使用代码注册，他才可以再后台使用，基本的代码一层不变 <?php class AWP_Post_Category extends WP_Wi
JS微信分享 AILIKES js
// 所有功能必须包含在 WeixinApi.ready 中进行 WeixinApi.ready(function(Api) { // 微信分享的数据 var wxData = { &nb
封装探讨百合不是茶 JAVA面向对象封装
//封装属性方法将某些东西包装在一起，通过创建对象或使用静态的方法来调用，称为封装；封装其实就是有选择性地公开或隐藏某些信息，它解决了数据的安全性问题，增加代码的可读性和可维护性在 Aname类中申明三个属性，将其封装在一个类中：通过对象来调用例如 1： //属性将其设为私有姓名 name 可以公开
jquery radio/checkbox change事件不能触发的问题 bijian1013 JavaScript jquery
我想让radio来控制当前我选择的是机动车还是特种车，如下所示： <html> <head> <script src="http://ajax.googleapis.com/ajax/libs/jquery/1.7.1/jquery.min.js" type="text/javascript"><
AngularJS中安全性措施 bijian1013 JavaScript AngularJS 安全性 XSRF JSON漏洞
在使用web应用中，安全性是应该首要考虑的一个问题。AngularJS提供了一些辅助机制，用来防护来自两个常见攻击方向的网络攻击。一.JSON漏洞当使用一个GET请求获取JSON数组信息的时候（尤其是当这一信息非常敏感，
[Maven学习笔记九]Maven发布web项目 bit1129 maven
基于Maven的web项目的标准项目结构 user-project user-core user-service user-web src
【Hive七】Hive用户自定义聚合函数(UDAF) bit1129 hive
用户自定义聚合函数，用户提供的多个入参通过聚合计算(求和、求最大值、求最小值)得到一个聚合计算结果的函数。问题：UDF也可以提供输入多个参数然后输出一个结果的运算，比如加法运算add(3，5)，add这个UDF需要实现UDF的evaluate方法,那么UDF和UDAF的实质分别究竟是什么？ Double evaluate(Double a, Double b)
通过 nginx-lua 给 Nginx 增加 OAuth 支持 ronin47
前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGeek 在过去几年中取得了发展，我们已经积累了不少针对各种任务的不同管理接口。我们通常为新的展示需求创建新模块，比如我们自己的博客、图表等。我们还定期开发内部工具来处理诸如部署、可视化操作及事件处理等事务。在处理这些事务中，我们使用了几个不同的接口来认证： &n
利用tomcat-redis-session-manager做session同步时自定义类对象属性保存不上的解决方法 bsr1983 session
在利用tomcat-redis-session-manager做session同步时，遇到了在session保存一个自定义对象时，修改该对象中的某个属性，session未进行序列化，属性没有被存储到redis中。在 tomcat-redis-session-manager的github上有如下说明： Session Change Tracking As noted in the &qu
《代码大全》表驱动法-Table Driven Approach-1 bylijinnan java 算法
关于Table Driven Approach的一篇非常好的文章： http://www.codeproject.com/Articles/42732/Table-driven-Approach package com.ljn.base; import java.util.Random; public class TableDriven { public
Sybase封锁原理 chicony Sybase
昨天在操作Sybase IQ12.7时意外操作造成了数据库表锁定，不能删除被锁定表数据也不能往其中写入数据。由于着急往该表抽入数据，因此立马着手解决该表的解锁问题。无奈此前没有接触过Sybase IQ12.7这套数据库产品，加之当时已属于下班时间无法求助于支持人员支持，因此只有借助搜索引擎强大的
java异常处理机制 CrazyMizzz java
java异常关键字有以下几个，分别为 try catch final throw throws 他们的定义分别为 try： Opening exception-handling statement. catch： Captures the exception. finally： Runs its code before terminating
hive 数据插入DML语法汇总 daizj hive DML 数据插入
Hive的数据插入DML语法汇总1、Loading files into tables语法：1) LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]解释：1)、上面命令执行环境为hive客户端环境下： hive>l
工厂设计模式 dcj3sjt126com 设计模式
使用设计模式是促进最佳实践和良好设计的好办法。设计模式可以提供针对常见的编程问题的灵活的解决方案。工厂模式工厂模式（Factory）允许你在代码执行时实例化对象。它之所以被称为工厂模式是因为它负责“生产”对象。工厂方法的参数是你要生成的对象对应的类名称。 Example #1 调用工厂方法（带参数） <?phpclass Example{
mysql字符串查找函数 dcj3sjt126com mysql
FIND_IN_SET(str,strlist) 假如字符串str 在由N 子链组成的字符串列表strlist 中，则返回值的范围在1到 N 之间。一个字符串列表就是一个由一些被‘,’符号分开的自链组成的字符串。如果第一个参数是一个常数字符串，而第二个是type SET列，则 FIND_IN_SET() 函数被优化，使用比特计算。如果str不在strlist 或st
jvm内存管理 easterfly jvm
一、JVM堆内存的划分分为年轻代和年老代。年轻代又分为三部分：一个eden,两个survivor。工作过程是这样的：e区空间满了后，执行minor gc，存活下来的对象放入s0, 对s0仍会进行minor gc，存活下来的的对象放入s1中，对s1同样执行minor gc，依旧存活的对象就放入年老代中；年老代满了之后会执行major gc，这个是stop the word模式，执行
CentOS-6.3安装配置JDK-8 gengzg centos
JAVA_HOME=/usr/java/jdk1.8.0_45 JRE_HOME=/usr/java/jdk1.8.0_45/jre PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib export JAVA_HOME
【转】关于web路径的获取方法 huangyc1210 Web 路径
假定你的web application 名称为news,你在浏览器中输入请求路径： http://localhost:8080/news/main/list.jsp 则执行下面向行代码后打印出如下结果： 1、 System.out.println(request.getContextPath()); //可返回站点的根路径。也就是项
php里获取第一个中文首字母并排序远去的渡口数据结构 PHP
很久没来更新博客了，还是觉得工作需要多总结的好。今天来更新一个自己认为比较有成就的问题吧。最近在做储值结算，需求里结算首页需要按门店的首字母A-Z排序。我的数据结构原本是这样的： Array ( [0] => Array ( [sid] => 2885842 [recetcstoredpay] =&g
java内部类 hm4123660 java 内部类匿名内部类成员内部类方法内部类
　在Java中，可以将一个类定义在另一个类里面或者一个方法里面，这样的类称为内部类。内部类仍然是一个独立的类，在编译之后内部类会被编译成独立的.class文件，但是前面冠以外部类的类名和$符号。内部类可以间接解决多继承问题,可以使用内部类继承一个类，外部类继承一个类，实现多继承。 &nb
Caused by: java.lang.IncompatibleClassChangeError: class org.hibernate.cfg.Exten zhb8015
maven pom.xml关于hibernate的配置和异常信息如下，查了好多资料，问题还是没有解决。只知道是包冲突，就是不知道是哪个包....遇到这个问题的分享下是怎么解决的。。 maven pom: <dependency> <groupId>org.hibernate</groupId> <ar
Spark 性能相关参数配置详解－任务调度篇 Stark_Summer spark cache cpu 任务调度 yarn
随着Spark的逐渐成熟完善, 越来越多的可配置参数被添加到Spark中来, 本文试图通过阐述这其中部分参数的工作原理和配置思路, 和大家一起探讨一下如何根据实际场合对Spark进行配置优化。由于篇幅较长，所以在这里分篇组织，如果要看最新完整的网页版内容，可以戳这里：http://spark-config.readthedocs.org/，主要是便
css3滤镜 wangkeheng html css
经常看到一些网站的底部有一些灰色的图标，鼠标移入的时候会变亮，开始以为是js操作src或者bg呢，搜索了一下，发现了一个更好的方法：通过css3的滤镜方法。 html代码： <a href='' class='icon'><img src='utv.jpg' /></a> css代码： .icon{-webkit-filter: graysc

深度学习实际使用经验总结

常用算法总结

图像分类

目标检测

目标跟踪

人脸识别

度量学习

音频识别

传统图像算法

常用技术总结

网络设计

特征融合

激活函数

优化算法

损失函数

数据增强

模型压缩

训练策略

使用经验总结

数据预处理：在数据预处理阶段，通常包含以下流程

网络模型设计：根据具体的业务场景，选择/设计合适的网络架构，通常遵循以下原则：

损失函数设计：根据具体业务场景，选择/设计合适的损失函数，通常遵循以下原则：

训练策略：迭代训练更新模型参数，逐步提升模型效果

模型验证：使用实际场景数据验证模型的预测性能，包括效果和速度

常见问题和思考——模型训练阶段

模型训练效果差

模型训练速度慢

常见问题和思考——模型预测阶段

模型预测指标

模型预测效果差

模型预测资源占用高

模型处理未知类别

模型效果提升

常见问题与思考——模型推理加速

模型推理加速

影响模型速度的主要因素

常见问题与思考——工程化问题

工程化常见问题

你可能感兴趣的:(深度学习,人工智能,使用经验总结)