人工智能与算法学习

超越所有YOLO检测模型，mmdet开源当今最强最快目标检测模型！

首先，这里先声明一下由于论文和代码没有一并放出，所以以下内容全是个人学习RTMDet代码的一个结果，整个过程时间也比较紧凑，难免会有所遗漏和错误，一切关于RTMDet的工作，最终以OpenMMLab官方论文为主，因为看到开源代码的速度表，小编很难不爱，小模型就可以把YOLO全系列按在地上摩擦，因此也就有了下面的故事。

0、直接上架构图吧！

超越所有YOLO检测模型，mmdet开源当今最强最快目标检测模型！_第2张图片

看着上面的图，熟悉不？是不是满满的YOLO系列的味道？是的，看代码我猜应该是基于YOLO来进行的增量实验吧，也仅仅是猜啦，毕竟暗俺也没看到RTMDet的论文，俺也不是开发者！

1、改进点1 —— CSPNeXt

1.1 Backbone 部分

话不多说，直接上代码：

class CSPNeXtBlock(BaseModule):
    def __init__(self,
                 in_channels: int,
                 out_channels: int,
                 expansion: float = 0.5,
                 add_identity: bool = True,
                 use_depthwise: bool = False,
                 kernel_size: int = 5,
                 conv_cfg: OptConfigType = None,
                 norm_cfg: ConfigType = dict(
                     type='BN', momentum=0.03, eps=0.001),
                 act_cfg: ConfigType = dict(type='SiLU'),
                 init_cfg: OptMultiConfig = None) -> None:
        super().__init__(init_cfg=init_cfg)
        hidden_channels = int(out_channels * expansion)
        conv = DepthwiseSeparableConvModule if use_depthwise else ConvModule
        self.conv1 = conv(
            in_channels,
            hidden_channels,
            3,
            stride=1,
            padding=1,
            norm_cfg=norm_cfg,
            act_cfg=act_cfg)
        self.conv2 = DepthwiseSeparableConvModule(
            hidden_channels,
            out_channels,
            kernel_size,
            stride=1,
            padding=kernel_size // 2,
            conv_cfg=conv_cfg,
            norm_cfg=norm_cfg,
            act_cfg=act_cfg)
        self.add_identity = add_identity and in_channels == out_channels

    def forward(self, x: Tensor) -> Tensor:
        identity = x
        out = self.conv1(x)
        out = self.conv2(out)

        if self.add_identity:
            return out + identity
        else:
            return out

其实通过代码我们可以很直观的看出模型的架构细节，这里小编也进行了简要的绘制，具体如下图：

超越所有YOLO检测模型，mmdet开源当今最强最快目标检测模型！_第3张图片

这里提到的 Depthwise Separable Convolution 是 MobileNet 的基本单元，其实这种结构之前已经使用在 Inception 模型中。Depthwise Separable Convolution 其实是一种可分解卷积操作，其可以分解为2个更小的操作：Depthwise Convolution 和 Pointwise Convolution，如图所示。

超越所有YOLO检测模型，mmdet开源当今最强最快目标检测模型！_第4张图片

Depthwise Convolution 和标准卷积不同，对于标准卷积，其卷积核是用在所有的输入通道上（input channels），而 Depthwise Convolution 针对每个输入通道采用不同的卷积核，就是说一个卷积核对应一个输入通道，所以说 Depthwise Convolution 是 Depth 级别的操作。

而 Pointwise Convolution 其实就是普通的 1×1 的卷积。对于 Depthwise Separable Convolution，首先是采用 Depthwise Convolution 对不同输入通道分别进行卷积，然后采用 Pointwise Convolution 将上面的输出再进行结合，这样整体效果和一个标准卷积是差不多的，但是会大大减少计算量和模型参数量。

熟悉DarkNet的朋友应该都知道，如果你不知道，小编这里也给出架构图：

超越所有YOLO检测模型，mmdet开源当今最强最快目标检测模型！_第5张图片

然后依旧是直接上CSPLayer的代码：

class CSPLayer(BaseModule):
    def __init__(self,
                 in_channels: int,
                 out_channels: int,
                 expand_ratio: float = 0.5,
                 num_blocks: int = 1,
                 add_identity: bool = True,
                 use_depthwise: bool = False,
                 use_cspnext_block: bool = False,
                 channel_attention: bool = False,
                 conv_cfg: OptConfigType = None,
                 norm_cfg: ConfigType = dict(type='BN', momentum=0.03, eps=0.001),
                 act_cfg: ConfigType = dict(type='Swish'),
                 init_cfg: OptMultiConfig = None) -> None:
        super().__init__(init_cfg=init_cfg)
        block = CSPNeXtBlock if use_cspnext_block else DarknetBottleneck
        mid_channels = int(out_channels * expand_ratio)
        self.channel_attention = channel_attention
        self.main_conv = ConvModule(
            in_channels,
            mid_channels,
            1,
            conv_cfg=conv_cfg,
            norm_cfg=norm_cfg,
            act_cfg=act_cfg)
        self.short_conv = ConvModule(
            in_channels,
            mid_channels,
            1,
            conv_cfg=conv_cfg,
            norm_cfg=norm_cfg,
            act_cfg=act_cfg)
        self.final_conv = ConvModule(
            2 * mid_channels,
            out_channels,
            1,
            conv_cfg=conv_cfg,
            norm_cfg=norm_cfg,
            act_cfg=act_cfg)

        self.blocks = nn.Sequential(*[
            block(
                mid_channels,
                mid_channels,
                1.0,
                add_identity,
                use_depthwise,
                conv_cfg=conv_cfg,
                norm_cfg=norm_cfg,
                act_cfg=act_cfg) for _ in range(num_blocks)
        ])
        if channel_attention:
            self.attention = ChannelAttention(2 * mid_channels)

    def forward(self, x: Tensor) -> Tensor:
        x_short = self.short_conv(x)

        x_main = self.main_conv(x)
        x_main = self.blocks(x_main)

        x_final = torch.cat((x_main, x_short), dim=1)

        if self.channel_attention:
            x_final = self.attention(x_final)
        return self.final_conv(x_final)

其结构如下所示，毫无疑问依旧是香香的CSP思想，但是这里的结构使用了5×5的DW卷积，实现了更少的参数量的情况下，带来更大的感受野。

超越所有YOLO检测模型，mmdet开源当今最强最快目标检测模型！_第6张图片

同时这里RTMDet的Backbone中还考虑了通道注意力的问题，其代码如下：

class ChannelAttention(BaseModule):
    def __init__(self, channels: int, init_cfg: OptMultiConfig = None) -> None:
        super().__init__(init_cfg)
        self.global_avgpool = nn.AdaptiveAvgPool2d(1)
        self.fc = nn.Conv2d(channels, channels, 1, 1, 0, bias=True)
        self.act = nn.Hardsigmoid(inplace=True)

    def forward(self, x: torch.Tensor) -> torch.Tensor:
        out = self.global_avgpool(x)
        out = self.fc(out)
        out = self.act(out)
        return x * out

小编依旧给小伙伴们画了示意图：

超越所有YOLO检测模型，mmdet开源当今最强最快目标检测模型！_第7张图片

其实还有一个细节，这里我想的也不是很明白，如果熟悉ResNet构建的小伙伴应该知道，凯明大神在构建ResNet50是使用的残差Block的数量配比就是[3，6，6，3]，

超越所有YOLO检测模型，mmdet开源当今最强最快目标检测模型！_第8张图片

超越所有YOLO检测模型，mmdet开源当今最强最快目标检测模型！_第9张图片

这里RTMDet使用的配比也是：

超越所有YOLO检测模型，mmdet开源当今最强最快目标检测模型！_第10张图片

但是小编在白嫖 TRT-ViT、NeXtViT、SWin以及ConvNeXt的时候都在或有或无地说逐层增加配比会带来更好的结果，这里不知道为什么RTMDet选择以前的数据，期待论文中的描述和解释！

1.2 Neck部分

其实也是毫不意外的PAFPN的架构，只不过这里作者选择把YOLO系列中的CSPBlock替换为了本方法中的CSPNeXt Block，具体架构图如下所示：

超越所有YOLO检测模型，mmdet开源当今最强最快目标检测模型！_第11张图片

1.3 Head部分

这部分也是相对比较常规的设计，对于PAFPN结构输出的特征，先使用由堆叠的卷积所组成的分类分支以及回归分支提取对应的分类特征和回归特征，然后分别送到对应的RTM分类分支和回归分支，得到我们最终随需要的东西，这里有一个小小的细节，便是堆叠的卷积在不同level的中是共享权重的，具体可以参见代码，这里也不进行过多的猜测，最终还是以论文为主。

超越所有YOLO检测模型，mmdet开源当今最强最快目标检测模型！_第12张图片

2、匹配策略

直接上配置参数，熟悉Nanodet的小伙伴你是不是又知道了！嗯，是的是熟悉的味道，就是NanoDet-Plus的哪个策略，依旧很香，依旧很好用！！！

超越所有YOLO检测模型，mmdet开源当今最强最快目标检测模型！_第13张图片

当年的Nanodet-Plus是这样的：

超越所有YOLO检测模型，mmdet开源当今最强最快目标检测模型！_第14张图片

这里所谓动态匹配，简单来说就是直接使用模型检测头的输出，与所有Ground Truth计算一个匹配得分，这个得分由分类损失和回归损失相加得到。特征图上N个点的预测值，与M个Ground Truth计算得到一个N×M的矩阵，称为Cost Matrix，基于这个矩阵可以让当前预测结果动态地寻找最优标签，匹配的策略有二分图匹配、传输优化、Top-K等，在NanoDet中直接采取了Top-K的策略来匹配。

这种策略的一个问题在于，在网络训练的初期，预测结果是很差的，可能根本预测不出结果。所以在动态匹配时还会加上一些位置约束，比如使用一个 5×5 的中心区域去限制匹配的自由程度，然后再依赖神经网络天生的抗噪声能力，只需要在Ground Truth框内随机分配一些点，网络就能学到一些基础的特征。

3、损失函数

超越所有YOLO检测模型，mmdet开源当今最强最快目标检测模型！_第15张图片

这部分主要是是用来QFL和GIOU Loss，这里不进行过多描述，以后尽可能补上吧，今天太累了，已经太晚了。。。。

4、输入端部分

阶段一

作者在训练的第一阶段，主要是使用了CacheMosaic数据增强，RandomResize，RandomCrop，RandomCrop，CacheMixup以及YOLOX关于HSV的一些增强手段，这里的CacheMosaic以及CacheMixup是mmdet中全新提出的新Trcik炼丹术；

超越所有YOLO检测模型，mmdet开源当今最强最快目标检测模型！_第16张图片

阶段2

作者在训练阶段2提出了前面提出的新技术，CacheMosaic以及CacheMixup，看样子这里应该是学习YOLOX的训练技术：

超越所有YOLO检测模型，mmdet开源当今最强最快目标检测模型！_第17张图片

4.1、CacheMosaic

1、Mosaic流程：

选择Mosaic中心作为4幅图像的交点。
根据索引获取左上图，从自定义数据集中随机抽取另外3张图片。
如果图像大于Mosaic Patch，子图像将被裁剪。

2、CacheMosaic流程：

将上次Transform的结果加到Cache中。
选择Mosaic中心作为4幅图像的交点。
根据索引获取左上图，从结果缓存中随机抽取另外3张图片。
如果图像大于Mosaic Patch，子图像将被裁剪。

优点我猜就是训练快！！！

4.2、CacheMixup

1、Mixup

另一个随机图像被数据集挑选并嵌入到左上角的Patch中（在填充和调整大小之后）
mixup变换的目标是mixup image和origin image的加权平均。

2、CacheMixup

将上次Transform的结果加到Cache中。
从Cache中挑选另一个随机图像并嵌入到左上角的Patch中（在填充和调整大小之后）
mixup变换的目标是mixup image和origin image的加权平均。

参考

[1].https://github.com/RangiLyu/mmdetection/tree/rtmdet_config/configs/rtmdet.

分享

收藏

点赞

在看

你可能感兴趣的:(超越所有YOLO检测模型，mmdet开源当今最强最快目标检测模型！)

如何使用LangChain流式处理工具事件 fgayif langchain java 前端 python
在AI开发中，实时处理和监听事件是一项关键能力，特别是在处理复杂的模型和工具链时。本文将向您展示如何使用LangChain框架流式处理自定义工具中的事件，以便更好地监控和调试模型的内部状态。技术背景介绍LangChain是一个用于构建和操作语言模型的工具库，其中astream_events()方法能帮助我们监听和处理来自模型的事件流。了解如何正确地配置这些事件对于调试和高级应用至关重要，尤其是在运
使用Python和Django构建支持多语言的博客网站程序员～小强 python django sqlite
随着互联网的发展,博客已经成为人们获取信息和分享想法的重要平台。但是不同国家和地区的用户语言各异,这给博客的国际化带来了挑战。本文将介绍如何使用Python和Django这两个强大的Web开发框架,来构建一个支持多语言的博客网站。Django框架概述Django是一个开源的Web应用框架,由Python写成。它鼓励快速开发和干净的设计。通过提供大量常用组件,Django可以更快地构建高质量的Web
介于YOLOv5的裂缝识别系统程序员～小强 YOLO
介于YOLOv5的裂缝识别系统在现代工业中，裂缝监测是的保障设施安全的重要环节。我们公司的新项目——基于YOLOv5的裂缝识别系统，将为您提供高效、精准的解决方案，助力各类工程项目的质量管理。系统优势我们的裂缝识别系统借助YOLOv5进行深度学习，经过精心训练，拥有强大的图像识别能力。只需简单的步骤，您就能将复杂的裂缝检测转化为轻松的操作，让分析变得更加简单、高效。核心功能图片上传与场景选择用户可
探寻制造型企业MES管理系统：功能、架构与应用全解析深蓝易网数字工厂制造架构人工智能 1024程序员节大数据运维
在当今制造业蓬勃发展的背景下，制造执行MES系统对于制造型企业的高效运营起着举足轻重的作用。MES管理系统作为连接企业上层管理与底层生产的关键桥梁，其功能模块设计、架构搭建、系统集成以及实际应用都对企业的生产效能和竞争力有着深远影响。一、MES管理系统功能模块设计MES系统具备一系列功能强大的模块，以满足企业复杂的生产管理需求。计划管理模块：此模块主要负责生产计划的编制、下达和灵活调度。它依据订单
OCR提取+识别方案 ocr
1.内容提取通过YOLO提取需要识别的区域1.1安装ultralytics创建虚拟环境(可选)#创建虚拟环境python-mvenv.venv#激活虚拟环境###激活虚拟环境将更改shell的提示以显示您正在使用的虚拟环境，并修改环境，以便运行时python可以获得特定版本和安装的Python。例如：source.venv/bin/activate#显示虚拟环境中安装的所有软件包：python-m
位宽512bit显卡_6144 CUDA/512bit位宽 Maxwell架构曝光李涛PS 位宽512bit显卡
【IT168资讯】NVIDIA目前一代的显卡有GK104和GK110两大分支，它们的侧重点不同，但都是基于Kepler(开普勒，天文学家)架构的，下一代架构名为Maxwell(麦克斯韦尔，物理学家)，根据之前的传闻Maxwell最快将在明年Q1季度问世，制程有可能继续使用TSMC的28nm工艺。现在网上又流传开Maxwell的架构设计了，旗舰GM100将有6144个CUDA核心，512bit位宽显
初识HTTP 思考的橙子后端 http 网络协议网络
HTTP概念:HyperTextTransferProtocol，超文本传输协议，规定了浏览器和服务器之间数据传输的规则HTTP协议特点:1.基于TCP协议:面向连接，安全2.基于请求-响应模型的:一次请求对应一次响应3.HTTP协议是无状态的协议:对于事务处理没有记忆能力。每次请求-响应都是独立的。缺点:多次请求间不能共享数据。优点:速度快HTTP-请求数据格式请求数据分为3部分:1.请求行:请
unique_ptr 在跨线程使用时安全吗 unique-ptr
std::unique_ptr在跨线程使用时的安全性需要谨慎处理，因为它本身并不提供线程安全的机制。以下是关于std::unique_ptr在多线程环境中的安全性和使用注意事项：独占所有权与线程安全std::unique_ptr保证了对资源的独占所有权，这意味着在任何时刻只有一个std::unique_ptr实例可以管理一个特定的资源。由于std::unique_ptr不支持复制操作，仅支持移动语
网络安全爬虫全解析 Hacker_LaoYi 爬虫 web安全网络
1.网络爬虫的认识网络爬虫是自动从互联网定向或不定向地采集信息地一种程序工具。网络爬虫分为很多类别，常见的有批量型网络爬虫、增量型网络爬虫（通用爬虫）、垂直网络爬虫（聚焦爬虫）。2.网络爬虫的工作原理通用爬虫：首先给定初始URL，爬虫会自动获取这个URL上的所有URL并将已经在爬取的地址存放在已爬取列表中。将新的URL放在队列并依次读取新的URL，依次判读是否满足所设置的停止获取的条件。聚焦爬虫：
使用DeepSeek R1大模型编写迅投 QMT 的量化交易 Python 代码 wtsolutions qmt量化交易 python qmt deepseek 量化交易代码生成
随着人工智能技术的迅猛发展，利用AI工具提升工作效率已成为现代开发者的重要手段。在使用deepseek官方网页生成迅投QMT代码的时候，deepseek给出的代码是xtquant代码，也就是miniqmt代码，并不是我们传统意义上说的大QMT可用的代码。因此，我们需要自建一个知识库，让deepseek根据我的知识库里面的知识，去帮我生成大QMT可用的交易代码。一、建立迅投QMT的知识库建立迅投QM
Qt上位机编程命名规范-执行版有追求的菜鸟 qt 开发语言
主要规范原则参考Qt上位机编程命名规范。1.文件/文件夹大小写分析考虑跨平台性，全小写是一种约定俗成的风格，在许多大型开源项目中（如Linux内核、Python标准库）被广泛使用。1.1.配合文件扩展名通常文件名小写配合小写扩展名（如.h,.cpp,.json），使整体风格统一：main.cppconfig.jsonutils.h1.2.文件夹和pri文件命名通常小写、下划线分开：control_
Deepseek API 调用哦豁灬 LLM 深度学习生产工具 deepseek LLM API 大模型
1获取APIKey目前比较知名的提供了DeepSeek的推理服务商包括硅基流动、阿里云、腾讯云等等。这些推理服务商一般是提供API接口，需要安装大模型客户端并配置API。获取API密钥，以硅基流动为例：前往硅基流动官方网站（https://cloud.siliconflow.cn）注册账号。在账户管理的API密钥中点击新建API密钥并复制。安装一个本地的第三方大模型客户并配置，常见的包括Chatb
vLLM 部署大模型哦豁灬深度学习 LLM 人工智能 vLLM 大模型部署 LLM
1介绍vLLM是来自UCBerkeley的LMSYS在LLM推理方面的最新工作（没错就是搞出Vicuna的那个group），最大亮点是采用PagedAttention技术，结合ContinuousBatching，极大地优化了realtime场景下的LLMserving的throughput与内存使用。vllmgithub仓库1.1安装安装命令：pip3installvllm#vllm==0.2.
找不到Jmeter历史版本下载的同学看这里（内附使用阿里镜像和腾讯镜像下载开源软件的地址）测试开发Kevin jmeter 测试工具 jmeter
最近需要在jmeter4上验证一个问题，于是就在网上各种找jmeter不同版本的下载地址，比较麻烦。为了让大家不踩坑，在这里汇总一下下载地址：下载jmeter地址汇总jmeter最新版本官网下载地址：ApacheJMeter-DownloadApacheJMeterhttps://jmeter.apache.org/download_jmeter.cgijmeter历史版本下载地址（建议收藏）In
达梦数据库学习之旅不是，哥们~ 数据库学习
一、开篇：走进达梦数据库的世界在当今数字化浪潮汹涌澎湃的时代，数据已然成为企业乃至国家发展的核心驱动力，而数据库作为数据存储、管理与高效运用的关键基础设施，其重要性不言而喻。达梦数据库，作为国产数据库领域的璀璨明珠，正凭借其卓越性能、高度可靠性以及强大的自主可控特性，在金融、电信、政务等诸多关键行业崭露头角，逐步打破国外数据库产品长期以来的垄断格局。对于广大技术爱好者与从业者而言，深入学习达梦数据
利用Pinecone和Hybrid Search实现高效向量检索 dgay_hua python
在当今数据驱动的世界中，快速准确的信息检索变得尤为重要。Pinecone作为一个功能强大的向量数据库，提供了广泛的功能，包括HybridSearch。本文将详细介绍如何使用Pinecone和HybridSearch构建高效的信息检索系统。1.技术背景介绍Pinecone是专为高效向量检索设计的数据库，可以处理高维数据。HybridSearch结合了密集向量和稀疏向量检索的优势，在提高检索准确性的同
STM32F103C8T6点灯/流水灯（指定IO，正向反向） BDXiaotianYA stm32 嵌入式硬件单片机
参加2023年电赛后，到现在上班一年多，长达两年时间内，几乎没有再碰过单片机，由于现在工作中需要接触到一些代码，先退回来复习下32单片机。本人在此做一件事情，傻瓜式代码，让代码足够简洁，足够规范，让你复制我的代码百分百能够使用。此账号仅作为分享本人复习过程中记录使用，如果无法使用，或者或者有优化的地方，欢迎留言，看到后第一时间给予回复。有空会将2023激光打靶代码开源出来。在使用本程序的时候，默认
Python 爬虫实战：社交媒体品牌反馈数据抓取与舆情分析西攻城狮北 python 爬虫媒体
一、引言在当今数字化时代，社交媒体已成为公众表达意见、分享信息的重要渠道。品牌的声誉和市场表现往往受到消费者在社交平台上的反馈和评价的影响，因此品牌舆情分析变得至关重要。本文将介绍如何使用爬虫技术爬取社交媒体上的品牌反馈数据，并通过数据分析技术，分析品牌的舆情动态。二、环境准备在开始之前，确保你的开发环境已经安装了以下必要的Python库：requests:用于发送HTTP请求。beautiful
Python预训练模型实现俄语音频转文字啥都鼓捣的小yao 人工智能 python 音视频人工智能
Python预训练模型实现俄语音频转文字使用CommonVoice8.0、Golos和MultilingualTEDx的训练和验证分割对俄语的facebook/wav2vec2-xls-r-1b进行了微调。使用此模型时，请确保您的语音输入以16kHz采样。我们只需要装好三个功能包，写好你的文件路径即可使用！importtorchimportlibrosafromtransformersimport
如何使用Formal SEC证明设计手动插入的clock gating cell没有引入功能问题？ iccnewer
基于FormalSEC的时钟门控验证技术是一个非常高效，但是并不是每个芯片工程师都使用过技术。很多公司的流程可能也不涉及。设计手动插入clockgating的目的是通过关闭闲置电路的时钟来降低功耗（可能是拿内部一些vld信号作为唤醒信号，或者使用某个featureen信号），但验证其正确性极为复杂。传统仿真难以覆盖所有场景，尤其是时序边界或逻辑组合问题，可能导致功能错误或功耗异常。如果唤醒信号有几
spring MVC 介绍 LCY133 spring后端 spring mvc java
SpringMVC是Spring框架中用于构建Web应用的核心模块，基于MVC设计模式（Model-View-Controller）实现。以下是其核心概念的整理：1.MVC设计模式•Model（模型）：封装业务数据和业务逻辑（如POJO对象、Service层）。•View（视图）：负责数据展示（如JSP、Thymeleaf、HTML）。•Controller（控制器）：接收请求，调用业务逻辑，返回
kotlin中的数据转换 LCY133 spring后端 kotlin python 开发语言
在Kotlin中，将数字转换为字符串非常简单且灵活。以下是几种常用的方法及其示例：1.直接使用toString()方法所有数字类型（Int、Long、Double等）都提供了toString()方法，可以直接将数字转为字符串。valnumber=42valstr1=number.toString()//"42"valpi=3.14159valstr2=pi.toString()//"3.14159
P1706 全排列问题及 P1157 组合的输出 wwjjjww 算法深度优先图论
全排列:题目描述按照字典序输出自然数1到n所有不重复的排列，即n的全排列，要求所产生的任一数字序列中不允许出现重复的数字。输入格式一个整数n。输出格式由1∼n组成的所有不重复的数字序列，每行一个序列。#includeusingnamespacestd;intn;boolv[100];inta[100];voiddfs(intpos){if(pos==n+1){for(inti=1;i>n;dfs(
6.8:Python如何处理文件写入时出现的错误？小兔子平安 Python完整学习全解答 java windows html
Python是一种功能强大且易于学习的编程语言，已经成为了当今最流行的编程语言之一。随着Python应用领域的不断扩大，越来越多的人开始学习Python，希望能够掌握这个有用的工具，从而实现更多的创意和创新。而文件操作是Python编程中不可或缺的一部分，对于处理文件写入时的错误更是必须掌握的技能。本文主要介绍如何处理Python中文件写入时的错误。我们将详细讲解如何使用try-except语句、
如何使用JSON输出解析器解析语言模型的输出 vaidfl json 语言模型 easyui python
在现代AI应用中，让语言模型返回结构化的数据是一个重要的能力，特别是在需要进一步处理或集成的时候。本文将深入探讨如何利用JsonOutputParser来解析语言模型的JSON输出。技术背景介绍随着语言模型的普及，许多应用场景需要从自然语言处理任务中获取结构化的输出。针对这一需求，输出解析器应运而生，它能够帮助我们定义JSON模式，通过提示语言模型生成符合该模式的输出，并将其解析为JSON格式。核
pfsense部署四（静态路由的配置） SecPulse pfsense使用 pfsense 开源防火墙人工智能服务器组网网络安全 tcp/ip
目录一.介绍二.配置过程一.介绍pfsense开源防火墙经常在进行组网时，通常会用于连接不同的网络，在这个时候进需要给pfsense配置路由，而这篇文章介绍的是静态路由的配置二.配置过程拓扑图：本次实验使用ensp模拟器进行模拟，使用一个cloud连接pfsense，有两个网段，分别是192.168.184.0/24和192.168.111.0/24首先给cloud进行配置给AR1配置ip地址sy
SAP ABAP 调用 DeepSeek，API Key 存在什么地方最安全？汪子熙 ABAP 百科全书安全 ABAP NetWeaver 思爱普
笔者最近在处理一个SAP电商云和SAPS/4HANA集成后商品库存显示不同步的棘手问题。DeepSeek和ChatGPT没能帮上忙，最后还是查公司内网wiki搞定了。DeepSeek和ChatGPT确实不是万能的。ChatGPT3.5刚发布不久，我记得很多朋友聊起过大语言模型的「讨好型人格」，即倾向于迎合用户的观点、顺从用户的意愿。甚至在极端情况下，当用户对其回复提出质疑时，它会马上认怂，承认自己
BM25S 项目安装和配置指南陆汝涓Marissa
BM25S项目安装和配置指南bm25sBM25Sisanultra-fastlexicalsearchlibrarythatimplementsBM25usingscipy项目地址:https://gitcode.com/gh_mirrors/bm/bm25s1.项目基础介绍和主要编程语言BM25S是一个快速实现BM25算法的开源项目，主要用于文本检索任务。BM25是一种广泛使用的排名函数，常用于
使用LocalAI进行文本嵌入的实战指南 bavDHAUO python
技术背景介绍文本嵌入是一种将文本片段转换为高维向量的技术，可以用于自然语言处理任务中的相似性计算、信息检索等应用。LocalAI提供了一种本地化的嵌入解决方案，允许开发者在本地环境中运行和测试嵌入模型。通过在本地部署LocalAI服务，您可以避免依赖外部API，享受更快的响应速度和更好的数据隐私。核心原理解析LocalAIEmbedding类主要负责与本地运行的LocalAI服务通信，进行文本嵌入
关于forward函数 oioz 深度学习
定义forward函数是模型的核心前向传播逻辑，定义了输入数据如何在模型中传递和计算。它将输入数据通过模型的各层（如卷积层、全连接层等），计算出模型的输出。作用负责模型的主要计算逻辑。在训练和验证过程中都会被调用。特点必须实现：在PyTorch中，forward函数是模型的核心部分，必须显式定义。灵活性高：可以根据模型需要，自由定义forward函数的内容，包括各种计算操作。示例（PyTorch）
windows下源码安装golang 616050468 golang安装 golang环境 windows
系统： 64位win7，开发环境：sublime text 2， go版本： 1.4.1 1. 安装前准备(gcc, gdb, git) golang在64位系
redis批量删除带空格的key bylijinnan redis
redis批量删除的通常做法： redis-cli keys "blacklist*" | xargs redis-cli del 上面的命令在key的前后没有空格时是可以的，但有空格就不行了： $redis-cli keys "blacklist*" 1) "blacklist:12: [email protected]
oracle正则表达式的用法 0624chenhong oracle 正则表达式
方括号表达示方括号表达式描述 [[:alnum:]] 字母和数字混合的字符 [[:alpha:]] 字母字符 [[:cntrl:]] 控制字符 [[:digit:]] 数字字符 [[:graph:]] 图像字符 [[:lower:]] 小写字母字符 [[:print:]] 打印字符 [[:punct：]] 标点符号字符 [[:space:]]
2048源码(核心算法有，缺少几个anctionbar，以后补上) 不懂事的小屁孩 2048
2048游戏基本上有四部分组成， 1：主activity，包含游戏块的16个方格，上面统计分数的模块 2：底下的gridview，监听上下左右的滑动，进行事件处理， 3：每一个卡片，里面的内容很简单，只有一个text，记录显示的数字 4：Actionbar，是游戏用重新开始，设置等功能(这个在底下可以下载的代码里面还没有实现) 写代码的流程 1：设计游戏的布局，基本是两块，上面是分
jquery内部链式调用机理换个号韩国红果果 JavaScript jquery
只需要在调用该对象合适(比如下列的setStyles)的方法后让该方法返回该对象（通过this 因为一旦一个函数称为一个对象方法的话那么在这个方法内部this（结合下面的setStyles）指向这个对象） function create(type){ var element=document.createElement(type); //this=element;
你订酒店时的每一次点击背后都是NoSQL和云计算蓝儿唯美 NoSQL
全球最大的在线旅游公司Expedia旗下的酒店预订公司，它运营着89个网站，跨越68个国家，三年前开始实验公有云，以求让客户在预订网站上查询假期酒店时得到更快的信息获取体验。云端本身是用于驱动网站的部分小功能的，如搜索框的自动推荐功能，还能保证处理Hotels.com服务的季节性需求高峰整体储能。 Hotels.com的首席技术官Thierry Bedos上个月在伦敦参加“2015 Clou
java笔记1 a-john java
1，面向对象程序设计（Object-oriented Propramming，OOP）：java就是一种面向对象程序设计。 2，对象：我们将问题空间中的元素及其在解空间中的表示称为“对象”。简单来说，对象是某个类型的实例。比如狗是一个类型，哈士奇可以是狗的一个实例，也就是对象。 3，面向对象程序设计方式的特性： 3.1 万物皆为对象。
C语言 sizeof和strlen之间的那些事 C/C++软件开发求职面试题必备考点（一） aijuans C/C++求职面试必备考点
找工作在即，以后决定每天至少写一个知识点，主要是记录，逼迫自己动手、总结加深印象。当然如果能有一言半语让他人收益，后学幸运之至也。如有错误，还希望大家帮忙指出来。感激不尽。后学保证每个写出来的结果都是自己在电脑上亲自跑过的，咱人笨，以前学的也半吊子。很多时候只能靠运行出来的结果再反过来
程序员写代码时就不要管需求了吗？ asia007 程序员不能一味跟需求走
编程也有2年了，刚开始不懂的什么都跟需求走，需求是怎样就用代码实现就行，也不管这个需求是否合理，是否为较好的用户体验。当然刚开始编程都会这样，但是如果有了2年以上的工作经验的程序员只知道一味写代码，而不在写的过程中思考一下这个需求是否合理，那么，我想这个程序员就只能一辈写敲敲代码了。我的技术不是很好，但是就不代
Activity的四种启动模式百合不是茶 android 栈模式启动 Activity的标准模式启动栈顶模式启动单例模式启动
android界面的操作就是很多个activity之间的切换,启动模式决定启动的activity的生命周期 ; 启动模式xml中配置 <activity android:name=".MainActivity" android:launchMode="standard&quo
Spring中@Autowired标签与@Resource标签的区别 bijian1013 java spring @Resource @Autowired @Qualifier
Spring不但支持自己定义的@Autowired注解，还支持由JSR-250规范定义的几个注解，如：@Resource、 @PostConstruct及@PreDestroy。 1. @Autowired @Autowired是Spring 提供的，需导入 Package:org.springframewo
Changes Between SOAP 1.1 and SOAP 1.2 sunjing Changes Enable SOAP 1.1 SOAP 1.2
JAX-WS SOAP Version 1.2 Part 0: Primer (Second Edition) SOAP Version 1.2 Part 1: Messaging Framework (Second Edition) SOAP Version 1.2 Part 2: Adjuncts (Second Edition) Which style of WSDL
【Hadoop二】Hadoop常用命令 bit1129 hadoop
以Hadoop运行Hadoop自带的wordcount为例， hadoop脚本位于/home/hadoop/hadoop-2.5.2/bin/hadoop，需要说明的是，这些命令的使用必须在Hadoop已经运行的情况下才能执行 Hadoop HDFS相关命令 hadoop fs -ls 列出HDFS文件系统的第一级文件和第一级
java异常处理（初级）白糖_ java DAO spring 虚拟机 Ajax
从学习到现在从事java开发一年多了，个人觉得对java只了解皮毛，很多东西都是用到再去慢慢学习，编程真的是一项艺术，要完成一段好的代码，需要懂得很多。最近项目经理让我负责一个组件开发，框架都由自己搭建，最让我头疼的是异常处理，我看了一些网上的源码，发现他们对异常的处理不是很重视，研究了很久都没有找到很好的解决方案。后来有幸看到一个200W美元的项目部分源码，通过他们对异常处理的解决方案，我终
记录整理-工作问题 braveCS 工作
1）那位同学还是CSV文件默认Excel打开看不到全部结果。以为是没写进去。同学甲说文件应该不分大小。后来log一下原来是有写进去。只是Excel有行数限制。那位同学进步好快啊。 2）今天同学说写文件的时候提示jvm的内存溢出。我马上反应说那就改一下jvm的内存大小。同学说改用分批处理了。果然想问题还是有局限性。改jvm内存大小只能暂时地解决问题，以后要是写更大的文件还是得改内存。想问题要长远啊
org.apache.tools.zip实现文件的压缩和解压，支持中文 bylijinnan apache
刚开始用java.util.Zip，发现不支持中文（网上有修改的方法，但比较麻烦）后改用org.apache.tools.zip org.apache.tools.zip的使用网上有更简单的例子下面的程序根据实际需求，实现了压缩指定目录下指定文件的方法 import java.io.BufferedReader; import java.io.BufferedWrit
读书笔记-4 chengxuyuancsdn 读书笔记
1、JSTL 核心标签库标签 2、避免SQL注入 3、字符串逆转方法 4、字符串比较compareTo 5、字符串替换replace 6、分拆字符串 1、JSTL 核心标签库标签共有13个，学习资料：http://www.cnblogs.com/lihuiyy/archive/2012/02/24/2366806.html 功能上分为4类： (1)表达式控制标签：out
[物理与电子]半导体教材的一个小问题 comsci 问题
各种模拟电子和数字电子教材中都有这个词汇-空穴书中对这个词汇的解释是; 当电子脱离共价键的束缚成为自由电子之后,共价键中就留下一个空位,这个空位叫做空穴我现在回过头翻大学时候的教材,觉得这个
Flashback Database --闪回数据库 daizj oracle 闪回数据库
Flashback 技术是以Undo segment中的内容为基础的，因此受限于UNDO_RETENTON参数。要使用flashback 的特性，必须启用自动撤销管理表空间。在Oracle 10g中， Flash back家族分为以下成员： Flashback Database， Flashback Drop，Flashback Query(分Flashback Query,Flashbac
简单排序:插入排序 dieslrae 插入排序
public void insertSort(int[] array){ int temp; for(int i=1;i<array.length;i++){ temp = array[i]; for(int k=i-1;k>=0;k--)
C语言学习六指针小示例、一维数组名含义，定义一个函数输出数组的内容 dcj3sjt126com c
# include <stdio.h> int main(void) { int * p; //等价于 int *p 也等价于 int* p; int i = 5; char ch = 'A'; //p = 5; //error //p = &ch; //error //p = ch; //error p = &i; //
centos下php redis扩展的安装配置3种方法 dcj3sjt126com redis
方法一 1.下载php redis扩展包代码如下复制代码 #wget http://redis.googlecode.com/files/redis-2.4.4.tar.gz 2 tar -zxvf 解压压缩包，cd /扩展包（进入扩展包然后运行phpize 一下是我环境中phpize的目录，/usr/local/php/bin/phpize (一定要
线程池(Executors) shuizhaosi888 线程池
在java类库中，任务执行的主要抽象不是Thread，而是Executor，将任务的提交过程和执行过程解耦 public interface Executor { void execute(Runnable command); } public class RunMain implements Executor{ @Override pub
openstack 快速安装笔记 haoningabc openstack
前提是要配置好yum源版本icehouse，操作系统redhat6.5 最简化安装，不要cinder和swift 三个节点 172 control节点keystone glance horizon 173 compute节点nova 173 network节点neutron control /etc/sysctl.conf net.ipv4.ip_forward =
从c面向对象的实现理解c++的对象（二） jimmee C++面向对象虚函数
1. 类就可以看作一个struct，类的方法，可以理解为通过函数指针的方式实现的，类对象分配内存时，只分配成员变量的，函数指针并不需要分配额外的内存保存地址。 2. c++中类的构造函数，就是进行内存分配(malloc)，调用构造函数 3. c++中类的析构函数，就时回收内存(free) 4. c++是基于栈和全局数据分配内存的，如果是一个方法内创建的对象，就直接在栈上分配内存了。专门在
如何让那个一个div可以拖动 lingfeng520240 html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml
第10章高级事件（中） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
计算两个经纬度之间的距离 roadrunners 计算纬度 LBS 经度距离
要解决这个问题的时候，到网上查了很多方案，最后计算出来的都与百度计算出来的有出入。下面这个公式计算出来的距离和百度计算出来的距离是一致的。 /** * * @param longitudeA * 经度A点 * @param latitudeA * 纬度A点 * @param longitudeB *
最具争议的10个Java话题 tomcat_oracle java
1、Java8已经到来。什么！？ Java8 支持lambda。哇哦，RIP Scala！　　随着Java8 的发布，出现很多关于新发布的Java8是否有潜力干掉Scala的争论，最终的结论是远远没有那么简单。Java8可能已经在Scala的lambda的包围中突围，但Java并非是函数式编程王位的真正觊觎者。　　2、Java 9 即将到来　　 Oracle早在8月份就发布
zoj 3826 Hierarchical Notation(模拟) 阿尔萨斯 rar
题目链接：zoj 3826 Hierarchical Notation 题目大意：给定一些结构体，结构体有value值和key值，Q次询问，输出每个key值对应的value值。解题思路：思路很简单，写个类词法的递归函数，每次将key值映射成一个hash值，用map映射每个key的value起始终止位置，预处理完了查询就很简单了。这题是最后10分钟出的，因为没有考虑value为{}的情

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他