weixin_42118657

算法了解：RCNN、SPP-Net、Fast-RCNN、Faster-RCNN

强烈推荐视频：

非常严谨，非常美观，非常清楚（重点和细节全讲了，观看人数多，有指正）。

RCNN理论合集：https://www.bilibili.com/video/BV1af4y1m7iL?from=search&seid=4520391483531272743

（包括RCNN系列、YOLO系列、以及源码讲解，非常精良成体系）

1 RCNN（2014年）

1.1 发明背景

2012年AlexNet在ImageNet举办的ILSVRC中大放异彩，R-CNN作者受此启发，尝试将AlexNet在图像分类上的能力迁移到PASCAL VOC（1万图像，20类，标定类别和位置）的目标检测上。这就要解决两个问题：

如何利用卷积网络去目标定位
如何在小规模的数据集上训练出较好的网络模型。

1.2 解决思路

针对问题1，R-CNN利用候选区域的方法（Region Proposal），这也是该网络被称为R-CNN的原因：Regions with CNN features。

针对问题2，R-CNN使用了微调的方法，利用AlexNet在ImageNet上预训练好的模型。

训练总思路

生成候选区：一张图片生成1000~2000个候选区域(Region Proposal)。
CNN特征提取：对每个候选区域，输入到预训练好的AlexNet中，提取一个固定长度（4096）的特征向量。
分类器（类别）：对每个目标（类别）训练一SVM分类器，识别该区域是否包含目标。
回归器（位置）：训练一个线性回归模型判断当前框是不是很完美，修正候选区域中目标的位置。

疑问：为什么用SVM分类而不使用CNN全连接之后的softmax直接把分类做了？

原因：主要是基于CNN阶段和SVM阶段对正样本的IOU阈值标准需要不一样，单独再训练SVM去分类，对正样本IOU阈值可以定的更高，从而带来分类精度提升。见知乎：https://www.zhihu.com/question/54117650

R-CNN的目标检测过程：

1）候选区域选择

用什么方法提取框：Region Proposal是一类传统的区域提取方法，可以看作不同宽高的滑动窗口，通过窗口滑动获得潜在的目标图像。

提取多少个框：具体是使用了Selective Search方法从一张图像生成约2000-3000个候选区域。

提取框后干什么：根据Proposal提取的目标图像进行归一化，作为CNN的标准输入。

2）CNN特征提取

对生成的2000个候选区域，使用预训练好的AlexNet网络进行特征提取。

输入：候选框输入尺寸227×227，归一化。
网络结构：改造预训练好的AlexNet网络（5个卷积层，2个全连接层），将其最后的全连接层去掉，并将类别设置为21（20个目标类别，另外一个类别代表背景）.
输出：得到一个4096×21的特征。

3）SVM分类器

利用上面提取到的候选区域的特征向量，通过SVM分类器来判断是哪个目标类别。而SVM是一种典型的两类分类器，即它只回答属于正类还是负类的问题。SVM多分类有两种方式，这里作者使用的是：有多少个目标类，就单独训练多少个SVM分类器。

比如，下图针对狗的SVM分类器：

狗的SVM分类器，就要能判断出某个候选区域是不是包含狗，包含狗了那就是Positive；不包含就是Negative.

对于候选区域只是框出来了某个类的一部分图像问题，在R-CNN中，设定一个0.3的IOU阈值，如果该区域与Ground truth的IOU低于该阈值，就将给区域设置为Negative。

4）边界框回归

主要参考：https://blog.csdn.net/zijin0802034/article/details/77685438

边界框回归怎么做的？

对于窗口一般使用四维向量(x,y,w,h)来表示，分别表示窗口的中心点坐标和宽高。对于下图2，红色的框 P 代表原始的Proposal, 绿色的框 G 代表目标的 Ground Truth，我们的目标是寻找一种关系使得输入原始的窗口 P 经过映射得到一个跟真实窗口 G 更接近的回归窗口G^。

边框回归的目的既是：给定(Px,Py,Pw,Ph)寻找一种映射ff，使得f(Px,Py,Pw,Ph) = (Gx^,Gy^,Gw^,Gh^) 并且(Gx^,Gy^,Gw^,Gh^) ≈ (Gx,Gy,Gw,Gh)。

具体算法见参考文献，大概意思如下：

测试

从一张图片中提取2000个候选区域，将每个区域按照训练时候的方式进行处理，输入到SVM中进行正负样本的识别，并使用候选框回归器，计算出每个候选区域的分数。针对每个类，通过计算IOU,采取非最大值抑制的方法，以最高分的区域为基础，删掉重叠的区域。

1.3 意义

RCNN作为第一篇目标检测领域的深度学习文章，大幅提升了目标检测的识别精度，在PASCAL VOC2012数据集上将mAP从35.1%提升至53.7%。使得CNN在目标检测领域成为常态，也使得大家开始探索CNN在其他计算机视觉领域的巨大潜力。

1.4 不足

对每个新图像进行预测需要大约40-50秒。
训练分为多个步骤，比较繁琐：① 需要微调CNN网络提取特征，②需要训练SVM进行正负样本分类，③训练边框回归器得到正确的预测位置。
训练耗时，中间要保持候选区域的特征，5000张的图片会生成几百G的特征文件。
每一个ProposalRegion都需要进入CNN网络计算，上千个Region存在大量的范围重叠，重复的特征提取带来巨大的计算浪费。

2 SPP-Net（ECCV 2014）

何凯明等发明。

智者善于提出疑问，既然CNN的特征提取过程如此耗时（大量的卷积计算），为什么要对每一个候选区域独立计算，而不是先提取图像的整体特征，然后仅在分类之前做一次Region截取呢？立即付诸实践，于是SPP-Net诞生了。

SPP-Net整个过程：

首先通过选择性搜索，对待检测的图片进行搜索出2000个候选窗口。这一步和R-CNN一样。
特征提取阶段。这一步就是和R-CNN最大的区别了，这一步骤的具体操作如下：把整张待检测的图片，输入CNN中，进行一次性特征提取，得到feature maps，然后在feature maps中找到各个候选框的区域，再对各个候选框采用金字塔空间池化，提取出固定长度的特征向量。而R-CNN输入的是每个候选框，然后在进入CNN，因为SPP-Net只需要一次对整张图片进行特征提取，速度会大大提升。
最后一步也是和R-CNN一样，采用SVM算法进行特征向量分类识别。

2.1 SPP-Net网络

RCNN过程：

SPP-Net过程：

SPP-net与R-CNN的对比：RCNN输入原图像的proposal，SPP-Net输入特征的proposal.

2.2 SPP-Net 主要改进点

SPP-Net在RCNN的基础上做了实质性的改进：

1）取消了crop/warp图像归一化过程，解决图像变形导致的信息丢失以及存储问题；
2）采用空间金字塔池化（SpatialPyramid Pooling ）替换了全连接层之前的最后一个池化层。

为了适应不同分辨率的特征图，定义一种可伸缩的池化层，不管输入分辨率是多大，都可以划分成m*n个部分。这是SPP-net的第一个显著特征，它的输入是conv5特征图 以及特征图候选框（原图候选框通过stride映射得到），输出是固定尺寸（m*n）特征；

还有金字塔呢？通过多尺度增加所提取特征的鲁棒性，这并不关键，在后面的Fast-RCNN改进中该特征已经被舍弃；

最关键的是SPP的位置，它放在所有的卷积层之后，有效解决了卷积层的重复计算问题（测试速度提高了24~102倍），这是论文的核心贡献。

2.3 SPP-Net不足

1）和RCNN一样，训练过程仍然是隔离的，提取候选框 | 计算CNN特征| SVM分类 | Bounding Box回归独立训练，大量的中间结果需要转存，无法整体训练参数；
2）SPP-Net在无法同时Tuning在SPP-Layer两边的卷积层和全连接层，很大程度上限制了深度CNN的效果；
3）在整个过程中，Proposal Region仍然很耗时。

3 Fast-RCNN（2015）

RCNN原作者Ross Girshick2015年推出。

Fast-RCNN主要贡献在于对RCNN进行加速：训练时间从84小时减少为9.5小时，测试时间从47秒减少为0.32秒。

创新点：

借鉴SPP思路，提出简化版的ROI池化层（注意，没用金字塔），同时加入了候选框映射功能，使得网络能够反向传播，解决了SPP的整体网络训练问题，模型训练时可对所有层进行更新；
多任务Loss层
1. SoftmaxLoss代替了SVM，证明了softmax比SVM更好的效果；（为什么不使用SVM了：训练使用难样本挖掘以使网络获得高判别力，从而精准定位目标）
2. SmoothL1Loss取代Bouding box回归

将分类和边框回归进行合并（又一个开创性的思路），通过多任务Loss层进一步整合深度网络，统一了训练过程，从而提高了算法准确度。

网络结构

4 Faster R-CNN（2015）

作者：任少卿、何凯明、Ross Girshick, 孙剑

在Fast R-CNN中使用的目标检测识别网络，在速度和精度上都有了不错的结果。不足的是，其候选区域提取方法耗时较长，而且和目标检测网络是分离的，并不是end-to-end的。在Faster R-CNN中提出了区域检测网络(Region Proposal Network,RPN)，将候选区域的提取和Fast R-CNN中的目标检测网络融合到一起，这样可以在同一个网络中实现目标检测。

Faster R-CNN的网络有4部分组成：

Conv Layers 一组基础的CNN层，由Conv + Relu + Pooling组成，用于提取输入图像的Feature Map。通常可以选择有5个卷积层的ZF网络或者有13个卷积层的VGG16。Conv Layers提取的Feature Map用于RNP网络生成候选区域以及用于分类和边框回归的全连接层。
RPN，区域检测网络输入的是前面卷积层提取的Feature Map，输出为一系列的候选区域。
RoI池化层输入的是卷积层提取的Feature Map 和 RPN生成的候选区域RoI，其作用是将Feature Map 中每一个RoI对应的区域转为为固定大小的H×WH×W的特征图，输入到后面的分类和边框回归的全连接层。
分类和边框回归修正输入的是RoI池化后RoI的H×WH×W的特征图，通过SoftMax判断每个RoI的类别，并对边框进行修正。

其整个工作流程如下：

将样本图像整个输入到Conv Layers中，最后得到Feature Map。
将该Feature Map输入到RPN网络中，提取到一系列的候选区域
然后由RoI池化层提取每个候选区域的特征图
将候选区域的特征图输入到用于分类的Softmax层以及用于边框回归全连接层。

网络结构细节

下面这张图的目的是为了显示训练是分阶段的，即像之前的方法一样，先产生建议框，然后拿建议框去分类，只不过这里建议框的生成方式换成了RPN网络。

之前的Fast R-CNN存在的问题：存在瓶颈：选择性搜索，找出所有的候选框，这个也非常耗时。解决方法：加入一个提取边缘的神经网络，也就说找到候选框的工作也交给神经网络来做了，即Region Proposal Network(RPN)。
Faster R-CNN解决的是，“为什么还要用selective search呢？”----将选择性搜索候选框的方法换成Region Proposal Network(RPN)。

RPN（里程碑式的贡献）

RPN的最终结果是用CNN来生成候选窗口，通过得分排序等方式挑出量少质优的框（~300）
让生成候选窗口的CNN和分类的CNN共享卷积层

其实RPN最终就是在原图尺度上，设置了密密麻麻的候选Anchor。然后用cnn去判断哪些Anchor是里面有目标的foreground anchor，哪些是没目标的backgroud。所以，仅仅是个二分类而已！）

RPN网络的特点在于通过滑动窗口的方式实现候选框的提取，每个滑动窗口位置生成9个候选窗口（不同尺度、不同宽高），提取对应9个候选窗口（anchor）的特征，用于目标分类和边框回归，与FastRCNN类似。

目标分类只需要区分候选框内特征为前景或者背景。

边框回归确定更精确的目标位置，基本网络结构如下图所示：

训练过程中，涉及到的候选框选取，选取依据：

丢弃跨越边界的anchor；
与样本重叠区域大于0.7的anchor标记为前景，重叠区域小于0.3的标定为背景

对于每一个位置，通过两个全连接层（目标分类+边框回归）对每个候选框（anchor）进行判断，并且结合概率值进行舍弃（仅保留约300个anchor）， 没有显式地提取任何候选窗口 ，完全使用网络自身完成判断和修正。

从模型训练的角度来看，通过使用共享特征交替训练的方式，达到接近实时的性能，交替训练方式描述为：

根据现有网络初始化权值w，训练RPN；
用RPN提取训练集上的候选区域，用候选区域训练FastRCNN，更新权值w；
重复1、2，直到收敛。

5 总结

RCNN网络的演进：

RCNN网络的速度和精度：

主要参考：

RCNN到Faster R-CNN笔记 https://www.jianshu.com/p/4064de5499d5

RCNN介绍 https://blog.csdn.net/xyfengbo/article/details/70227173?utm_medium=distribute.pc_relevant.none-task-blog-title-2&spm=1001.2101.3001.4242

目标检测之R-CNN系列 https://www.cnblogs.com/wangguchangqing/p/10384058.html

Web 服务器架构选择深度解析后端
在Web服务与API设计中，服务器架构的选择直接决定系统的可扩展性、维护成本与性能上限。本文从架构演进脉络出发，系统解析单体架构、微服务、服务网格、Serverless等主流架构的核心特性、适用场景及Java技术栈实现。一、架构演进与核心分类1.1架构演进脉络1.2核心架构对比表架构类型核心特点典型技术栈（Java）部署复杂度扩展性单体架构所有功能模块打包为单一应用，共享数据库SpringBoot
主流视频流格式及 Vue3 实现方案玛卡巴卡半夜不睡觉 html5 前端 vue.js
1.HLS(HTTPLiveStreaming)技术原理：基于HTTP的流媒体协议，使用.m3u8索引文件+.ts分片文件。特点：高兼容性（尤其iOS）、10+秒延迟、支持自适应码率。Vue3实现（video.js）：npminstallvideo.jsvideojs-contrib-hlsimport{ref,onMounted,onUnmounted}from'vue';importvideo
LLM大模型命名规则与部署硬件实践手册
文章目录一、理论基础：从信息编码到系统设计1.1命名系统的信息论基础1.2硬件架构与模型运行的关系1.3量化技术的数学原理二、国际主流模型命名规则深度解析2.1OpenAI：极简主义与功能导向2.2AnthropicClaude：诗意命名的技术内涵2.3GoogleGemini：统一品牌下的分层架构2.4MetaLlama：开源社区的透明化命名三、国内主流模型命名规则与文化内涵3.1百度文心：知识
前端领域的前端可视化设计案例解析前端视界前端艺匠馆前端 ai
前端可视化设计案例解析：从技术实现到用户体验的全链路剖析关键词：前端可视化、数据可视化、设计案例、D3.js、ECharts、可视化框架、用户体验摘要：本文通过深度解析多个典型前端可视化案例，系统阐述数据可视化的核心技术原理、设计方法论及工程实践经验。从基础概念到复杂场景应用，结合D3.js、ECharts、AntV等主流框架的实战案例，详细讲解数据映射、视觉编码、交互设计的实现细节，分析不同业务
模型上下文协议（MCP）和Function Calling的区别是什么？——深度解析两种AI交互技术的设计理念与实战应用码力金矿 python 人工智能 MCP 人工智能大数据 hadoop eclipse 前端 python java
一、引言：AI工具连接范式的“USB革命”与“专用遥控器”之争在AI应用开发中，模型与外部工具的交互能力至关重要。Anthropic推出的模型上下文协议（MCP）与OpenAI的FunctionCalling（函数调用）作为两种主流技术路径，常被开发者视为“万能接口”与“专用工具”的对比。本文将通过技术原理、应用场景、生态特性等多维度解析两者的本质差异，帮助您在实战中做出更高效的选择。二、MCP与
RAG实战指南 Day 2：RAG开发环境搭建与工具选择在未来等你 RAG实战指南 RAG 向量检索 LLM AI开发知识库
【RAG实战指南Day2】RAG开发环境搭建与工具选择开篇欢迎来到"RAG实战指南"系列的第2天！今天我们将聚焦RAG系统的开发环境搭建和工具选择，这是构建高效RAG应用的基础。一个合理的开发环境和工具链不仅能提升开发效率，还能确保系统的稳定性和扩展性。通过本文，你将掌握如何从零开始搭建RAG开发环境，了解主流工具的选择策略，并通过实际案例学习如何将这些工具组合起来构建完整的RAG工作流。理论基础
利用Infoway API接入实时股票行情API的方法 kk_stoper 大数据 python java javascript
随着金融科技的发展，越来越多的投资者、交易平台和量化交易团队开始使用股票行情API来获取市场数据。然而，很多人虽然听说过行情API，却并不清楚不同类型的接口之间有何区别，适合用于哪些场景。本文将系统地介绍几种常见的股票行情接口，帮助您建立对行情API的全面理解。一、延迟行情接口（主流平台的默认选择）延迟行情（DelayedMarketData）是最普遍、成本最低的行情接口形式。其核心特征是存在时间
LLM---大语言模型技术研究报告
摘要大语言模型（LLMs）已从技术突破走向产业规模化落地。2025年，全球LLMs进入“模型即服务”（MaaS）时代，参数量级突破万亿级，多模态能力、智能体协作、专业化细分成为主流趋势。中国大模型领域在DeepSeek、通义千问、讯飞星火等头部模型推动下，实现技术突破与场景创新。本报告基于截至2025年7月的最新数据，系统梳理LLMs的技术演进、应用场景、挑战与未来方向。一、大语言模型的演进与突破
喜讯！Apache SeaTunnel 荣获上海开源创新菁英荟优秀开源项目奖 SeaTunnel SeaTunnel 开源数据同步大数据 etl
近日，在2025上海开源创新菁英荟上，ApacheSeaTunnel凭借信创生态适配与智能化技术突破，荣获「优秀开源项目奖」。这个由中国团队孵化的开源项目，已成为全球数据集成领域的标杆。信创生态：支持20+国产数据库的无缝对接SeaTunnel深度适配华为OpenGauss、阿里OceanBase等20+主流国产数据库，支持CDC（变更数据捕获）与高性能加载。在证券行业信创转型中，SeaTunne
【编辑器】.editorconfig统一代码风格七灵微基本理论编辑器
概念定义：用于统一和规范不同开发者编辑器（IDE）中的代码格式设置的配置文件。作用保证团队成员用不同编辑器（VSCode、WebStorm、SublimeText、Vim等）编辑代码时，保持统一的代码风格和格式避免因编辑器默认设置不同，导致代码风格不一致、无意义的格式差异兼容性：不是所有编辑器都“天生”支持.editorconfig，但现在主流编辑器大多数都能识别，或者通过插件支持。原理.edit
全流程文献计量学可视化分析技术及SCI论文高效写作方法青春不败 177-3266-0520 生态环境人工智能 python 文献可视化 SCI论文生态学环境科学遥感
文献计量学是指用数学和统计学的方法，定量地分析一切知识载体的交叉科学。它是集数学、统计学、文献学为一体，注重量化的综合性知识体系。特别是，信息可视化技术手段和方法的运用，可直观的展示主题的研究发展历程、研究现状、研究热点和发展态势。一：文献计量学方法与应用1.文献计量学方法基本2.与其他综述方法区别联系3.各学科领域应用趋势近况4.主流分析软件优缺点对比二：主题确定、检索与数据采集1.热点主题高效
【Linux】冯诺依曼结构体系 nanguochenchuan Linux操作系统 linux 运维服务器
冯诺依曼结构基础冯诺依曼结构是现代计算机的基础设计蓝图，包含五大核心部件：运算器：执行算术逻辑运算（现代CPU的ALU）控制器：协调各部件工作（现代CPU的控制单元）存储器：统一存储程序和数据（内存）输入设备：如键盘、鼠标输出设备：如显示器、打印机核心特点：采用二进制系统存储程序原理：程序和数据共同存储在内存中顺序执行指令（存在冯诺依曼瓶颈）现代计算机的实现主流架构（x86/ARM）仍基于冯诺依曼
深入理解React的虚拟DOM与性能优化天天进步2015 前端开发 react.js 性能优化 javascript
React作为现代前端开发的主流框架，其高效的渲染能力和良好的开发体验离不开虚拟DOM（VirtualDOM）的设计理念。本文将带你深入理解React的虚拟DOM原理，并结合实际案例，探讨如何进行性能优化。一、什么是虚拟DOM？虚拟DOM（VirtualDOM，简称VDOM）是React引入的一种轻量级JavaScript对象，用于描述真实DOM的结构。它本质上是DOM的一个抽象表示，React通
AJAX 安装使用教程小奇JAVA面试安装使用教程 ajax 前端 javascript
一、AJAX简介AJAX（AsynchronousJavaScriptandXML）是一种在无需重新加载整个网页的情况下，能够与服务器交换数据并更新部分网页内容的技术。它不是一种新语言，而是使用现有的标准组合：JavaScript+XMLHttpRequest（或Fetch）+HTML+CSS。二、AJAX是否需要安装？不需要单独安装！AJAX是浏览器原生支持的技术，主流浏览器均内置XMLHttp
环境安装教程万能小贤哥机器学习人工智能网络 python
Python小白入门之环境安装全攻略在数字化浪潮中，Python以其简洁高效、应用广泛的特性，成为众多编程爱好者踏入代码世界的首选语言。对于新手小白而言，成功搭建Python开发环境，是开启编程之旅的关键第一步。下面就为大家详细介绍Python环境的安装与配置过程。一、前期准备1.系统要求：主流操作系统均可支持Python安装，Windows建议使用Windows10及以上版本；macOS需为ma
RAG技术栈详解：构建智能问答系统的核心组件认知超载 AI 人工智能
本文深度剖析RAG（Retrieval-AugmentedGeneration）技术栈的核心构成，助你快速搭建企业级知识增强系统一、RAG技术架构全景图二、核心组件技术选型1.检索模块（Retriever）向量数据库主流选择：Pinecone、Milvus、Qdrant、Weaviate新兴势力：ChromaDB（开源轻量级）、腾讯云向量数据库嵌入模型（Embedding）OpenAItext-e
为什么要使用消息队列？编程大全后端 rabbitmq rocketmq kafka 消息队列
总结一下，主要三点原因：解耦、异步、削峰。1、解耦。比如，用户下单后，订单系统需要通知库存系统，假如库存系统无法访问，则订单减库存将失败，从而导致订单操作失败。订单系统与库存系统耦合，这个时候如果使用消息队列，可以返回给用户成功，先把消息持久化，等库存系统恢复后，就可以正常消费减去库存了。2、异步。将消息写入消息队列，非必要的业务逻辑以异步的方式运行，不影响主流程业务。3、削峰。消费端慢慢的按照数
【数据标注师】事件标注2 试着数据标注师数据标注师事件标注
目录一、**深入理解事件标注的核心架构**1.**事件五要素（标注核心对象）**2.**三大项目特性**二、**四阶段系统学习法**▶**阶段1：掌握标注指南（20%理论+80%案例）**▶**阶段2：触发词精准识别训练**▶**阶段3：要素抽取实战技巧**▶**阶段4：复杂场景突破三、**高效标注工具使用指南**1.**快捷键流操作（以主流工具为例）**2.**颜色编码法**四、**错误防御体系
VPS云服务器自动化运维：Ansible+Puppet实现批量配置管理与监控 cpsvps_net 运维服务器自动化
在云计算时代，VPS云服务器的自动化运维已成为企业提升效率的关键技术。本文将深入解析如何通过Ansible和Puppet两大主流工具实现批量配置管理，构建完整的监控体系，帮助运维团队从重复劳动中解放，确保服务器集群的高可用性。我们将从基础架构设计到实战案例，系统讲解自动化运维的最佳实践路径。VPS云服务器自动化运维：Ansible+Puppet实现批量配置管理与监控一、VPS云服务器自动化运维的核
X86和ARM架构的优缺点？心对元&鑫鑫 arm开发架构
x86和ARM是当前主流的两种处理器架构，分别主导不同领域（如PC/服务器和移动/嵌入式设备）。它们的优缺点对比如下：1.x86架构（Intel/AMD）优点：高性能：复杂指令集（CISC）设计，单条指令功能强大，适合高吞吐量计算。强大的单线程性能，尤其在浮点运算和多媒体处理（如视频编辑、游戏）。软件生态成熟：主导PC和服务器市场，兼容Windows、Linux等主流操作系统。支持大量专业软件（如
从x86到ARM64：CPU架构的进化与未来小俊学长架构
从x86到ARM64：CPU架构的进化与未来在计算机发展的历史长河中，CPU架构的演变是推动计算技术不断前进的重要动力。从早期的x86架构，到现代的x64和ARM64架构，每一次变革都带来了计算性能、能效比以及应用领域的显著提升。本文将深入探讨x86、x64和ARM64这三大主流CPU架构的历史背景、技术特点、市场应用以及未来发展趋势，以期为读者提供一个全面的视角，理解CPU架构的进化路径及其对未
AI浪潮下编程范式革命：从智能工具到生态重构的全维度变革欧阳天羲人工智能重构 python
一、智能代码生成：从辅助工具到全流程开发伙伴1.1对话式编程成为主流2025年，对话式编程已从概念变为现实。GitHubCopilotX最新版本实现了自然语言到完整功能模块的直接转换，开发者只需通过语音或文本描述需求，即可获得生产级代码。以下是通过自然语言生成电商结算模块的示例：#用户输入："创建一个支持优惠券核销的电商结算系统，包含购物车管理、价格计算和支付接口"importdatetimefr
【Python GUI框架全解析】六大主流工具对比与实战指南满怀1015 python 开发语言 GUI开发 PyQt wxPython Kivy
目录前言️技术背景与价值当前技术痛点️解决方案概述目标读者说明一、技术原理剖析核心框架对比图框架定位分析关键技术指标️二、实战演示⚙️环境配置核心代码实现案例1：PyQt5现代化窗口案例2：wxPython文件管理器案例3：Kivy移动风格界面案例4：DearPyGui实时仪表盘✅运行结果验证⚡三、性能对比测试方法论量化数据对比结果分析四、最佳实践✅框架选型建议❌常见误区️调试技巧五、应用场景扩展
喜讯！Apache SeaTunnel 荣获上海开源创新菁英荟优秀开源项目奖数据库
近日，在2025上海开源创新菁英荟上，ApacheSeaTunnel凭借信创生态适配与智能化技术突破，荣获「优秀开源项目奖」。这个由中国团队孵化的开源项目，已成为全球数据集成领域的标杆。信创生态：支持20+国产数据库的无缝对接SeaTunnel深度适配华为OpenGauss、阿里OceanBase等20+主流国产数据库，支持CDC（变更数据捕获）与高性能加载。在证券行业信创转型中，SeaTunne
电子词典开源项目源代码完全解析
本文还有配套的精品资源，点击获取简介：电子词典作为数字化学习工具，已由传统硬件发展为可定制的开源软件应用。本源代码提供深入理解其工作机制的机会，包括用户界面设计、词典数据库、查询引擎、翻译算法等。源代码通常由主流编程语言编写，涉及到数据结构与算法、UI设计、数据库管理、自然语言处理、本地化与多语言支持、版本控制、软件工程、API接口以及开源社区的协作和交流。1.电子词典工作原理和定制功能电子词典工
SmartDV推出先进的H.264和H.265视频编码器和解码器IP 电子科技圈 h.264 h.265 音视频
向全球市场提供灵活、高度可配置、可定制的半导体设计知识产权（IP）和验证IP（VIP）的开发商SmartDV™Technologies近日宣布：公司现已提供即刻可用的H.264和H.265视频编码器和解码器IP解决方案。针对每一种技术，SmartDV都提供了所有三种配置的IP产品，包括H.264的基本配置（Baseline）、主流配置（Main）和高性能配置（High）版本，以及H.265的主流（
workflow的可编排协作模式思绪漂移人工智能 agent workflow 模式
Workflow的可编排协作模式在AI工作流设计中，协作模式的选择直接影响系统效率和结果质量。本文将系统分析6种主流协作模式，探讨选择方案与适合场景。一、传统单一模式特点：使用标准框架进行线性编排所有任务按固定顺序执行适合简单、确定性强的流程适用场景：规则明确、步骤固定的业务流程自动化二、路由模式核心机制：LLM先识别用户意图根据意图路由到对应处理模块优势：意图识别准确率高资源分配精准典型应用：客
KANN 是一个独立的轻量级 C 语言库，用于构建和训练中小型人工神经网络，例如多层感知器、卷积神经网络和递归神经网络（包括 LSTM 和 GRU）。它实现了基于图的逆模自动微分，并允许构建具有递归等
一、软件介绍文末提供程序和源码下载KANN是一个独立的轻量级C语言库，用于构建和训练中小型人工神经网络，例如多层感知器、卷积神经网络和递归神经网络（包括LSTM和GRU）。它实现了基于图的逆模自动微分，并允许构建具有递归、共享权重和多个输入/输出/成本的拓扑复杂神经网络。与TensorFlow等主流深度学习框架相比，KANN的可扩展性较低，但它的灵活性接近，代码库要小得多，并且仅依赖于标准C库。与
AI agent开发出办公AI小助手的学习方案和路线云博士的AI课堂大模型技术开发与实践大模型 AI Agent 人工智能自动化
一个从基础概念、关键技术栈到实际落地的AIAgent开发全流程学习路线和开发方法建议。此方案参考当前主流大模型（LLM）及相关工具链生态，总体目标是从零开始了解所需知识体系与技能，并能在实践中构建自动化的客服AI或者办公辅助类AI助手。学习与开发的总体思路明确目标场景与需求：在开始前，确定需要开发的AIAgent的功能点和使用场景。例如，客服AI需要具备回答客户常见问题、查询订单状态、转接人工客服
AI工作流平台对比分析 come11234 Ai 人工智能
以下是和「扣子工作流」（KoFlow）类似的AI工作流平台对比分析，涵盖主流工具的核心特点、使用方式、优缺点及区别：一、主流工作流平台分类平台类型核心定位代表用户扣子(KoFlow)低代码AI流程中文场景优化，深度集成大模型中文开发者/企业LangChain代码框架开发者灵活构建AI链Python开发者/AI工程师LlamaIndex数据增强框架企业级RAG（检索增强生成）数据工程师/知识库应用M
Java序列化进阶篇 g21121 java序列化
1.transient 类一旦实现了Serializable 接口即被声明为可序列化，然而某些情况下并不是所有的属性都需要序列化，想要人为的去阻止这些属性被序列化，就需要用到transient 关键字。
escape()、encodeURI()、encodeURIComponent()区别详解 aigo JavaScript Web
原文：http://blog.sina.com.cn/s/blog_4586764e0101khi0.html JavaScript中有三个可以对字符串编码的函数，分别是： escape,encodeURI,encodeURIComponent，相应3个解码函数：,decodeURI,decodeURIComponent 。下面简单介绍一下它们的区别 1 escape()函
ArcgisEngine实现对地图的放大、缩小和平移 Cb123456 添加矢量数据对地图的放大、缩小和平移 Engine
ArcgisEngine实现对地图的放大、缩小和平移: 个人觉得是平移，不过网上的都是漫游，通俗的说就是把一个地图对象从一边拉到另一边而已。就看人说话吧. 具体实现: 一、引入命名空间 using ESRI.ArcGIS.Geometry; using ESRI.ArcGIS.Controls; 二、代码实现.
Java集合框架概述天子之骄 Java集合框架概述
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
旗正4.0页面跳转传值问题何必如此 java jsp
跳转和成功提示 a) 成功字段非空forward 成功字段非空forward，不会弹出成功字段，为jsp转发，页面能超链接传值,传输变量时需要拼接。接拼接方式list.jsp?test="+strweightUnit+"或list.jsp?test="+weightUnit+&qu
全网唯一:移动互联网服务器端开发课程 cocos2d-x小菜 web开发移动开发移动端开发移动互联程序员
移动互联网时代来了！ App市场爆发式增长为Web开发程序员带来新一轮机遇，近两年新增创业者，几乎全部选择了移动互联网项目！传统互联网企业中超过98%的门户网站已经或者正在从单一的网站入口转向PC、手机、Pad、智能电视等多端全平台兼容体系。据统计，AppStore中超过85%的App项目都选择了PHP作为后端程
Log4J通用配置|注意问题笔记 7454103 DAO apache tomcat log4j Web
关于日志的等级那些去百度就知道了！这几天要搭个新框架配置了日志记下来！做个备忘！ #这里定义能显示到的最低级别,若定义到INFO级别,则看不到DEBUG级别的信息了~! log4j.rootLogger=INFO,allLog # DAO层 log记录到dao.log 控制台和总日志文件 log4j.logger.DAO=INFO,dao,C
SQLServer TCP/IP 连接失败问题 ---SQL Server Configuration Manager darkranger sql c windows SQL Server XP
当你安装完之后,连接数据库的时候可能会发现你的TCP/IP 没有启动.. 发现需要启动客户端协议 : TCP/IP 需要打开 SQL Server Configuration Manager... 却发现无法打开 SQL Server Configuration Manager..?? 解决方法: C:\WINDOWS\system32目录搜索framedyn.
[置顶] 做有中国特色的程序员 aijuans 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有些技术书读得可
document.domain 跨域问题 avords document
document.domain用来得到当前网页的域名。比如在地址栏里输入：javascript:alert(document.domain); //www.315ta.com我们也可以给document.domain属性赋值，不过是有限制的，你只能赋成当前的域名或者基础域名。比如：javascript:alert(document.domain = "315ta.com");
关于管理软件的一些思考 houxinyou 管理
工作好多看年了,一直在做管理软件,不知道是我最开始做的时候产生了一些惯性的思维,还是现在接触的管理软件水平有所下降.换过好多年公司,越来越感觉现在的管理软件做的越来越乱. 在我看来,管理软件不论是以前的结构化编程,还是现在的面向对象编程,不管是CS模式,还是BS模式.模块的划分是很重要的.当然,模块的划分有很多种方式.我只是以我自己的划分方式来说一下. 做为管理软件,就像现在讲究MVC这
NoSQL数据库之Redis数据库管理(String类型和hash类型) bijian1013 redis 数据库 NoSQL
一.Redis的数据类型 1.String类型及操作 String是最简单的类型，一个key对应一个value，string类型是二进制安全的。Redis的string可以包含任何数据，比如jpg图片或者序列化的对象。 Set方法：设置key对应的值为string类型的value
Tomcat 一些技巧征客丶 java tomcat dos
以下操作都是在windows 环境下一、Tomcat 启动时配置 JAVA_HOME 在 tomcat 安装目录，bin 文件夹下的 catalina.bat 或 setclasspath.bat 中添加 set JAVA_HOME=JAVA 安装目录 set JRE_HOME=JAVA 安装目录/jre 即可；二、查看Tomcat 版本在 tomcat 安装目
【Spark七十二】Spark的日志配置 bit1129 spark
在测试Spark Streaming时，大量的日志显示到控制台，影响了Spark Streaming程序代码的输出结果的查看(代码中通过println将输出打印到控制台上)，可以通过修改Spark的日志配置的方式，不让Spark Streaming把它的日志显示在console 在Spark的conf目录下，把log4j.properties.template修改为log4j.p
Haskell版冒泡排序 bookjovi 冒泡排序 haskell
面试的时候问的比较多的算法题要么是binary search，要么是冒泡排序，真的不想用写C写冒泡排序了，贴上个Haskell版的，思维简单，代码简单，下次谁要是再要我用C写冒泡排序，直接上个haskell版的，让他自己去理解吧。 sort [] = [] sort [x] = [x] sort (x:x1:xs) | x>x1 = x1:so
java 路径配置文件读取 bro_feng java
这几天做一个项目，关于路径做如下笔记，有需要供参考。取工程内的文件，一般都要用相对路径，这个自然不用多说。在src统计目录建配置文件目录res,在res中放入配置文件。读取文件使用方式： 1. MyTest.class.getResourceAsStream("/res/xx.properties") 2. properties.load(MyTest.
读《研磨设计模式》-代码笔记-简单工厂模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 个人理解：简单工厂模式就是IOC; * 客户端要用到某一对象，本来是由客户创建的，现在改成由工厂创建，客户直接取就好了 */ interface IProduct {
SVN与JIRA的关联 chenyu19891124 SVN
SVN与JIRA的关联一直都没能装成功，今天凝聚心思花了一天时间整合好了。下面是自己整理的步骤：一、搭建好SVN环境，尤其是要把SVN的服务注册成系统服务二、装好JIRA，自己用是jira-4.3.4破解版三、下载SVN与JIRA的插件并解压，然后拷贝插件包下lib包里的三个jar，放到Atlassian\JIRA 4.3.4\atlassian-jira\WEB-INF\lib下，再
JWFDv0.96 最新设计思路 comsci 数据结构算法工作企业应用公告
随着工作流技术的发展，工作流产品的应用范围也不断的在扩展，开始进入了像金融行业(我已经看到国有四大商业银行的工作流产品招标公告了)，实时生产控制和其它比较重要的工程领域，而
vi 保存复制内容格式粘贴 daizj vi 粘贴复制保存原格式不变形
vi是linux中非常好用的文本编辑工具，功能强大无比，但对于复制带有缩进格式的内容时，粘贴的时候内容错位很严重，不会按照复制时的格式排版，vi能不能在粘贴时，按复制进的格式进行粘贴呢？答案是肯定的，vi有一个很强大的命令可以实现此功能。在命令模式输入:set paste，则进入paste模式，这样再进行粘贴时
shell脚本运行时报错误：/bin/bash^M: bad interpreter 的解决办法 dongwei_6688 shell脚本
出现原因：windows上写的脚本，直接拷贝到linux系统上运行由于格式不兼容导致解决办法： 1. 比如文件名为myshell.sh，vim myshell.sh 2. 执行vim中的命令 : set ff?查看文件格式，如果显示fileformat=dos，证明文件格式有问题 3. 执行vim中的命令 :set fileformat=unix 将文件格式改过来就可以了，然后:w
高一上学期难记忆单词 dcj3sjt126com word english
honest 诚实的；正直的 argue 争论 classical 古典的 hammer 锤子 share 分享；共有 sorrow 悲哀；悲痛 adventure 冒险 error 错误；差错 closet 壁橱；储藏室 pronounce 发音；宣告 repeat 重做；重复 majority 大多数；大半 native 本国的，本地的，本国
hibernate查询返回DTO对象，DTO封装了多个pojo对象的属性 frankco POJO hibernate查询 DTO
DTO-数据传输对象；pojo-最纯粹的java对象与数据库中的表一一对应。简单讲：DTO起到业务数据的传递作用，pojo则与持久层数据库打交道。有时候我们需要查询返回DTO对象，因为DTO
Partition List hcx2013 partition
Given a linked list and a value x, partition it such that all nodes less than x come before nodes greater than or equal to x. You should preserve the original relative order of th
Spring MVC测试框架详解——客户端测试 jinnianshilongnian
上一篇《Spring MVC测试框架详解——服务端测试》已经介绍了服务端测试，接下来再看看如果测试Rest客户端，对于客户端测试以前经常使用的方法是启动一个内嵌的jetty/tomcat容器，然后发送真实的请求到相应的控制器；这种方式的缺点就是速度慢；自Spring 3.2开始提供了对RestTemplate的模拟服务器测试方式，也就是说使用RestTemplate测试时无须启动服务器，而是模拟一
关于推荐个人观点 liyonghui160com 推荐系统关于推荐个人观点
回想起来，我也做推荐了3年多了，最近公司做了调整招聘了很多算法工程师，以为需要多么高大上的算法才能搭建起来的，从实践中走过来，我只想说【不是这样的】第一次接触推荐系统是在四年前入职的时候，那时候，机器学习和大数据都是没有的概念，什么大数据处理开源软件根本不存在，我们用多台计算机web程序记录用户行为，用.net的w
不间断旋转的动画 pangyulei 动画
CABasicAnimation* rotationAnimation; rotationAnimation = [CABasicAnimation animationWithKeyPath:@"transform.rotation.z"]; rotationAnimation.toValue = [NSNumber numberWithFloat: M
自定义annotation sha1064616837 java enum annotation reflect
对象有的属性在页面上可编辑，有的属性在页面只可读，以前都是我们在页面上写死的，时间一久有时候会混乱，此处通过自定义annotation在类属性中定义。越来越发现Java的Annotation真心很强大，可以帮我们省去很多代码，让代码看上去简洁。下面这个例子主要用到了 1.自定义annotation：@interface，以及几个配合着自定义注解使用的几个注解 2.简单的反射 3.枚举
Spring 源码 up2pu spring
1.Spring源代码 https://github.com/SpringSource/spring-framework/branches/3.2.x 注：兼容svn检出 2.运行脚本 import-into-eclipse.bat 注：需要设置JAVA_HOME为jdk 1.7 build.gradle compileJava { sourceCompatibilit
利用word分词来计算文本相似度 yangshangchuan word word分词文本相似度余弦相似度简单共有词
word分词提供了多种文本相似度计算方式：方式一：余弦相似度，通过计算两个向量的夹角余弦值来评估他们的相似度实现类：org.apdplat.word.analysis.CosineTextSimilarity 用法如下： String text1 = "我爱购物"; String text2 = "我爱读书"; String text3 =