炊烟袅袅岁月情

论文阅读笔记：YOLOV1最全面解读！

YOLOV1最全面解读！

文章目录

一、前言
二、YOLO V1的优点与缺点
三、YOLO V1的核心思想

3.1、S是多少？
3.2、为什么要分成S x S个网格？
3.3、选择哪些网格（grid cell）去预测框？
3.4、选好了网格，下一步计算x，y，w，h（用来训练），它们是怎么计算的？
3.5、实际的训练过程中，需要分S x S个网格么？
3.6、最后输出的30维向量，代表什么？
3.7、框的分数是怎么算的？
3.8、为什么每个输出有两个框，实际却只负责一个框？

四、YOLO V1的损失函数
五、具体实现过程：

5.1、训练的时候：
5.2、测试的时候：

论文链接：You only look once unified real-time object detection
代码下载：https://github.com/hizhangp/yolo_tensorflow
源码分析可参考：https://zhuanlan.zhihu.com/p/25053311

一、前言

当前主流的 $C N N$ 目标检测框架可分为两类：

包含 $R e g i o n$ $p r o p o s a l s$ 提取阶段的两阶段目标检测框架。如 $R - C N N$ 系列像 $R - C N N / F a s t - R C N N / F a s t e r - F C N N / R - F C N$ 等；
端到端的单阶段目标检测框架。如 $Y O L O$ 系列像 $y o l o v 1 / y o l o v 2 / y o l o v 3 及 S S D$ ；

$Y O L O$ (You Only Look Once) 是第一个相对成功的 $O n e - S t a g e$ 物体检测方法，在2016年 $C V P R$ 会议上被提出，以简单，高效的优势，一跃成为与 $R C N N$ 系列并驾齐驱的物体检测框架，直至今日， $Y O L O V 3$ 依然作为物体检测的首选方案之一。

二、YOLO V1的优点与缺点

优点：

速度快，体现在很高的 $F P S (f r a m e s p e r s e c o n d)$ ，这也是 $Y O L O V 1$ 主打的亮点；
误检少 $Y O L O$ 是基于图像的全局信息进行预测的。这一点和基于 $s l i d i n g$ $w i n d o w$ 以及 $r e g i o n$ $p r o p o s a l$ 等检测算法不一样。与 $F a s t R - C N N$ 相比， $Y O L O$ 在误检测（将背景检测为物体）方面的错误率能降低一半多；
泛化能力强，体现在可以检测出美术画中的物体；

缺点：

位置精确性差，对于小目标物体以及物体比较密集的也检测不好，比如一群小鸟；
$Y O L O$ 虽然可以降低将背景检测为物体的概率，但同时导致召回率较低；

三、YOLO V1的核心思想

这张图，诠释了YOLO V1的运行过程：

输入一张图，然后Resize到 $448 \times 448$ ；
然后输入到 $C N N$ 中；
输出结果，经过后处理，包括 $N M S$ ，得到结果（框和类别）；

其中 $C N N$ 整体的结构参考 $G o o g L e N e t$ 模型，包含 $24 个卷积层和 2 个全连接层$ ，激活函数为“ $L e a k y R e L U$ "，但是最后一层却采用线性激活函数,最后输出的向量维度是 $1470 = 7 \times 7 \times 30$ ，说明最后输出了 $7 \times 7$ “组”结果，每组结果由 $30$ 个数组成。除了上面这个结构，文章还提出了一个轻量级版本 $F a s t$ $Y o l o$ ，其仅使用 $9 个卷积层$ ，并且卷积层中使用更少的卷积核。网络结构如下：

$Y O L O V 1$ 算法首先把重置后的输入图像划分成 $S \times S$ 的格子，然后对每个格子都预测 $B 个 b o u n d i n g$ $b o x e s$ ，每个 $b o u n d i n g$ $b o x$ 都包含5个预测值： $x, y, w, h 和 c o n f i d e n c e$ ，再经过概率和 $N M S$ 过滤，得到最终结果。其中： $x, y$ 就是bounding box的中心坐标，与 $g r i d$ $c e l l$ 对齐（即相对于当前 $g r i d$ $c e l l$ 的偏移值），使得范围变成 $0 到 1$ ；w和h进行归一化（分别除以图像的w和h，这样最后的w和h就在 $0 到 1$ 范围。

3.1、S是多少？

直接回答 $S = 7$ ，由于网格（grid cell）的数目需要跟最后特征图尺寸一一对应，最后特征图的尺寸为 $7 \times 7$ ，因此网格的数目也就是 $S \times S = 7 \times 7$ 。

3.2、为什么要分成S x S个网格？

用以预测结果（框和类别）的特征图大小为 $7 \times 7$ ，有49个向量（这里有点像 $R P N$ ），每个向量都要去预测**“框”和“类别”**，训练时，我们需要为每个向量分配类别以及是否需要负责预测框，那么如何分配呢？我们需要把 $7 \times 7$ 个点映射回原图，正好形成 $7 \times 7$ 个网格，然后根据每个网格跟 $G r o u n d$ $T r u t h$ 之间的关系（作者设定了规则去建立联系），来做后续分配。也就是为什么分成 $S \times S （ 7 \times 7 ）$ 个框了。

3.3、选择哪些网格（grid cell）去预测框？

每个网格在最后 $7 \times 7$ 的特征图上对应一个向量，这个30维向量用来预测结果，那么我们应该选择哪个网格来负责预测框呢？通俗一些，就是哪些网格是正例，哪些是负例（过程有点儿类似RPN，但区别蛮大），先看文中的一段描述：

这句话给了其标准答案，物体的“中心”落在哪个网格中，哪个网格就负责训练这个框（类别和坐标）。这句英文大家都能看懂，但是实际呢？看看下面这张图：

这张图，中心点被标出来了，并且落在了“橘黄网格”中，那么它就是正例，那么“绿色网格”和“白色网格”的标签（Label）是什么呢？这里是与 $R P N$ 最大不同之处了， $Y O L O V 1$ 中，对于一个 $G r o u n d$ $T r u t h$ ，有且只有一个网格是正例，其余的就算与Ground Truth IOU很大，也是负例，所以“绿色网格”和“白色网格”Label为负，所以也就不用负责训练框坐标了（但是会负责训练其他信息）

3.4、选好了网格，下一步计算x，y，w，h（用来训练），它们是怎么计算的？

根据原论文我们可以确定几点：

第一： $x ， y$ 指的是中心点，是物体框的中心点，不是网格的中心点（当然物体的中心点必然会落在相应的网格中）；
第二： $w ， h$ 指的是物体框的宽高；
第三： $x, y, w, h$ 都在0-1之间。我们在训练的时候，损失函数（ $L o s s F u n c t i o n$ ）计算的是预测的 $（ x ‘ ， y ’ ， w ‘ ， h ’ ）$ 与实际值 $（ x ， y ， w ， h ）$ 之间的 $L 2 - L o s s$ ，预测值是通过网络，最后在30维向量中 $（ 7 \times 7 \times 30 ）$ ，实际值是怎么算的呢？

比如图片的宽高为 $w i d t h ， h e i g h t$ ，物体的中心点为 $x ， y ，$ 宽高为 $w ， h$ ，那么根据论文的描述：
$\begin{aligned} w &=\frac{w}{w i d t h} \\ h &=\frac{h}{h e i g h t} \end{aligned}$
x，y在Loss中的值是相对网格的偏移，是相对于网格的中心点还是左上角点的偏移呢？其实这个顾虑是多余的，因为在最后7 x 7大小的特征图上，网格仅仅是一个”点“，相对于它的偏移，我们需要把x，y也映射到7 x 7的特征图上，然后与对应的网格的位置相减，然而我们不难发现，这个过程可以简化为：
$\begin{aligned} x &=\frac{x * S}{w i d t h}-i n t\left(\frac{x * S}{w i d t h}\right) \\ y &=\frac{y * S}{h e i g h t}-i n t\left(\frac{y * S}{h e i g h t}\right) \end{aligned}$
根据”选取网格 “的方法，我们知道中心点x，y在7 x 7特征图上的位置的整数部分就是对应网格的位置，因为它们在原图上距离也不超过 $448 / S$ （网格的大小），所以在 $7 \times 7$ 的图片上，它们的距离不超过1。

3.5、实际的训练过程中，需要分S x S个网格么？

根据上一个问题的答案，我们不难发现，实际的训练和预测的过程中，我们是不需要对原图划分网格的，论文中划分网格的目的主要是为了方便表达。

3.6、最后输出的30维向量，代表什么？

论文中说了，我们一共预测98个框（明明只有49组向量），所以30维向量中一定包含了2个框的信息，也就是两组（x, y, w, h）。由于是在Pascal VOC上训练的，所以还有20个类别信息，这样组合发现只有28个值，难道大家就没有疑问， $Y O L O V 1$ 是如何区分背景的么？ $Y O L O V 1$ 不仅预测了框的x, y, w, h，还预测了框的分数，用来判断是不是框，所以30维向量成分：2组 $(x, y, w, h, s c o r e) + 20$ 个类别概率。原文如下：

3.7、框的分数是怎么算的？

预测的时候，分数是直接输出的，那么训练的时候呢？是不是选中的网格分数为1，没选中的为0，答案是NO，这也是YOLO V1的巧妙之处，YOLO V1计算了一个所谓的IOU(intersection over union:交并比)分数，IOU指的是预测的框与实际框的IOU，这样在训练的时候，我们需要实时的计算这个IOU，作为输入到Loss Function中的“目标”，与预测的IOU分数做L2-Loss，举个例子，第一次迭代，网络会输出一个预测框P1，对应的真实框为G，程序会计算P1和G的IOU，然后继续做Loss。

3.8、为什么每个输出有两个框，实际却只负责一个框？

其中 $Y O L O V 1$ 有一个细节，我画图描述一下：

其中，绿色的框P1与白色的框P2是网络预测的框，而红色的框G是真实值，YOLO V1会计算P1与G的IOU1，以及P2与G的IOU2，然后比较哪个IOU大，比如IOU2更大，那么P2的信息会输入到LossFunction中，P1被忽略掉（？？）并不是100%被忽略，如果IOU1小于一个阈值，会作为负例，压向0值。

四、YOLO V1的损失函数

这里详细讲一下 $l o s s$ $f u n c t i o n$ 。在 $l o s s$ $f u n c t i o n$ 中，前面两行表示 $l o c a l i z a t i o n$ $e r r o r$ (即坐标误差)，第一行是box中心坐标(x,y)的预测，第二行为宽和高的预测。

注意：这里注意用宽和高的开根号代替原来的宽和高，这样做主要是因为相同的宽和高误差对于小的目标精度影响比大的目标要大。举个例子，原来w=10，h=20，预测出来w=8，h=22，跟原来w=3，h=5，预测出来w1，h=7相比，其实前者的误差要比后者小，但是如果不加开根号，那么损失都是一样：4+4=8，但是加上根号后，变成0.15和0.7。

第三、四行表示bounding box的confidence损失，就像前面所说的，分成grid cell包含与不包含object两种情况。

注意：这里因为每个grid cell包含两个bounding box，所以只有当ground truth 和该网格中的某个bounding box的IOU值最大的时候，才计算这项。

第五行表示预测类别的误差，注意前面的系数只有在grid cell包含object的时候才为1。

损失函数公式如上，里面有几个值得我们借鉴的地方：

对于平方差，同样很小的数值，对于大框影响相对于小框的影响小一些，（同样的值，加在大框上，可能几乎没有变化，而小框的变化会很大），此时作者是如何处理的呢？文中是把w，h都开根号了，预测的是开根号的值，这样影响会相对一致一些。
由于每个框只有一个网格负责，那么49个网格，预测98个框，可能只有1-2个是正例，其余的都是负例，需要取向零，这样会导致网络更好的学习负例：
文中的做法是赋予不同的权重，预测坐标的权重为5，“没有物体“的权重为0.5，权重相差10倍。以上就是 $Y O L O V 1$ 的主要内容了,建议大家读读论文，感受思想，不用去实现，毕竟 $Y O L O V 2 ， V 3$ 更好。

五、具体实现过程：

5.1、训练的时候：

输入N个图像，每个图像包含M个object，每个object包含4个坐标 $（ x ， y ， w ， h ）$ 和1个label。然后通过网络得到 $7 \times 7 \times 30$ 大小的三维矩阵。每个1×30的向量前5个元素表示第一个bounding box的4个坐标和1个confidence，第6到10元素表示第二个bounding box的4个坐标和1个confidence。最后20个表示这个grid cell所属类别。注意这30个都是预测的结果。然后就可以**计算损失函数的第一、二、五行。**至于第二三行，confidence可以根据ground truth(真实边框)和预测的bounding box计算出的IOU和是否有object的0,1值相乘得到。真实的confidence是0或1值，即有object则为1，没有object则为0。这样就能计算出loss function的值了。

5.2、测试的时候：

输入一张图像，跑到网络的末端得到 $7 \times 7 \times 30$ 的三维矩阵，这里虽然没有计算 $I O U$ ，但是由训练好的权重已经直接计算出了 $b o u n d i n g$ $b o x$ 的 $c o n f i d e n c e$ 。然后再跟预测的类别概率相乘就得到每个 $b o u n d i n g$ $b o x$ 属于哪一类的概率。

下一节：论文阅读笔记：YOLOV2全面解读！

参考文献：

懒人赏析YOLO V1
https://blog.csdn.net/u014380165/article/details/72616238
https://blog.csdn.net/m0_37192554/article/details/81092514
https://zhuanlan.zhihu.com/p/25236464
码字不易，欢迎给个赞！

脚本编译vs工程_使用msbuild miffy888
MSBuild是在.NET2.0中引入的针对VisualStudio的构建系统。它可以执行构建脚本，完成各种Task──最主要的是把.NET项目编译成可执行文件或者DLL。从技术角度来说，制作EXE或者DLL的重要工作是由编译器（csc，vbc等等）完成的。MSBuild会从内部调用编译器，并完成其他必要的工作（例如拷贝引用──CopyLocal，执行构建前后的准备及清理工作等）。为什么要用脚本编
第十四届蓝桥杯省赛C++C组——子矩阵（蓝桥杯篇章完结撒花） Dawn_破晓蓝桥杯一个月速成日志蓝桥杯 c++c语言
本来想写的速成日志也没写多少，cb国二，最后一题树形DP调了一小时发现h数组没置-1，最后无果，如果没马虎可能有国一水平了，正儿八经准备用了两个月，因为要考研，每天只学2-3小时的算法，一共刷了300多道题吧，由于之前选过ACM（实验课因为周六去，懒得去还给我挂了）和算法分析课，所以还是有点基础的，如果算上一年前刷的题总共加起来也就400多道题吧。说一下历程吧，一年前的题都是老师布置的作业，迫不得
实战LLM强化学习——使用GRPO（DeepSeek R1出圈算法）大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 经验分享
引言近年来，深度强化学习（DRL）已经成为解决复杂决策问题的一个强有力工具，尤其是在自然语言处理（NLP）领域的广泛应用。通过不断优化决策策略，DRL能在大量数据中学习最佳行为，尤其是大型语言模型（LLM）在任务中展现出的巨大潜力。然而，随着模型规模的扩大和任务复杂性的增加，传统的强化学习算法开始暴露出训练效率低、收敛速度慢等问题。为了解决这些挑战，DeepSeek公司提出了一个新的强化学习算法—
网络安全入门教程（非常详细）从零基础入门到精通，看完这一篇就够了白帽黑客坤哥 web安全网络安全 python windows
href="https://csdnimg.cn/release/blogv2/dist/mdeditor/css/editerView/kdoc_html_views-1a98987dfd.css"rel="stylesheet"/>href="https://csdnimg.cn/release/blogv2/dist/mdeditor/css/editerView/ck_htmledit_v
10 分钟学会SpringValidation数据校验和全局异常处理 ohn.yu spring spring boot java
以下是一个使用Spring开发的简单RESTAPI小程序，通过对一张user表进行操作，代码演示如何RestAPI开发中实现数据校验、全局异常处理和返回Json格式数据。使用的核心框架包括SpringBootSpringWebSpringDataJPABeanValidation（JSR-303）Lombok1.项目依赖（pom.xml）创建一个Maven项目，添加以下依赖："xmlns:xsi=
移动端IOS的H5页面被键盘顶起后，底部有一大片空白区域的解决方法不怕麻烦的鹿丸浏览器 HTML5 JavaScript 前端 html5 javascript
在移动端开发中，当使用HTML5(特别是在Vue.js框架下)构建应用时，经常会遇到键盘弹出导致页面内容被顶起的问题。当键盘收起后，页面未能自动恢复到原来的位置。当键盘弹出时，你可以通过JavaScript监听键盘的显示和隐藏事件，并相应地调整页面的滚动位置。exportdefault{mounted(){window.addEventListener('focusin',this.handleF
Manus详细介绍 accurater c++算法笔记深度学习人工智能神经网络
第一章Manus的技术背景与核心突破初识ManusAI1.1什么是Manus？Manus是由中国团队Monica.im于2025年3月推出的全球首款通用型AI智能体（AIAgent）。其名称源自拉丁语“MensetManus”，意为“手脑并用”，强调将大模型的逻辑推理能力转化为实际生产力。与传统的对话式AI（如ChatGPT、DeepSeek）不同，Manus的核心定位是“执行型助手”，能够自主完
mkcert 极简安装及使用步骤学亮编程手记 Linux ssl
1.安装mkcertmacOSbrewinstallmkcertLinuxsudoaptinstalllibnss3-toolscurl-JLO"https://dl.filippo.io/mkcert/latest?for=linux/amd64"chmod+xmkcert-v*-linux-amd64sudomvmkcert-v*-linux-amd64/usr/local/bin/mkcer
爬虫基础--request库详解 amo的代码园_毕设 Java基础爬虫 java spring boot vue.js python 开发语言
爬虫基础–request库详解1.requests模块介绍request库中文文档：https://docs.python-requests.org/zh_CN/latest/user/quickstart.htmlrequests是一个非常流行的PythonHTTP第三方库，它允许你发送各种HTTP请求，处理cookies、会话、连接池、重定向、多种认证方式等，使得处理HTTP请求变得非常便捷，
ChatGPT、DeepSeek、GIS与Python机器学习强强联合！地质灾害风险评估、易发性分析、信息化建库及灾后重建 WangYan2022 DeepSeek ChatGPT 地下水地质灾害 DeepSeek ChatGPT GIS 灾后重建
在地质灾害频繁肆虐的当下，精准开展风险评价刻不容缓。如今，一门极具创新性的教程震撼登场，它将ChatGPT、DeepSeek等前沿技术与GIS、Python以及机器学习深度交融，为学员打造出前所未有的学习体验，助力大家在地质灾害风险评价领域强势突围，一路领先。前沿技术融合，铸就智能学习核心动力教程最闪耀的亮点之一，便是大胆引入了ChatGPT和DeepSeek技术。它们恰似无所不能的“数据魔法师”
Chainlink 预言机的原理解析 Chainlink资讯预言机 Chainlink 智能合约
本文来自于8月19日Chainlink开发者社区中国负责人Frank，在DAppLearning分享会上对于Chainlink预言机的原理的讲解，以下是这节分享会的总结内容。有兴趣的小伙伴可以结合视频一起学习：为什么区块链无法主动获取外界数据区块链的特点区块链是一个封闭的确定性系统，每一笔交易都需要不同节点共识，只有超过一定数量的节点共识成功，交易才会被真正认可，并写入区块链。因为对于外部API的
Selenium实战-模拟登录淘宝并爬取商品信息_使用selenium模拟真实登录行为,并爬取商品评论数据。 2401_84009899 程序员 selenium python 测试工具
模拟淘宝登录deflogin_taobao():print(‘开始登录…’)try:login_url=‘https://login.taobao.com/member/login.jhtml’driver.get(login_url)input_login_id=wait.until(EC.presence_of_element_located((By.ID,‘fm-login-id’)))in
【阿里百炼大模型-使用】 y_dd 深度学习语言模型人工智能
参照阿里云百炼网址服务配置开通服务如果没有注册阿里云账号，先注册一个https://www.aliyun.com/?spm=5176.account-console-pc.console-base_top-nav.dlogo.10d24bab70FmIm，注册完毕用它登录阿里云百炼，然后开通服务（即使是免费的开元模型也需要开通）获取API-key在账户这里选择API-KEY，进入这个页面，创建一个
DeepSeek智能政务大脑：城市服务知识库构建全指南——从RAG架构到民生场景落地实践 Coderabo DeepSeek R1模型企业级应用政务架构
DeepSeek赋能城市智慧升级：基于RAG架构的市民服务智能知识库构建全解一、需求分析与技术选型1.1市民服务场景需求市民服务智能知识库需要解决政务咨询效率低下、专业术语难理解、多轮对话能力弱等核心问题。系统需具备：自然语言理解能力（NLU）异构知识整合能力政策法规精准解读能力多轮对话上下文管理应急服务联动机制1.2DeepSeek技术栈选择基于DeepSeek-Large语言模型构建核心系统，
uniapp中使用webview并与原页面通信数学分析分析什么？ uni-app
uniapp中使用webview并与原页面通信1.接收数据主要使用@message与@onPostMessage接收原页面数据，且两个方法只能在APP中使用，其他平台均不支持。/***接收页面返回参数*@param{Object}item*/htmlMessage(item){console.log('收到的消息',item)letdata=item.detail...},2.发送数据（调用原页面
`fetch` 和 `axios`的前端使用区别 Studying_swz blog 前端
欢迎访问的个人博客：https://swzbk.site/，加好友，拉你入福利群fetch和axios`是前端常用的两种HTTP客户端，以下是它们的核心区别及适用场景：一、本质区别特性fetchaxios类型浏览器原生API（部分环境需polyfill）第三方库（需通过npm/yarn安装）底层实现基于Promise基于Promise，封装了XMLHttpRequest二、核心功能对比1.请求与响
uniapp工程中解析markdown文件 pvfhv uni-app
在uniapp中如何导入markdown文件，同时在页面中解析成html，请参考以下配置：1.安装以下3个依赖包npminstallmarkedhighlight.jsvite-plugin-markdown2.创建vite.config.js配置文件//vite.config.jsimport{defineConfig}from'vite';importunifrom'@dcloudio/vit
一文了解ThreadLocal Key~美好的每一天 java 开发语言
什么是ThreadLocal？ThreadLocal是每个线程私有的，线程可以把自己的私有数据放到ThreadLocal里面，不用担心其他线程访问到自己ThreadLocal。通过set()方法将值存入ThreadLocal或者修改值，get()方法取出值，remove()方法移除值。ThreadLocal原理ThreadLocal类中有一个内部类ThreadLocalMap，它其实就是一个哈希表
deepseek具体应用场景 ahyouxiang 人工智能
DeepSeek的具体应用场景非常广泛，涵盖了多个领域和行业。以下是基于证据的详细总结：金融领域DeepSeek在金融领域的应用表现突出，例如通过其大语言模型（如DeepSeekLLM67Bt）提供数学、逻辑推理等能力，帮助金融机构提升服务效率。此外，DeepSeek还被应用于智能安全体产品中，通过安全大模型实现个性化开发和优化。医疗领域在医疗领域，DeepSeek的技术被用于辅助诊断和患者记录管
智慧城市道路防护栏破损缺陷检测数据集VOC+YOLO格式6939张3类别 FL1623863129 数据集 YOLO 深度学习机器学习
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：6939标注数量(xml文件个数)：6939标注数量(txt文件个数)：6939标注类别数：3标注类别名称(注意yolo格式类别顺序不和这个对应，而以labels文件夹classes.txt为准):["body","cr
DeepSeek 大模型落地成都高新区：科技赋能警务的创新变革 AGI大模型学习科技人工智能 DeepSeek 大模型 chatgpt 大模型应用 AI大模型
在科技飞速发展的当下，人工智能正以前所未有的速度融入各个领域，深刻改变着人们的生活与工作方式。公安领域也不例外，积极拥抱科技创新，成为提升警务效能、维护社会稳定的关键路径。全国第一例警用DeepSeek大模型落地成都高新区，这一突破性举措在警务智能化发展进程中具有里程碑意义，为公安工作带来了全方位的革新。一、警用DeepSeek大模型落地的时代背景近年来，国产AI蓬勃发展，不断涌现出令人瞩目的成果
利用 HAI 平台进行 DeepSeek 模型训练的详细指南
摘要本文旨在为非专业用户提供在HAI平台上进行DeepSeek模型训练的详细步骤。从创建项目、上传数据集、配置训练参数到启动训练任务并监控训练过程，本文将逐步指导用户完成整个流程。此外，本文还包含可运行的示例代码模块和相关章节配图，以帮助用户更好地理解和操作。引言HAI（HyperAI）平台是一个强大的AI模型训练平台，但对于非专业用户来说，其复杂性可能会成为使用的障碍。本文将详细介绍如何在HAI
五、AIGC大模型_09手动实现ReAct_Agent 学不会lostfound AI 人工智能 react_agent LangGraph Multi-Agent PlanAndExecute AIGC
0、前言在上一章节中，我们了解到：create_react_agent是LangGraph提供的一个预构建方法（fromlanggraph.prebuiltimportcreate_react_agent），它可以将语言模型（LLM）和一组工具（Tools）结合起来，创建一个能够根据用户输入自动调用工具的智能代理，这个代理可以根据用户的请求，决定是否需要调用某个工具，并将工具的输出反馈给用户这个函
DeepSeek的实际应用场景：AI技术如何赋能多领域创新 2501_91189350 人工智能
DeepSeek作为新一代智能技术平台，凭借其强大的算法能力和灵活的部署方式，正在多个行业掀起效率革命。本文将从真实案例出发，解析DeepSeek在不同场景中的落地应用。‌场景一：金融风控建模‌在信贷风险评估领域，传统模型存在数据维度单一、更新滞后等问题。某银行引入DeepSeek的‌动态特征工程模块‌，通过实时整合用户行为数据、社交网络信息等100+维度特征，成功将坏账识别准确率提升至98.5%
详解小程序多端框架全面测评前端可乐老师前端
现在流行的多端框架可以大致分为三类：1.全包型这类框架最大的特点就是从底层的渲染引擎、布局引擎，到中层的DSL，再到上层的框架全部由自己开发，代表框架是Qt和Flutter。这类框架优点非常明显：性能（的上限）高；各平台渲染结果一致。缺点也非常明显：需要完全重新学习DSL（QML/Dart），以及难以适配中国特色的端：小程序。这类框架是最原始也是最纯正的的多端开发框架，由于底层到上层每个环节都掌握
Springboot启动失败：解决「org.yaml.snakeyaml.error.YAMLException」报错全记录 -天凉好秋- spring boot java idea visual studio code
##关键字Java、Springboot、vscode、idea、nacos启动失败、YAMLException、字符集配置---##背景环境###项目架构-**框架**：SSM（Spring+SpringMVC+MyBatis）-**中间件**：Nacos（配置管理+服务发现）-**配置存储**：Nacos中存储了Springboot的配置，包括：数据库连接信息、Redis连接信息、服务配置等。
PDF转图片 JAVA JAVA派派 java PDF
前言以下是一个使用ApachePDFBox将PDF文件转换为图片的封装方法。这个方法将会把PDF的每一页转换为一张图片，并保存到指定的目录中。1.添加依赖首先，你需要在项目中添加PDFBox的依赖。如果你使用的是Maven，可以在pom.xml中添加以下依赖：org.apache.pdfboxpdfbox2.0.292.转换方法importorg.apache.pdfbox.pdmodel.PDD
更新私有库男子峰 Git cocoaPods创建私有仓库 IOS工具类 ios 开发 swift
一、创建私有库二、更新代码将需要替换的文件、.a、.plist、.h文件、.bundle文件放置到文件夹中。接下来就是配置文件三、配置spec文件Pod::Spec.newdo|s|s.name='XXX'//名字s.version='1.0.0'//版本号s.ios.deployment_target='8.0's.license={:type=>"Copyright",:text=>"中国XX
渗透工具分享 Werqy3 网络安全
通过网盘分享的文件：exp链接:https://pan.baidu.com/s/1LenqUt7N3FYjeDLyrSAyeQ?pwd=6666提取码:6666--来自百度网盘超级会员v1的分享通过网盘分享的文件：shell链接:https://pan.baidu.com/s/1OOt6osSpOzADW-0ZRpBFZA?pwd=6666提取码:6666--来自百度网盘超级会员v1的分享通过网盘
DeepSeek爆火，背后模型竟藏着这些秘密！ qq_23519469 ai
DeepSeek是什么来头最近，AI圈可是被一个名字刷爆了屏，那就是DeepSeek！它就像一颗横空出世的超级新星，在全球范围掀起了一阵狂热的追捧潮，这热度，简直了！大家都在疯狂讨论它，各种测评、对比层出不穷。它到底有啥过人之处，能让这么多人都为之疯狂？今天咱就来好好唠唠。DeepSeek，全称杭州深度求索人工智能基础技术研究有限公司，是一家专注于开发先进大语言模型（LLM）和相关技术的企业。它成
Java实现的基于模板的网页结构化信息精准抽取组件：HtmlExtractor yangshangchuan 信息抽取 HtmlExtractor 精准抽取信息采集
HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件，本身并不包含爬虫功能，但可被爬虫或其他程序调用以便更精准地对网页结构化信息进行抽取。 HtmlExtractor是为大规模分布式环境设计的，采用主从架构，主节点负责维护抽取规则，从节点向主节点请求抽取规则，当抽取规则发生变化，主节点主动通知从节点，从而能实现抽取规则变化之后的实时动态生效。如
java编程思想 -- 多态百合不是茶 java 多态详解
一: 向上转型和向下转型面向对象中的转型只会发生在有继承关系的子类和父类中（接口的实现也包括在这里）。父类：人子类：男人向上转型： Person p = new Man() ; //向上转型不需要强制类型转化向下转型： Man man =
[自动数据处理]稳扎稳打,逐步形成自有ADP系统体系 comsci dp
对于国内的IT行业来讲,虽然我们已经有了"两弹一星",在局部领域形成了自己独有的技术特征,并初步摆脱了国外的控制...但是前面的路还很长.... 首先是我们的自动数据处理系统还无法处理很多高级工程...中等规模的拓扑分析系统也没有完成,更加复杂的
storm 自定义日志文件商人shang storm cluster logback
Storm中的日志级级别默认为INFO，并且，日志文件是根据worker号来进行区分的，这样，同一个log文件中的信息不一定是一个业务的，这样就会有以下两个需求出现： 1. 想要进行一些调试信息的输出 2. 调试信息或者业务日志信息想要输出到一些固定的文件中不要怕，不要烦恼，其实Storm已经提供了这样的支持，可以通过自定义logback 下的 cluster.xml 来输
Extjs3 SpringMVC使用 @RequestBody 标签问题记录 21jhf
springMVC使用 @RequestBody(required = false) UserVO userInfo 传递json对象数据，往往会出现http 415，400,500等错误，总结一下需要使用ajax提交json数据才行，ajax提交使用proxy，参数为jsonData，不能为params；另外，需要设置Content-type属性为json，代码如下：（由于使用了父类aaa
一些排错方法文强chu 方法
1、java.lang.IllegalStateException: Class invariant violation at org.apache.log4j.LogManager.getLoggerRepository(LogManager.java:199)at org.apache.log4j.LogManager.getLogger(LogManager.java:228) at o
Swing中文件恢复我觉得很难小桔子 swing
我那个草了！老大怎么回事，怎么做项目评估的？只会说相信你可以做的，试一下，有的是时间！用java开发一个图文处理工具，类似word，任意位置插入、拖动、删除图片以及文本等。文本框、流程图等，数据保存数据库，其余可保存pdf格式。ok,姐姐千辛万苦，
php 文件操作 aichenglong PHP 读取文件写入文件
1 写入文件 @$fp=fopen("$DOCUMENT_ROOT/order.txt", "ab"); if(!$fp){ echo "open file error" ; exit; } $outputstring="date:"." \t tire:".$tire."
MySQL的btree索引和hash索引的区别 AILIKES 数据结构 mysql 算法
Hash 索引结构的特殊性，其检索效率非常高，索引的检索可以一次定位，不像B-Tree 索引需要从根节点到枝节点，最后才能访问到页节点这样多次的IO访问，所以 Hash 索引的查询效率要远高于 B-Tree 索引。可能很多人又有疑问了，既然 Hash 索引的效率要比 B-Tree 高很多，为什么大家不都用 Hash 索引而还要使用 B-Tree 索引呢
JAVA的抽象--- 接口 --实现百合不是茶
抽象接口实现接口 //抽象类 ,方法 //定义一个公共抽象的类 ,并在类中定义一个抽象的方法体抽象的定义使用abstract abstract class A 定义一个抽象类例如： //定义一个基类 public abstract class A{ //抽象类不能用来实例化，只能用来继承 //
JS变量作用域实例 bijian1013 作用域
<script> var scope='hello'; function a(){ console.log(scope); //undefined var scope='world'; console.log(scope); //world console.log(b);
TDD实践（二） bijian1013 java TDD
实践题目：分解质因数 Step1：单元测试： package com.bijian.study.factor.test; import java.util.Arrays; import junit.framework.Assert; import org.junit.Before; import org.junit.Test; import com.bijian.
[MongoDB学习笔记一]MongoDB主从复制 bit1129 mongodb
MongoDB称为分布式数据库，主要原因是1.基于副本集的数据备份， 2.基于切片的数据扩容。副本集解决数据的读写性能问题，切片解决了MongoDB的数据扩容问题。事实上，MongoDB提供了主从复制和副本复制两种备份方式，在MongoDB的主从复制和副本复制集群环境中，只有一台作为主服务器，另外一台或者多台服务器作为从服务器。本文介绍MongoDB的主从复制模式，需要指明
【HBase五】Java API操作HBase bit1129 hbase
import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.HColumnDescriptor; import org.apache.ha
python调用zabbix api接口实时展示数据 ronin47
zabbix api接口来进行展示。经过思考之后，计划获取如下内容： 1、获得认证密钥 2、获取zabbix所有的主机组 3、获取单个组下的所有主机 4、获取某个主机下的所有监控项
jsp取得绝对路径 byalias 绝对路径
在JavaWeb开发中，常使用绝对路径的方式来引入JavaScript和CSS文件，这样可以避免因为目录变动导致引入文件找不到的情况，常用的做法如下：一、使用${pageContext.request.contextPath} 　　代码” ${pageContext.request.contextPath}”的作用是取出部署的应用程序名，这样不管如何部署，所用路径都是正确的。
Java定时任务调度：用ExecutorService取代Timer bylijinnan java
《Java并发编程实战》一书提到的用ExecutorService取代Java Timer有几个理由，我认为其中最重要的理由是：如果TimerTask抛出未检查的异常，Timer将会产生无法预料的行为。Timer线程并不捕获异常，所以 TimerTask抛出的未检查的异常会终止timer线程。这种情况下，Timer也不会再重新恢复线程的执行了;它错误的认为整个Timer都被取消了。此时，已经被
SQL 优化原则 chicony sql
一、问题的提出　在应用系统开发初期，由于开发数据库数据比较少，对于查询SQL语句，复杂视图的的编写等体会不出SQL语句各种写法的性能优劣，但是如果将应用系统提交实际应用后，随着数据库中数据的增加，系统的响应速度就成为目前系统需要解决的最主要的问题之一。系统优化中一个很重要的方面就是SQL语句的优化。对于海量数据，劣质SQL语句和优质SQL语句之间的速度差别可以达到上百倍，可见对于一个系统
java 线程弹球小游戏 CrazyMizzz java 游戏
最近java学到线程，于是做了一个线程弹球的小游戏，不过还没完善这里是提纲 1.线程弹球游戏实现 1.实现界面需要使用哪些API类 JFrame JPanel JButton FlowLayout Graphics2D Thread Color ActionListener ActionEvent MouseListener Mouse
hadoop jps出现process information unavailable提示解决办法 daizj hadoop jps
hadoop jps出现process information unavailable提示解决办法 jps时出现如下信息： 3019 -- process information unavailable3053 -- process information unavailable2985 -- process information unavailable2917 --
PHP图片水印缩放类实现 dcj3sjt126com PHP
<?php class Image{ private $path; function __construct($path='./'){ $this->path=rtrim($path,'/').'/'; } //水印函数，参数：背景图，水印图，位置，前缀,TMD透明度 public function water($b,$l,$pos
IOS控件学习：UILabel常用属性与用法 dcj3sjt126com ios UILabel
参考网站： http://shijue.me/show_text/521c396a8ddf876566000007 http://www.tuicool.com/articles/zquENb http://blog.csdn.net/a451493485/article/details/9454695 http://wiki.eoe.cn/page/iOS_pptl_artile_281
完全手动建立maven骨架 eksliang java eclipse Web
建一个 JAVA 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=App [-Dversion=0.0.1-SNAPSHOT] [-Dpackaging=jar] 建一个 web 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=web-a
配置清单 gengzg 配置
1、修改grub启动的内核版本 vi /boot/grub/grub.conf 将default 0改为1 拷贝mt7601Usta.ko到/lib文件夹拷贝RT2870STA.dat到 /etc/Wireless/RT2870STA/文件夹拷贝wifiscan到bin文件夹，chmod 775 /bin/wifiscan 拷贝wifiget.sh到bin文件夹，chm
Windows端口被占用处理方法 huqiji windows
以下文章主要以80端口号为例，如果想知道其他的端口号也可以使用该方法..........................1、在windows下如何查看80端口占用情况?是被哪个进程占用?如何终止等. 这里主要是用到windows下的DOS工具,点击"开始"--"运行",输入&
开源ckplayer 网页播放器，跨平台(html5, mobile)，flv, f4v, mp4, rtmp协议. webm, ogg, m3u8 ！天梯梦 mobile
CKplayer，其全称为超酷flv播放器，它是一款用于网页上播放视频的软件，支持的格式有：http协议上的flv,f4v,mp4格式，同时支持rtmp视频流格式播放，此播放器的特点在于用户可以自己定义播放器的风格，诸如播放/暂停按钮，静音按钮，全屏按钮都是以外部图片接口形式调用，用户根据自己的需要制作出播放器风格所需要使用的各个按钮图片然后替换掉原始风格里相应的图片就可以制作出自己的风格了，
简单工厂设计模式 hm4123660 java 工厂设计模式简单工厂模式
简单工厂模式（Simple Factory Pattern）属于类的创新型模式，又叫静态工厂方法模式。是通过专门定义一个类来负责创建其他类的实例，被创建的实例通常都具有共同的父类。简单工厂模式是由一个工厂对象决定创建出哪一种产品类的实例。简单工厂模式是工厂模式家族中最简单实用的模式，可以理解为是不同工厂模式的一个特殊实现。
maven笔记 zhb8015 maven
跳过测试阶段： mvn package -DskipTests 临时性跳过测试代码的编译： mvn package -Dmaven.test.skip=true maven.test.skip同时控制maven-compiler-plugin和maven-surefire-plugin两个插件的行为，即跳过编译，又跳过测试。指定测试类 mvn test
非mapreduce生成Hfile，然后导入hbase当中 Stark_Summer map hbase reduce Hfile path实例
最近一个群友的boss让研究hbase，让hbase的入库速度达到5w+/s，这可愁死了，4台个人电脑组成的集群，多线程入库调了好久，速度也才1w左右，都没有达到理想的那种速度，然后就想到了这种方式，但是网上多是用mapreduce来实现入库，而现在的需求是实时入库，不生成文件了，所以就只能自己用代码实现了，但是网上查了很多资料都没有查到，最后在一个网友的指引下，看了源码，最后找到了生成Hfile
jsp web tomcat 编码问题王新春 tomcat jsp pageEncode
今天配置jsp项目在tomcat上，windows上正常，而linux上显示乱码，最后定位原因为tomcat 的server.xml 文件的配置，添加 URIEncoding 属性： <Connector port="8080" protocol="HTTP/1.1" connectionTi