小白学视觉

从基础综述、论文笔记到工程经验、训练技巧：值得一看的目标检测好文推荐...

点击上方“小白学视觉”，选择加"星标"或“置顶”

重磅干货，第一时间送达

本文授权转自知乎作者跑者小越，https://zhuanlan.zhihu.com/p/140036646。未经作者许可，不得二次转载。

前言

依稀记得两年前刚开始接触深度学习和目标检测的时候，惊喜地发现知乎上有很多优质的目标检测相关文章，其中不少甚至是论文作者自己写的，极具食用价值。通过阅读这些文章，不仅加深了我对现有目标检测领域的理解，还让我深深体会到了同行们对科研的热爱，一句话概括：受益匪浅。因此我打算将自认为不错的知乎文章分享出来，希望能让对目标检测感兴趣的同学们更快地了解目标检测，认识在这个领域辛勤耕耘的大神们。开放的社区也一定会更加促进目标检测领域的研究！

需要说明的是本文并没有包揽所有目标检测文章，只有那些我读过并且觉得受益匪浅的文章。

（以下排名不分先后，单纯按照我的收藏夹顺序...）

一、基础

【1】作为目标检测领域最经典的模型，Faster RCNN 的大名无人不知无人不晓。而全网把 Faster RCNN 讲的最透彻的，非此文莫属。仅凭一篇文章就让无数同学记住了白裳这个名字。强烈安利，新人必看。

白裳：一文读懂Faster RCNN
https://zhuanlan.zhihu.com/p/31426458

【2】作者为旷视科技南京研究院研究员，本文针对mmAP这一经典的目标检测评价指标详细解析其定义初衷和具体计算方式；下半篇深入分析mmAP的特点，并介绍针对这些特点现有方法如何“hack” mmAP，最后将提出几个mmAP未考虑到的评测要素。

zzzz1：浅析经典目标检测评价指标--mmAP（一）
https://zhuanlan.zhihu.com/p/55575423
zzzz1：浅析经典目标检测评价指标--mmAP（二）
https://zhuanlan.zhihu.com/p/56899189

【3】作者为清华CS博士，本文从Normalization的背景讲起，用一个公式概括 Normalization的基本思想与通用框架，将各大主流方法一一对号入座进行深入的对比分析，并从参数和数据的伸缩不变性的角度探讨Normalization有效的深层原因。

Juliuszh：详解深度学习中的Normalization，BN/LN/WN
https://zhuanlan.zhihu.com/p/33173246

【4】作者为百度CV工程师，本文详细阐述了目前分类损失函数为何多用交叉熵，而不是KL散度。

KevinCK：交叉熵、相对熵（KL散度）、JS散度和Wasserstein距离（推土机距离）
https://zhuanlan.zhihu.com/p/74075915

【5】本文节选自王峰博士的毕业论文。Softmax交叉熵损失函数应该是目前最常用的分类损失函数了，本文从最优化的角度来推导出Softmax交叉熵损失函数，极具启发性。

王峰：从最优化的角度看待Softmax损失函数
https://zhuanlan.zhihu.com/p/45014864

【6】本文指出了学术论文与工业界需求偏差，分析了为什么有些模型FLOPs很低，但其推理速度却很慢。

Phoenix Li：FLOPs与模型推理速度
https://zhuanlan.zhihu.com/p/122943688

【7】空洞卷积(Dilated/Atrous Convolution)，广泛应用于语义分割与目标检测等任务中。本文介绍了空洞卷积的作用，感受野的计算，以及其gridding问题。

点点点：总结-空洞卷积(Dilated/Atrous Convolution)
https://zhuanlan.zhihu.com/p/50369448

【8】本文介绍了两大类处理目标多尺度的方法：图像金字塔和特征金字塔。

点点点：总结-CNN中的目标多尺度处理zhuanlan.zhihu.com
https://zhuanlan.zhihu.com/p/70523190

【9】本文指出对于CNN而言，深度之外，感受野以及该感受野上的通道数，真正决定了网络的性能。CNN是一种利用卷积实现二维泛函空间到二维泛函空间映射的神经网络。

akkaze-郑安坤：CNN真的需要下采样（上采样）吗?(原创)
https://zhuanlan.zhihu.com/p/94477174

【10】教你如何计算神经网络的复杂度

Michael Yuan：卷积神经网络的复杂度分析
https://zhuanlan.zhihu.com/p/31575074

【11】本文提炼了一个核心观点：目标检测中存在多种多样的不平衡，这些不平衡会影响最终的检测精度，而现有的许多研究可以归结为解决这些不平衡方法。将不平衡分为四类：类别不平衡，尺度不平衡；空间不平衡，多任务损失优化之间的不平衡。

ChenJoya：Imbalance Problems in Object Detection: A Review
https://zhuanlan.zhihu.com/p/82371629

【12】能否对卷积神经网络工作原理做一个直观的解释？
https://www.zhihu.com/question/39022858/answer/224446917

【13】stone：令人拍案称奇的Mask RCNN
https://zhuanlan.zhihu.com/p/37998710

【14】视频中的目标检测与图像中的目标检测具体有什么区别？
https://www.zhihu.com/question/52185576/answer/155679253

【15】中国移不动：5分钟理解Focal Loss与GHM——解决样本不平衡利器
https://zhuanlan.zhihu.com/p/80594704

【16】燕小花：目标检测小tricks--样本不均衡处理
https://zhuanlan.zhihu.com/p/60612064

【17】YaqiLYU：目标检测中的Anchor
https://zhuanlan.zhihu.com/p/55824651

【18】小小将：目标检测|SSD原理与实现
https://zhuanlan.zhihu.com/p/33544892

【19】小小将：目标检测|YOLO原理与实现
https://zhuanlan.zhihu.com/p/32525231

二、综述

【1】当时带领我入坑的目标检测综述，记录了2017.12.31之前的所有目标检测算法。让当时的我了解到原来目前目标检测领域的深度学习方法主要分为两类：two stage 和 one stage。

Ronald：综述：深度学习时代的目标检测算法zhuanlan.zhihu.com
https://zhuanlan.zhihu.com/p/33277354

【2】俞刚博士在目标检测领域也是很出名的大佬，之前在旷视科技待了5年，任Detection组组长，19年年底跳槽到腾讯PCG光影研究室。下面这篇文章是他在旷视的时候做的分享，讲述了什么是目标检测，其技术现状是什么；目前目标检测领域的五个挑战点及旷视分别给出的技术解决方案；最后展望了目标检测的未来，the devil is in the detail。

旷视科技：R Talk | 旷视科技目标检测概述：Beyond RetinaNet and Mask R-CNN
https://zhuanlan.zhihu.com/p/38154492

【3】一篇关于旋转目标检测论文的综述。在目前已知开源的数据集中，只有遥感和文字类数据集才涉及到旋转框的目标检测。（还有少量未开源的logo/商品数据集）

qianlinjun：旋转目标(遥感/文字)检测方法整理（2017-19年）
https://zhuanlan.zhihu.com/p/98703562

【4】文本作者为国科大CS博士，目前就职于微软亚研院。知乎专栏致力于计算机视觉迁移学习相关研究。

王晋东不在家：《迁移学习简明手册》发布啦！
https://zhuanlan.zhihu.com/p/35352154

【5】本文作者为旷视研究员。人脸检测是人脸识别的第一站，旷视的努力主要体现在紧紧围绕人脸检测领域顽固而核心的问题展开，攻坚克难，功夫花在刀刃上，比如人脸尺度的变动及遮挡等，实现速度与精度的双重涨点。

王剑锋：人脸检测江湖的那些事儿——从旷视说起
https://zhuanlan.zhihu.com/p/56619497

三、Anchor Free

【1】这篇文章主要讲一下有代表性的Anchor-Free模型(包括DenseBox、YOLO、CornerNet、ExtremeNet、FSAF、FCOS、FoveaBox)，分成3个部分来介绍(早期探索、基于关键点、密集预测)。最后作者认为设计合适的gt，是提升目标检测速度和精度的关键。

陀飞轮：目标检测：Anchor-Free时代
https://zhuanlan.zhihu.com/p/62103812

【2】陈恺博士是大名鼎鼎的mmdetection的作者，他毕业于港中文，目前就职于商汤科技。本文揭示了几篇anchor free论文设计的异曲同工之妙。历史的车轮滚滚向前，目标检测研究似乎也在不断轮回。

陈恺：物体检测的轮回: anchor-based 与 anchor-free
https://zhuanlan.zhihu.com/p/62372897

【3】本文作者王乃岩博士为图森首席科学家。

Naiyan Wang：聊聊Anchor的"前世今生"（上）
https://zhuanlan.zhihu.com/p/63273342

Naiyan Wang：聊聊Anchor的"前世今生"（下）
https://zhuanlan.zhihu.com/p/68291859

四、神经架构搜索 NAS

CLAY：神经网络架构搜索(NAS)中的milestones
https://zhuanlan.zhihu.com/p/94252445

如何评价Google Brain团队最新检测论文SpineNet？
https://www.zhihu.com/question/360562458/answer/959198888

五、从头训练

【1】朱睿是ScratchDet的作者，目前在港中文读研，他开门见山地指出关于从0训练检测器的个人观点：1）需要能够稳定梯度的优化手段（比如clip_gradient、BN、GN、SN、等等）；2）训练足够多的epoch与合适的学习率；3）对于小数据集，在训练时需要一定的数据增广。

如何评价何恺明等 arxiv 新作 Rethinking ImageNet Pre-training？
https://www.zhihu.com/question/303234604/answer/537395863

【2】沈志强是DSOD的作者，他在这篇文章中指出：起初从头训练之所以没有使用预训练模型效果好，更本质的一点是batch size太小（通常每张卡上1或2）导致BN收敛不好。而最近出现的GN，SN缓解了这个问题。

沈志强：Object Detection from Scratch - A Brief Review
https://zhuanlan.zhihu.com/p/137410354

六、展望未来

【1】作者为北大数院助理教授，本文提出了未来深度学习领域值得 follow 的几个大方向：1）深入反思和理解深度学习的行为；2）新模型的构建；3）新的数据场景或数据结构中的深度学习模型；4）Learning-enhanced algorithms；5）对应用友好的模型和算法；6）和硬件结合的方向。

时至今日，深度学习领域有哪些值得追踪的前沿研究？
https://www.zhihu.com/question/385326992/answer/1164005349

【2】作者为旷视科技实习生，本文认为：2017年是顶峰，2018年呈现饱和趋势，2019年基本宣告了这个时代的落幕。如果真的选择做纯目标检测，必须去啃硬骨头了。

想知道目标检测领域中还有哪些方向能做？
https://www.zhihu.com/question/351254577/answer/861582672

七、研究心得

zibuyu9：好的研究想法从哪里来
https://zhuanlan.zhihu.com/p/93765082

陈天奇：机器学习科研的十年
https://zhuanlan.zhihu.com/p/74249758

Naiyan Wang：闲聊几句科研三观
https://zhuanlan.zhihu.com/p/37042197

田渊栋：一些感悟
https://zhuanlan.zhihu.com/p/26178137

八、工程经验

ps. 因为我自己主要用pytorch，主要都是关于pytorch的～

巽二：简单两步加速PyTorch里的Dataloader
https://zhuanlan.zhihu.com/p/68191407

张皓：PyTorch Cookbook（常用代码段整理合集）
https://zhuanlan.zhihu.com/p/59205847

Pytorch有什么节省显存的小技巧？
https://www.zhihu.com/question/274635237/answer/755102181

lbin：pytorch + apex 生活变得更美好
https://zhuanlan.zhihu.com/p/57958993

Jack Stark：[深度学习框架]PyTorch常用代码段
https://zhuanlan.zhihu.com/p/104019160

商汤科技SenseTime：模型量化了解一下？
https://zhuanlan.zhihu.com/p/132561405

如何评价商汤开源的 mm-detection 检测库？
https://www.zhihu.com/question/294578141/answer/509367634

九、比赛技巧

Caleb Ge：Crowdhuman人体检测比赛第一名经验总结
https://zhuanlan.zhihu.com/p/68677880

AI科技大本营：Hinton等人最新研究：大幅提升模型准确率，标签平滑技术到底怎么用?
https://zhuanlan.zhihu.com/p/72685158

商汤科技SenseTime：CVPR 2020丨商汤TSD目标检测算法获得Open Images冠军
https://zhuanlan.zhihu.com/p/131576433

十、论文笔记

2020

Amusi：大神接棒，YOLOv4来了！
https://zhuanlan.zhihu.com/p/135909702

Amusi：ResNeSt 实现有误？
https://zhuanlan.zhihu.com/p/135220104

Hassassin：一行代码提升迁移性能 | CVPR2020 Oral
https://zhuanlan.zhihu.com/p/121507249

mileistone：也谈阿里达摩院的频域学习论文
https://zhuanlan.zhihu.com/p/115584408)

2019

陈恺：Guided Anchoring: 物体检测器也能自己学 Anchor
https://zhuanlan.zhihu.com/p/55854246)

pprp：打通多个视觉任务的全能Backbone:HRNet
https://zhuanlan.zhihu.com/p/134253318

陀飞轮：GCNet：当Non-local遇见SENet
https://zhuanlan.zhihu.com/p/64988633)

OLDPAN：扔掉anchor！真正的CenterNet——Objects as Points论文解读
https://zhuanlan.zhihu.com/p/66048276

TeddyZhang：目标检测：FCOS（2019）
https://zhuanlan.zhihu.com/p/62869137

如何评价zhangshifeng最新的讨论anchor based/ free的论文?
https://www.zhihu.com/question/359595879/answer/927861326

如何看待 CVPR2019 论文 Libra R-CNN（一个全面平衡的目标检测器）？
https://www.zhihu.com/question/319458937/answer/647082241

Naiyan Wang：TridentNet：处理目标检测中尺度变化新思路
https://zhuanlan.zhihu.com/p/54334986)

2018

Naiyan Wang：CVPR18 Detection文章选介（上）
https://zhuanlan.zhihu.com/p/35882192

Naiyan Wang：CVPR18 Detection文章选介（下）
https://zhuanlan.zhihu.com/p/36431183

商汤科技SenseTime：商汤科技44篇论文入选CVPR 2018
https://zhuanlan.zhihu.com/p/36688720)

持续更新中，欢迎推荐好文～

好消息！

小白学视觉知识星球

开始面向外开放啦

下载1：OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复：扩展模块中文教程，即可下载全网第一份OpenCV扩展模块教程中文版，涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。


下载2：Python视觉实战项目52讲
在「小白学视觉」公众号后台回复：Python视觉实战项目，即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目，助力快速学校计算机视觉。


下载3：OpenCV实战项目20讲
在「小白学视觉」公众号后台回复：OpenCV实战项目20讲，即可下载含有20个基于OpenCV实现20个实战项目，实现OpenCV学习进阶。


交流群

欢迎加入公众号读者群一起和同行交流，目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群（以后会逐渐细分），请扫描下面微信号加群，备注：”昵称+学校/公司+研究方向“，例如：”张三 + 上海交大 + 视觉SLAM“。请按照格式备注，否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告，否则会请出群，谢谢理解~

学生行为习惯画像可视分析平台 AI智能涌现深度研究 AI大模型应用入门实战与进阶 java python javascript kotlin golang 架构人工智能
学生行为习惯，画像分析，可视化，机器学习，数据挖掘，教育科技1.背景介绍随着教育信息化进程的不断加速，海量教育数据正在被生成和积累。这些数据蕴含着丰富的学生行为信息，例如学习时间、学习内容、学习方式、学习效果等。有效挖掘和分析这些数据，能够帮助教育工作者深入了解学生的学习习惯和行为模式，从而为个性化教学、精准指导和学习效果提升提供重要支撑。然而，传统的教育数据分析方法往往局限于简单的统计描述，难以
蚂蚁集团可转正实习算法岗内推-自然语言飞300 业界资讯自然语言处理
具备极佳的工程实现能力，精通C/C++、Java、Pvthon、Perl等至少一门语言:对目前主流的深度学习平台:tensorflow、pytorch、mxnet等，至少对其中一个有上手经验;熟悉深度学习以及常见机器学习算法的原理与算法，能熟练运用聚类、分类、回归、排序等模型解决有挑战性的问题，有大数据处理的实战经验;有强烈求知欲，对人工智能领域相关技术有热情，内推链接：https://u.ali
深圳传音控股AI算法岗内推飞300 人工智能 python java 业界资讯
1扎实的数学基础，熟练掌握机器学习相关的数学知识。2熟悉常用的机器学习算法，掌握常用的深度学习模型与编程实践。3熟悉Pytorch或TensorFlow等深度学习框架，有一定项目经验。4良好的沟通协调能力，执着的专业精神。5参与部门AI创新项目，包括自动化测试平台、BPM流程管理等项目开发登录链接：transsion.zhiye.com/campus/jobs填写我的推荐码：EVHPB3投递，简历
小鹏P7自动泊车技术方案浅析 yuyuelongfly 自动驾驶小鹏P7 APA 自动泊车自动驾驶
目录一、概述二、感知算法1.视觉库位检测1.1.视觉系统1.2.库位检测算法1.3.同步建图与定位技术1.4.其他要素检测2.超声波库位检测3.视觉库位检测与超声波库位检测融合三、路径规划与控制四、HMI一、概述泊车算法离不开感知&融合、规划&控制，从目前行业技术发展的角度来看，泊车涉及的每一个算法都不算完美，甚至可以说仍不成熟。然而，小鹏P7采用优秀的系统方案设计，特别是通过引入同步建图与定位技
【北上广深杭大厂AI算法面试题】深度学习篇...MobileNet 系列网络发展与高效性分析（附代码）（二）努力毕业的小土博^_^ AI算法题库人工智能算法深度学习卷积神经网络
【北上广深杭大厂AI算法面试题】深度学习篇…MobileNet系列网络发展与高效性分析（附代码）（二）【北上广深杭大厂AI算法面试题】深度学习篇…MobileNet系列网络发展与高效性分析（附代码）（二）文章目录【北上广深杭大厂AI算法面试题】深度学习篇...MobileNet系列网络发展与高效性分析（附代码）（二）MobileNet系列网络发展与高效性分析（附代码）4.MobileNetV2（2
”天下第一神数“——紫微斗数的JAVA实现！紫微玄机速run~ 钮钴禄·爱因斯晨赛博算命JAVA实现 java python 开发语言
各位佬儿们好呀~~互三必回哦~更多精彩：个人主页赛博算命精彩文章：梅花易数的java实现赛博算命系列文章不作溢美之词，不作浮夸文章，此文与功名进取毫不相关也！与各位共勉！！文章目录#前言：一、紫微斗数简介二、紫微斗数的数学原理1.**命盘构建规则**2.**星曜分布算法**3.**运势推导逻辑**三、Java实现步骤1.代码分布实现1.1**数据结构设计**1.2**命盘构建算法实现**1.3**
华为OD-不限经验，急招，机考资料，面试攻略，不过改推，捞人 2301_79125642 java
超星(学习通)-Java后端一面网易互娱40min（感觉是G了）一篇不太像面经的面经2023总结，前端大二上进小红书秋招面经第一波海康红外图像算法实习（微影）面经测试工程师社招-测试面试题大厂在职傻屌。TPlink图像算法工程师一二三面经深圳海康红外图像算法实习（微影）面经TPLink提前批面经（已OC）传统车辆转规控算法岗秋招记录腾讯TEG测试与质量管理全记录瑞幸Java开发校招一面腾讯金融科技
【MATLAB源码-第269期】基于matlab的鱼鹰优化算法(OOA)无人机三维路径规划，输出做短路径图和适应度曲线. Matlab程序猿小助手路径规划 matlab 算法开发语言人工智能无人机网络机器人
操作环境：MATLAB2022a1、算法描述鱼鹰优化算法（OspreyOptimizationAlgorithm，简称OOA）是一种新兴的基于自然界生物行为的智能优化算法，其灵感来自于鱼鹰这种海鸟在捕猎过程中的独特行为。鱼鹰是一种生活在全球范围内的猛禽，以鱼类为主食。它们的捕猎方式非常高效和精准，能够通过快速调整飞行路径和俯冲角度来捕捉猎物。鱼鹰的捕猎行为不仅表现出高度的灵活性，还能在不同环境中表
【MATLAB源码-第164期】基于matlab的轴承故障三种谱图：细化谱，功率谱，倒谱对比分析仿真。 Matlab程序猿小助手通信原理 matlab 开发语言算法机器人人工智能机器学习计算机视觉
操作环境：MATLAB2022a1、算法描述轴承故障分析是一种重要的维护和监控手段，能够帮助工程师及时发现和解决轴承在运行中可能遇到的各种问题。在轴承故障诊断中，通常会使用到三种谱图分析方法：细化谱（FineSpectrum）、功率谱（PowerSpectrum）和倒谱（Cepstrum）分析。这三种方法各有特点，适用于不同的故障类型和分析场景。以下是对这三种谱图的详细描述。细化谱分析理论基础细化
【MATLAB源码-第128期】基于matlab的雷达系统回波信号仿真，输出脉压，MTI,MTD等图像。 Matlab_猿助手调制解调通信原理 MATLAB matlab 开发语言信息与通信
操作环境：MATLAB2022a1、算法描述雷达（RadioDetectionandRanging）是一种使用无线电波来探测和定位物体的系统。它的基本原理是发射无线电波，然后接收这些波从目标物体上反射回来的信号。通过分析这些反射波，雷达能够确定物体的位置、速度、方向和其他特性。历史背景雷达技术起源于20世纪初。最初的发展动机主要是军事上的需求，特别是在第二次世界大战期间，雷达在侦测敌机和舰船上发挥
基于NLP的客户意见分析：从数据到洞察 Echo_Wish Python 算法 Python 笔记自然语言处理人工智能
友友们好！我的新专栏《Python进阶》正式启动啦！这是一个专为那些渴望提升Python技能的朋友们量身打造的专栏，无论你是已经有一定基础的开发者，还是希望深入挖掘Python潜力的爱好者，这里都将是你不可错过的宝藏。在这个专栏中，你将会找到：●深入解析：每一篇文章都将深入剖析Python的高级概念和应用，包括但不限于数据分析、机器学习、Web开发等。●实战案例：通过丰富的实战案例，带你一步步实现
（视频演示）基于OpenCV的实时视频跟踪火焰识别软件V1.0源码及exe下载是刃小木啦~ opencv 人工智能计算机视觉
本文介绍了基于OpenCV的实时视频跟踪火焰识别软件，该软件通过先进的图像处理技术实现对实时视频中火焰的检测与跟踪，同时支持导入图片进行火焰识别。主要功能包括相机选择、实时跟踪和图片模式。软件适用于多种场合，用于保障人民生命财产安全。源码及exe文件可通过蓝奏云网盘下载。软件简介《基于OpenCV的实时视频跟踪火焰识别软件》是一款创新的计算机视觉应用软件，旨在通过先进的图像处理技术实现对实时视频中
三维模型点云化工具V1.0使用介绍：将三维模型进行点云化生成是刃小木啦~ python pyqt 工业软件软件工程
三维软件绘制的三维模型导入之后，可以生成点云，用于替代实际的激光扫描过程，当然，主要是用于点云算法的测试和验证，没法真正模拟扫描的效果，因为太过于理想化了。功能介绍将三维软件绘制的三维模型变成点云，并且支持不同的点云密度。支持添加不同的噪声，高斯噪声比较柔和，随机噪声比较明显。功能视频介绍三维模型点云化工具V1.0使用介绍：将三维模型进行点云化生成，支持不同的分辨率，支持添加噪声下载地址三维模型点
PCL 最小二乘拟合空间曲线点云侠点云进阶算法 c++计算机视觉 3d 开发语言
目录一、曲线拟合1、算法原理2、参考文献二、代码实现三、结果展示四、测试数据本文由CSDN点云侠原创，原文链接。如果你不是在点云侠的博客中看到该文章，那么此处便是不要脸的爬虫与GPT。博客长期更新，最近一次更新时间为：2024年7月14日。①代码在PCL1.14.1中运行；②完善代码；③新增标准测试数据一、曲线拟合1、算法原理电力线三维重建指将提取得到的单根电力线进行精确矢量化。在理想情况下，
DeepSeek开源技术全景解析：从硬件榨取到AI民主化革命大刘讲IT 开源人工智能
DeepSeek开源技术全景解析：从硬件榨取到AI民主化革命一、开源周核心成果概览2025年2月24日启动的"开源周"计划，DeepSeek团队连续发布三项底层技术突破：FlashMLA（2.24）：动态资源调度算法，Hopper架构GPU性能榨取专家DeepEP（2.25）：全球首个MoE全流程通信优化库DeepGEMM（2.26）：300行代码重构矩阵计算范式三项技术构成完整技术栈，覆盖大模型
分布式基本理论 - CAP,BASE 和 RAFT 算法 Yellow明算法分布式
分布式基本理论-CAP,BASE和RAFT算法1.分布式基本理论1.1CAP理论在理论计算机科学中，CAP定理（CAPtheorem），又被称作布鲁尔定理（Brewer’stheorem），它指出对于一个分布式计算系统来说，不可能同时满足以下三点：[1][2]一致性（Consistency）（等同于所有节点访问同一份最新的数据副本）可用性（Availability）（每次请求都能获取到非错的响应—
AdaBoost算法 Mr终游机器学习算法决策树
目录一、核心原理：二、算法步骤三、关键优势：四.局限与解决五、代码示例（鸢尾花数据集）AdaBoost（AdaptiveBoosting）是一种经典的集成学习算法，通过组合多个弱分类器（如决策树）来构建强分类器。其核心思想是通过迭代优化残差（错误）和动态调整样本权重，逐步提升模型性能。以下是对AdaBoost的简明总结和关键要点：一、核心原理：提升法：通过顺序训练多个弱分类器，每轮专注修正前一个模
OpenCV 100道面试题及参考答案（7万字长文）大模型大数据攻城狮大厂面试大厂面经 android面试计算机视觉 opencv 实时互动 webrtc
OpenCV简介OpenCV（OpenSourceComputerVisionLibrary）是一个开源的计算机视觉库，它提供了丰富的函数和工具，用于处理图像和视频。OpenCV最初由英特尔公司开发，现在由一个开源社区维护和发展。主要功能和用途OpenCV的主要功能包括图像和视频处理、特征提取、目标检测、人脸识别、物体跟踪等。它可以用于各种领域，如机器人技术、医学影像、安全监控、自动驾驶等。在图像
R语言机器学习系列-随机森林回归代码解读 Mrrunsen R语言大学作业机器学习回归 r语言
回归问题指的是因变量或者被预测变量是连续性变量的情形，比如预测身高体重的具体数值是多少的情形。整个代码大致可以分为包、数据、模型、预测评估4个部分，接下来逐一解读。1、包部分，也就是加载各类包，包括随机森林包randomForest，数据相关包tidyverse、skimr、DataExplorer，模型评估包caret。2、数据部分，主要是读取数据，处理缺失值，转换变量类型。3、模型部分。为了对
常见的限流算法有哪些涛粒子算法 java 网络
计数器算法原理：在固定的时间窗口内，对请求进行计数，当请求数量达到设定的阈值时，就开始限流，拒绝多余的请求。例如，设定1分钟的时间窗口内允许最多100个请求，那么在这1分钟内每来一个请求，计数器就加1，当计数器达到100后，后续的请求就会被拒绝，直到下一个1分钟开始，计数器重置为0重新计数。优点：实现简单，易于理解和部署，在一些对精度要求不是特别高的场景下能很好地控制流量。缺点：存在临界问题，比如
代码随想录算法训练营第七天|Leetcode 344.反转字符串 541. 反转字符串II 卡码网：54.替换数字昂子的博客算法 leetcode java 数据结构
344.反转字符串建议：本题是字符串基础题目，就是考察reverse函数的实现，同时也明确一下平时刷题什么时候用库函数，什么时候不用库函数题目链接/文章讲解/视频讲解：代码随想录思路非常简单，两个指针一个指向头一个指向尾巴，对于字符串，我们定义两个指针（也可以说是索引下标），一个从字符串前面，一个从字符串后面，两个指针同时向中间移动，并交换元素。classSolution{publicvoidre
C++ 泛型编程四代目水门 C++学习笔记 c++开发语言
C++泛型编程一、泛型编程基础1.核心概念实现算法与数据结构的分离基于模板技术（函数模板/类模板）本质：类型参数化，减少重复代码典型应用：STL容器、迭代器、算法2.类型本质内存布局的抽象不同类型对应不同的内存分配策略二、函数模板1.基本语法cpptemplate//或template返回类型函数名(参数列表){//函数体}2.关键特性支持隐式推导和显式指定类型可重载（包括与普通函数重载）可声明为
字节跳动2024校招后端开发面试题大全（含解题思路） AI天才研究院 ChatGPT AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
字节跳动2024校招后端开发面试题大全（含解题思路）关键词：字节跳动、校招、后端开发、面试题、解题思路摘要：本文将围绕字节跳动2024校招后端开发面试题进行深入分析，包括数据结构与算法、编程语言基础、后端技术栈、微服务架构、系统设计与优化等方面的面试题。通过详细解析这些面试题，帮助读者理解解题思路，提升后端开发面试技能。字节跳动2024校招后端开发面试背景字节跳动（ByteDance）是中国领先的
JAVA排序荔枝吃吃 java 排序算法算法
1.冒泡排序/***使用冒泡排序算法对整数数组进行排序*冒泡排序是一种简单的排序算法，它重复地遍历要排序的数列，*一次比较两个元素，如果它们的顺序错误就把它们交换过来*遍历数列的工作是重复地进行直到没有再需要交换，也就是说该数列已经排序完成*这个算法的名字由来是因为越小（或越大）的元素会经过交换慢慢“浮”到数列的顶端**@paramarr待排序的整数数组*/publicstaticvoidbubb
数据结构与算法--实现链表的复制(链表中节点比较特殊,含有一个rand指针,指向任意一个节点) 请叫我大虾数据结构链表数据结构
已在leetcode上执行通过//https://leetcode.com/problems/copy-list-with-random-pointer/leetcode地址publicclassCopyListWithRandom{publicstaticclassNode{intval;Nodenext;Noderandom;publicNode(intval){this.val=val;th
【贪心算法1】 m0_46150269 贪心算法算法
力扣455.分发饼干链接:link思路尽可能让更多人吃到饼干并且尽可能少的造成浪费，大尺寸饼干能满足大胃口的人就应该优先分给大胃口的人。所以先将饼干和胃口大小排序，然后从后往前遍历。但是这时候又有一个问题，饼干和胃口哪个作为for循环哪个作为if呢？答案是只能胃口作为for，饼干作为if，因为for循环的i是固定每次移动，而饼干index只有满足条件才会移动。这里可以举一个反例，如果最大胃口大于最
贪心算法-移除K个数字我是你的春哥！贪心算法算法 java
1、题目描述给定一个以字符串表示的非负整数num，移除这个数中的k位数字，使得剩下的数字最小。注意：num的长度小于10002且≥k。num不会包含任何前导零。2、题目分析：题目简介明了，就是把给定的数字删除指定个数的数字使删除之后的数字是同等位数数字中最小的那个。但是需要注意的是，题目中给的数字是字符串的形式并且输出结果也是字符串的形式，这就涉及到字符串和数字之间的相互转化问题。题目中要求删除的
使用OpenCV和Python将图像读取为RGB UixnContext opencv python 人工智能 OpenCV
在计算机视觉和图像处理中，OpenCV是一个广泛使用的开源库，提供了许多功能强大的图像处理工具。其中一个常见的任务是将图像读取为RGB格式，以便进一步处理和分析。在本文中，我将向您展示如何使用OpenCV和Python来实现这个任务。首先，确保您已经安装了OpenCV库。您可以使用以下命令在Python中安装OpenCV：pipinstallopencv-python一旦安装完成，我们可以开始写代
贪心算法-字符串数组能拼接出的最小字典序(java) SP_1024 算法贪心算法算法 java
最小字典序的贪心算法题目描述贪心算法的解题思路贪心算法自定义比较器贪心算法暴力递归解法题目描述给定一个由字符串组成的数组strs，必须把所有的字符串拼接起来，返回所有可能的拼接结果中字典序最小的结果贪心算法的解题思路首先我们很自然的能想到,遍历数组,比较数组中每一个元素,字典序越小的,就放前面.但这里右一个陷阱,比如ba和b两个字符串,b的字典序小于ba,如果拼成bba就错了,显然bab字典序更小
量子算法：英译名、概念、历史、现状与展望？ lisw05 量子计算计算机科学技术
李升伟整理####英译名量子算法的英文为**QuantumAlgorithm**。####概念量子算法是利用量子力学原理（如叠加态、纠缠态和干涉）设计的算法，旨在通过量子计算机高效解决经典计算机难以处理的问题。其核心在于利用量子比特（qubit）的并行计算能力，显著提升计算效率。####历史1.**1980年代**：RichardFeynman提出量子计算概念，认为量子计算机可以模拟经典计算机无法
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh [email protected] 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_