xdpcxq1029

DFA算法在敏感词过滤的应用

相信大家对于游戏里聊天框的以下内容已经不陌生了

"我***"
“你真牛*”
“你是不是傻*”

一个垃圾的游戏环境是非常影响玩游戏的心情的，看到这些，就知道游戏已经帮我们屏蔽掉了那些屏蔽字了，对于玩游戏而言，心里会好受很多。敏感词识别对于游戏的重要性不言而喻。当然，除了游戏，也有很多业务场景可能需要敏感词检测，如果你接到这样一个需求的时候，你会怎么做？*

一、原生API

作为Java程序员，我的第一反应，一定是使用jdk原生的String类提供的contain或replace方法来进行包含判断或字符替换，这是最简单直接的方式。那我们就来看看String的实现方式：

contains

String在java中以char数组形式存储，而String.contains的实现，实际上是对数组的遍历查找匹配

	`// 最终调用方法`
	`static int indexOf(char[] source, int sourceOffset, int sourceCount,`
	`char[] target, int targetOffset, int targetCount,`
	`int fromIndex) {`
	`// ...`
	`}`

replace

String.replace有4个接口，实现为正则匹配替换或直接遍历替换

	`public String replace(char oldChar, char newChar) {`
	`// 直接进行字符串遍历，替换第一个匹配的字符串`
	`}`
	`public String replace(CharSequence target, CharSequence replacement) {`
	`// 创建Pattern，使用LITERAL模式进行正则匹配替换replaceAll`
	`// 当设置LITERAL标志时，输入字符串中的所有字符都被视为普通字符。`
	`// 这意味着正则表达式的特殊字符，如点号（.）、星号（*）、加号（+）等，都将失去它们在正则表达式中的特殊意义，被直接视为普通字符。`
	`}`
	`public String replaceAll(String regex, String replacement) {`
	`// 创建Pattern，使用正则表达式模式匹配替换replaceAll`
	`}`
	`public String replaceFirst(String regex, String replacement) {`
	`// 创建Pattern，使用正则表达式模式匹配替换replaceFirst，仅替换第一个匹配的字符串`
	`}`

通过jdk提供的String源码我们可以得到以下结果：

使用contains方法进行包含判断，它的底层实现原理其实就是通过遍历目标字符串的字符数组进行挨个匹配；少量敏感词检测的时候是可行的，但如果目标字符串很大，并且要匹配的敏感词足够多的时候，它的遍历匹配效率是很低的。
replace则分两种实现，其中一种是类似contains方法，也是进行对目标字符串进行字符数组的遍历替换。
replace的另一种实现，是通过java的正则表达式去做匹配，正则匹配相比于遍历匹配，效率上不会有明显提升，但对于复杂模式的解析匹配会有比较明显的优势

其他语言的字符串操作API大同小异，具体看源码的实现方式

二、正则表达式

另外一种我们能想到的方式就是进行正则表达式的匹配了。前面提到，在java中如果使用String的api，它有部分接口就是使用正则表达式来实现的。
使用正则表达式有一定优势，也有一定缺陷。这就不得不提正则表达式的实现原理：FA（Finite Automaton：有限自动机）

DFA与NFA

FA又分为DFA和NFA，我们以正则ab|ac举例

NFA（Nondeterministic finite automaton：非确定性有限状态自动机）
在NFA中表达式会构建为以下结构
- 非确定性：对于给定的输入符号，NFA可以从一个状态转移到多个状态。这意味着存在多种可能的状态转换路径，NFA在任何时间点都可以处于多个状态。
- 回溯：由于NFA在处理输入时可以选择多条路径，因此可能需要回溯。当某条路径未能达到接受状态时，NFA会返回并尝试其他可能的路径。
- 构造：NFA相对容易构造，特别是对于复杂的或包含多种可能的语言（例如正则表达式）。
- 运行效率：由于其非确定性特性，NFA在运行时可能需要更多的计算资源，特别是在处理长输入字符串时。
DFA（Deterministic finite automaton：确定性有限自动机）
在DFA中表达式会构建为以下结构
- 确定性：对于给定的输入符号，DFA从一个状态转移到另一个唯一确定的状态。这意味着DFA在任何时间点只能处于一个状态。
- 无回溯：由于每个输入符号只对应一个状态转换，DFA在处理输入时不需要回溯。
- 构造：相对于NFA，DFA可能更难直接构造，特别是对于复杂的语言，但它可以通过从NFA转换得到。
- 运行效率：DFA在运行时通常更高效，因为它在处理输入时不需要考虑多种可能的状态路径。

理论上，NFA和DFA等效，它们都可以识别相同的语言类型。但在实际应用中，它们各有优势：NFA更适合于表示和构造复杂模式，而DFA在执行时更高效。

如果以上描述不能理解，这里其实可以做个不是特别恰当的比喻：广度优先搜索BFS和深度优先搜索DFS。

NFA可以转移到多个不同的状态。这就像是在图中有多条边从一个节点出发一样。如果将NFA的操作类比为一种搜索算法，它更接近于广度优先搜索（BFS）。在匹配过程中，NFA可以同时探索多条路径（或状态转换），就像BFS在搜索时会先访问所有邻接节点。然而，NFA通常不会存储所有可能的状态转换路径，而是在运行时动态生成它们。

DFA只能转移到一个唯一确定的状态。这就像是图中的每个节点仅有一条出边一样。尽管DFA在每一步只选择一条路径，但将其类比为深度优先搜索（DFS）并不准确。DFS是一种搜索算法，用于探索所有可能的路径直到它达到目标或结束条件。DFA则是一种确定性的状态机，它不需要“搜索”；它只是在状态之间单一确定地转换。

在正则表达式的实现中，有的基于DFA，有的基于NFA；尽管DFA的搜索路径比NFA短，但实际场景中，NFA更适合复杂模式的正则搜索。因此大多数正则实现还是基于NFA。
java中的正则表达式是基于NFA的实现

使用局限

当然了，正则表达式的实现到底是NFA还是DFA，并不是今天讨论的重点。

资源消耗
无论是NFA还是DFA，它们在匹配之前，都会先构造基于图的数据结构，因此，使用正则表达式进行敏感词匹配，一定逃不开构建这个数据结构的性能消耗和内存占用。
回溯陷阱
在使用正则表达式进行敏感词匹配时，如果是基于NFA实现的正则算法，则很有可能出现回溯陷阱。上面提到NFA在匹配时是会进行回溯的，因为它不知道后面有没有可能还会匹配成功，但是DFA从一开始就是确定的有限自动机，DFA是知道所有的匹配成功的情况，所以在使用NFA时，如果表达式写的不注意，很可能出现大量回溯。这样大量的回溯很可能造成在进行正则表达式的匹配时，CPU会飚高的情况。

解决方案

资源消耗很好解决：对于服务器来说，只需要在启动服务器之前，对配置好的敏感词做好正则表达式的初始化即可，即便是需要灵活配置，也可以通过动态加载再进行内存替换来解决。
要解决NFA回溯问题，也有很多方式：比如表达式中尽可能提取公共部分、适当拆分、不要量词嵌套、使用非贪婪模式等多种优化手段。这些优化手段都是从表达式本身入手，这意味着所有人在编写敏感词匹配的正则表达式时，都需要时刻注意回溯陷阱，并且对每一个表达式都要做好性能测试。

如果注意好以上点，使用正则表达式进行敏感词匹配在业务场景中也是可行的。甚至于对于复杂语义的敏感词配置来说，只有正则表达式能实现需求

三、DFA

上文中其实已经提到，相比于NFA的不确定性，DFA是具有确定性的有限自动机。它之所以具有确定性，从结构上来说，它的每一个状态都只对应一个状态转换，因此它也无需进行回溯，因此它的匹配性能也比NFA要高。

当然了DFA的缺点就是它很难处理复杂的语义。但是对于敏感词来说，为了效率，我们其实可以把那些复杂的语义简单化；另外一个和正则匹配一样的点，就是构建DFA有向图所带来的开销和内存占用，这一点也能通过服务器启动加载和动态内存替换解决。
所以其实一旦我们解决掉DFA的痛点，便能扬长避短，既享受DFA高效率，又使其能胜任业务场景。

不过需要注意的是，这里我们就不再使用正则表达式进行敏感词匹配了，而是直接实现一套基于DFA的敏感词匹配算法。你可能会有疑问，既然正则表达式也可以使用DFA，那我们为什么不使用基于DFA的正则表达式呢？
这也很好理解，使用正则表达式，我们只能把每一条表达式单独构建成一个个图的数据结构，它的粒度只能到每一条表达式。而我们自己实现DFA，则可以把所有的敏感词全部构建成同一个大的DFA图，它维度则是全服所有敏感词。这样既可以省去一定的内存空间，也可以减少匹配次数。

使用原理

使用DFA来实现敏感词匹配的原理，其实是在初始化时，把所有的敏感词拆成一个个的字，然后组织成一个很大的有向图的结构。其实也是用到编程思想中的空间换时间思想。比如有以下敏感词：

打死你
打死他
打他
揍他
经过DFA的树组织，最终会得到以下结构：

其中，绿色的Entry代表入口节点，而蓝色的代表中止节点，当玩家输入一句话时，会通过遍历玩家发的每一个字，再去这个DFA有向图中去匹配
如果玩家发送“我要揍他”，那么“揍他”两个字就能通过“Entry->揍->他”这样的路径匹配上
如果玩家发送“我要揍你”，那么“揍”字能通过“Entry->揍”这样的路径匹配上，但因为“揍”不是中止节点，所以这句话不能算敏感词

逻辑实现

1. DFA初始化

这一步作用是构建DFA图

	`public boolean initialize(String[] keyWords) {`
	`clear();`
	`// 构造DFA`
	`for (int s = 0; s < keyWords.length; s++) {`
	`String _keyword = keyWords[s];`
	`if (_keyword == null \|\| (_keyword = _keyword.trim()).length() == 0) {`
	`continue;`
	`}`
	`char[] patternTextArray = _keyword.toCharArray();`
	`DFANode currentDFANode = dfaEntrance;`
	`for (int i = 0; i < patternTextArray.length; i++) {`
	`final char _c = patternTextArray[i];`
	`// 逐点加入DFA`
	`final Character _lc = toLowerCaseWithoutConfict(_c);`
	`DFANode _next = currentDFANode.dfaTransition.get(_lc);`
	`if (_next == null) {`
	`_next = new DFANode();`
	`currentDFANode.dfaTransition.put(_lc, _next);`
	`}`
	`currentDFANode = _next;`
	`}`
	`if (currentDFANode != dfaEntrance) {`
	`currentDFANode.isTerminal = true;`
	`}`
	`}`

	`buildFailNode();`
	`return true;`
	`}`

2. DFA匹配检测

匹配字检测，一旦检测到中止节点，则返回true

	`public boolean contain(final String inputMsg) {`
	`char[] input = inputMsg.toCharArray();`
	`DFANode currentDFANode = dfaEntrance;`
	`DFANode _next = null;`
	`for (int i = 0; i < input.length; i++) {`
	`final Character _lc = this.toLowerCaseWithoutConfict(input[i]);`
	`if (!isIgnore(_lc)) {`
	`_next = currentDFANode.dfaTransition.get(_lc);`
	`while (_next == null && currentDFANode != dfaEntrance) {`
	`currentDFANode = currentDFANode.failNode;`
	`_next = currentDFANode.dfaTransition.get(_lc);`
	`}`
	`}`
	`if (_next != null) {`
	`// 找到状态转移，可继续`
	`currentDFANode = _next;`
	`}`
	`// 看看当前状态可退出否`
	`if (currentDFANode.isTerminal) {`
	`// 可退出，记录，可以替换到这里`
	`return true;`
	`}`
	`}`

	`return false;`
	`}`

3. DFA字符替换

根据节点搜索匹配，走到中止节点则回溯依次替换

	`public String filt(String s) {`
	`char[] input = s.toCharArray();`
	`char[] result = s.toCharArray();`
	`boolean _filted = false;`

	`DFANode currentDFANode = dfaEntrance;`
	`DFANode _next = null;`
	`int replaceFrom = 0;`
	`int ignoreLength = 0;`
	`boolean endIgnore = false;`
	`for (int i = 0; i < input.length; i++) {`
	`final Character _lc = this.toLowerCaseWithoutConfict(input[i]);`
	`_next = currentDFANode.dfaTransition.get(_lc);`
	`while (_next == null && !isIgnore(_lc) && currentDFANode != dfaEntrance) {`
	`currentDFANode = currentDFANode.failNode;`
	`_next = currentDFANode.dfaTransition.get(_lc);`
	`}`
	`if (_next != null) {`
	`// 找到状态转移，可继续`
	`currentDFANode = _next;`
	`if(currentDFANode.level == 1) {`
	`ignoreLength = 0;`
	`}`
	`}`
	`if (!endIgnore && currentDFANode != dfaEntrance && isIgnore(_lc)) {`
	`ignoreLength++;`
	`}`
	`// 看看当前状态可退出否`
	`if (currentDFANode.isTerminal) {`
	`endIgnore = true;`
	`// 可退出，记录，可以替换到这里`
	`int j = i - (currentDFANode.level - 1) - ignoreLength;`
	`if (j < replaceFrom) {`
	`j = replaceFrom;`
	`}`
	`replaceFrom = i + 1;`
	`for (; j <= i; j++) {`
	`result[j] = this.subChar;`
	`_filted = true;`
	`}`
	`currentDFANode = dfaEntrance;`
	`ignoreLength = 0;`
	`endIgnore = false;`
	`}`
	`}`
	`if (_filted) {`
	`return String.valueOf(result);`
	`} else {`
	`return s;`
	`}`
	`}`

怎么选择

使用原生api进行遍历匹配在数据达到一定量级时一定会有性能问题的，一般不采用这种方式。
使用正则表达式优势在于灵活配置，但需注意回溯陷阱问题；正则表达式预编译会占用一定内存空间。
使用DFA在简单确定的语义中优势明显，但难以处理复杂语义；DFA初始化构建有向图会占用内存空间，一般敏感词数量是会达到二三十万的量级的，有向图大小会达到M级别，好在现在内存并不值钱，空间换时间是一个可取的办法。

DFA应用场景

编译器设计：DFA常用于词法分析器，用于识别关键字、运算符、标识符等
字符串搜索和匹配：常用于字符串匹配算法，比如文本编辑器，敏感词等
网络安全检测：DFA用快速识别恶意流量模式
自然语言（NPL）处理：用于文本分析和处理任务
正则表达式引擎：虽然很多正则表达式引擎基于非确定性有限自动机（NFA），但也有一些引擎或工具使用DFA来提高匹配效率，特别是在匹配简单模式时
更多...

C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
Leetcode 148. 排序链表
文章目录前引题目代码（首刷看题解）代码（8.9二刷部分看解析）代码（9.15三刷部分看解析）前引综合性比较强的一道题，要求时间复杂度必须O(logn)才能通过，最适合链表的排序算法就是归并。这里采用自顶向下的方法步骤：找到链表中点（双指针）对两个子链表排序(递归，直到只有一个结点，记得将子链表最后指向nullptr）归并（引入dummy结点）题目Leetcode148.排序链表代码（首刷看题解）c
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
LeetCode算法题：电话号码的字母组合吱屋猪_ 算法 leetcode java
题目描述：给定一个仅包含数字2-9的字符串，返回所有它能表示的字母组合。答案可以按任意顺序返回。给出数字到字母的映射如下（与电话按键相同）。注意1不对应任何字母。2->"abc"3->"def"4->"ghi"5->"jkl"6->"mno"7->"pqrs"8->"tuv"9->"wxyz"例如，给定digits="23"，返回["ad","ae","af","bd","be","bf","cd
CentOS7环境卸载MySQL5.7 Hadoop_Liang mysql 数据库 mysql
备份重要数据切记，卸载之前先备份mysql重要的数据。备份一个数据库例如：备份名为mydatabase的数据库到backup.sql的文件中mysqldump-uroot-ppassword123mydatabase>backup.sql备份所有数据库mysqldump-uroot-ppassword123--all-databases>all_databases_backup.sql注意：-p后
php SPOF 贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.什么是单点故障（SPOF）？单点故障指的是系统中某个组件一旦失效，整个系统或服务就会不可用。常见的单点有：数据库、缓存、Web服务器、负载均衡、网络设备等。2.常见单点故障场景只有一台数据库服务器，宕机后所有业务不可用只有一台Redis缓存，挂掉后缓存全部失效只有一台Web服务器，挂掉后网站无法访问只有一个负载均衡节点，挂掉后流量无法分发只有一条网络链路，断开后所有服务失联3.消除单点故障的主
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
centos7安装 mysql5.7(安装包) heiPony linux mysql mariadb centos mysql
一.卸载centos7自带数据库查看系统自带的Mariadbrpm-qa|grepmariadbmariadb-libs-5.5.44-2.el7.centos.x86_64卸载rpm-e--nodepsmariadb-libs-5.5.44-2.el7.centos.x86_64删除etc目录下的my.cnfrm/etc/my.cnf二.检查mysql是否存在(有就卸载,删除相关文件)rpm-q
MySQL Explain 详解：从入门到精通，让你的 SQL 飞起来
引言：为什么Explain是SQL优化的“照妖镜”？在Java开发中，我们常常会遇到数据库性能瓶颈的问题。一条看似简单的SQL语句，在数据量增长到一定规模后，可能会从毫秒级响应变成秒级甚至分钟级响应，直接拖慢整个应用的性能。此时，你是否曾困惑于：为什么这条SQL突然变慢了？索引明明建了，为什么没生效？到底是哪里出了问题？答案就藏在MySQL的EXPLAIN命令里。EXPLAIN就像一面“照妖镜”，
Linux/Centos7离线安装并配置MySQL 5.7 有事开摆无事百杜同学 LInux/CentOS7 linux mysql 运维
Linux/Centos7离线安装并配置MySQL5.7超详细教程一、环境准备1.下载MySQL5.7离线包2.使用rpm工具卸载MariaDB（避免冲突）3.创建系统级别的MySQL专用用户二、安装与配置1.解压并重命名MySQL目录2.创建数据目录和配置文件3.设置目录权限4.初始化MySQL5.配置启动脚本6.配置环境变量三、启动与验证1.启动MySQL服务2.获取初始密码3.登录并修改密码
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求可曾去过倒悬山 java 前端架构
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求三年经验是Java程序员的分水岭，技术栈深度决定你成为“业务码农”还是“架构师候选人”。本文整合阿里、美团、滴滴等大厂招聘要求，为你绘制可落地的进阶路线。一、Java核心：从语法糖到JVM底层三年经验与初级的核心差异在于系统级理解，大厂面试常考以下能力：JVM与性能调优内存模型（堆外内存、元空间）、GC算法（G1/ZGC适用场
被动降噪的概念及编程实现 CodeByte 人工智能算法 javascript 编程
被动降噪是指通过编程技术和算法，对输入的数据进行处理，以减少或消除其中的噪声。噪声可以是各种形式的干扰，例如来自传感器、通信信号或其他外部源的干扰。在本文中，我们将探讨被动降噪的意义以及如何使用编程来实现这一目标。被动降噪的意义：噪声对数据的准确性和可靠性产生负面影响。在许多应用领域，例如图像处理、音频处理和信号处理中，噪声的存在可能导致数据质量下降，使得后续的分析和处理变得困难。因此，被动降噪技
传统检测响应慢？陌讯多模态引擎提速90+FPS实战 2501_92473147 算法计算机视觉目标检测
开篇痛点：实时目标检测在安防监控中的核心挑战在安防监控领域，实时目标检测是保障公共安全的关键技术。然而，传统算法如YOLOv5或开源框架MMDetection常面临两大痛点：误报率高（复杂光照或遮挡场景下检测不稳定）和响应延迟（高分辨率视频流处理FPS低于30）。实测数据显示，城市交通监控系统误报率达15%，导致安保资源浪费；客户反馈表明，延迟超100ms时，目标跟踪可能失效。这些问题源于算法泛化
反光衣识别漏检率 30%？陌讯多尺度模型实测优化
在建筑工地、交通指挥等场景中，反光衣是保障作业人员安全的重要装备，对其进行精准识别是智能监控系统的核心功能之一。但传统视觉算法在实际应用中却屡屡碰壁：强光下反光衣易与背景混淆、远距离小目标漏检率高达30%、复杂场景下模型泛化能力不足[实测数据来源：某智慧工地项目2024年Q1日志]。这些问题直接导致安全监控系统预警滞后，给安全生产埋下隐患。一、技术解析：反光衣识别的核心难点与陌讯算法创新反光衣识别
【GESP】C++三级真题 luogu-B4359 [GESP202506 三级] 分糖果 CoderCodingNo GESP c++java 开发语言
GESPC++三级，2025年6月真题，模拟算法，难度★★☆☆☆。本次三级题目个人感觉比较简单。题目题解详见：【GESP】C++三级真题luogu-B4359[GESP202506三级]分糖果|OneCoder【GESP】C++三级真题luogu-B4359[GESP202506三级]分糖果|OneCoderGESPC++三级，2025年6月真题，模拟算法，难度★★☆☆☆。本次三级题目个人感觉比较
自动化运维工程师面试题解析【真题】
ZabbixAgent默认监听的端口是A.10050。以下是关键分析：选项排除：C.80是HTTP默认端口，与ZabbixAgent无关。D.5432是PostgreSQL数据库的默认端口，不涉及ZabbixAgent。B.10051是ZabbixServer的默认监听端口，用于接收Agent发送的数据，而非Agent自身的监听端口。ZabbixAgent的配置：根据官方文档，ZabbixAgen
什么是OA系统？使用OA系统对企业有哪些好处？
OA系统（OfficeAutomationSystem），即办公自动化系统，是将现代化办公和计算机网络功能结合起来的一种新型的办公方式。是现代企业管理中一种重要的信息化工具，它通过计算机技术、网络技术和数据库技术等手段，实现企业内部办公流程的自动化和信息化管理。使企业的信息交流更加顺畅，办公流程更加高效，从而提高企业的运营效率和管理水平。一、主要功能1.文档管理文档存储与检索：OA系统可以集中存储
【华为机试】HJ61 放苹果不爱熬夜的Coder 算法华为机试 golang 华为 golang 算法面试
文章目录HJ61放苹果描述输入描述输出描述示例1示例2解题思路算法分析问题本质分析状态定义与转移递推关系详解动态规划表构建算法流程图示例推导过程代码实现思路时间复杂度分析关键优化点边界情况处理递归解法对比实际应用场景测试用例分析算法特点数学原理完整题解代码HJ61放苹果描述我们需要将m个相同的苹果放入n个相同的盘子中，允许有的盘子空着不放。求解有多少种不同的分法。输入描述输入两个整数m,n(0B[
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
Flutter——数据库Drift开发详细教程(七) 怀君 flutter flutter 数据库
目录入门设置漂移文件入门变量数组定义表支持的列类型漂移特有的功能导入嵌套结果LIST子查询Dart互操作SQL中的Dart组件类型转换器现有的行类Dart文档注释结果类名称支持的语句自定义SQL类型定义类型使用自定义类型在Dart中在SQL中方言意识支持的SQLite扩展json1fts5地缘垄断自定义查询带有生成的api的语句自定义选择语句自定义更新语句入门Drift提供了一个dart_api来
android中百度定位、城市选择列表，右侧字母展示
好久好久没光顾过自己空空的博客了，做项目的时候都是逛着别人的博客急着把功能实现，近来闲下来了总结总结。这个城市选择功能也是当时做项目急着实现从哪找来的框架不记得了，然后改改用到项目中来的。非常感谢提供最初源码的博主，主要的区别是添加了搜索功能、定位功能，把以前的操作本地数据库sqlite的部分，改为操作对assest文件的操作，封装的有百度地图定位方法、可删除的edittext。百度地图的key需
.NET中的安全性之数字签名、数字证书、强签名程序集、反编译 hezudao25 NET .net assembly 加密算法 reference header
本文将探讨数字签名、数字证书、强签名程序集、反编译等以及它们在.NET中的运用（一些概念并不局限于.NET在其它技术、平台中也存在）。1.数字签名数字签名又称为公钥数字签名，或者电子签章等，它借助公钥加密技术实现。数字签名技术主要涉及公钥、私钥、非对称加密算法。1.1公钥与私钥公钥是公开的钥匙，私钥则是与公钥匹配的严格保护的私有密钥；私钥加密的信息只有公钥可以解开，反之亦然。在VisualStud
Flutter——数据库Drift开发详细教程之迁移(九) 怀君 flutter flutter 数据库
迁移入门引导式迁移配置用法例子切换到make-migrations开发过程中手动迁移迁移后回调导出模式导出架构下一步是什么？调试导出架构的问题修复这个问题架构迁移助手自定义分步迁移转向逐步迁移手动生成测试迁移编写测试验证数据完整性在运行时验证数据库模式迁移器API一般提示迁移视图、触发器和索引复杂的迁移更改列的类型更改列约束删除列重命名列合并列添加新列入门Drift通过严格的架构确保查询类型安全。
windows下源码安装golang 616050468 golang安装 golang环境 windows
系统： 64位win7，开发环境：sublime text 2， go版本： 1.4.1 1. 安装前准备(gcc, gdb, git) golang在64位系
redis批量删除带空格的key bylijinnan redis
redis批量删除的通常做法： redis-cli keys "blacklist*" | xargs redis-cli del 上面的命令在key的前后没有空格时是可以的，但有空格就不行了： $redis-cli keys "blacklist*" 1) "blacklist:12: [email protected]
oracle正则表达式的用法 0624chenhong oracle 正则表达式
方括号表达示方括号表达式描述 [[:alnum:]] 字母和数字混合的字符 [[:alpha:]] 字母字符 [[:cntrl:]] 控制字符 [[:digit:]] 数字字符 [[:graph:]] 图像字符 [[:lower:]] 小写字母字符 [[:print:]] 打印字符 [[:punct：]] 标点符号字符 [[:space:]]
2048源码(核心算法有，缺少几个anctionbar，以后补上) 不懂事的小屁孩 2048
2048游戏基本上有四部分组成， 1：主activity，包含游戏块的16个方格，上面统计分数的模块 2：底下的gridview，监听上下左右的滑动，进行事件处理， 3：每一个卡片，里面的内容很简单，只有一个text，记录显示的数字 4：Actionbar，是游戏用重新开始，设置等功能(这个在底下可以下载的代码里面还没有实现) 写代码的流程 1：设计游戏的布局，基本是两块，上面是分
jquery内部链式调用机理换个号韩国红果果 JavaScript jquery
只需要在调用该对象合适(比如下列的setStyles)的方法后让该方法返回该对象（通过this 因为一旦一个函数称为一个对象方法的话那么在这个方法内部this（结合下面的setStyles）指向这个对象） function create(type){ var element=document.createElement(type); //this=element;
你订酒店时的每一次点击背后都是NoSQL和云计算蓝儿唯美 NoSQL
全球最大的在线旅游公司Expedia旗下的酒店预订公司，它运营着89个网站，跨越68个国家，三年前开始实验公有云，以求让客户在预订网站上查询假期酒店时得到更快的信息获取体验。云端本身是用于驱动网站的部分小功能的，如搜索框的自动推荐功能，还能保证处理Hotels.com服务的季节性需求高峰整体储能。 Hotels.com的首席技术官Thierry Bedos上个月在伦敦参加“2015 Clou
java笔记1 a-john java
1，面向对象程序设计（Object-oriented Propramming，OOP）：java就是一种面向对象程序设计。 2，对象：我们将问题空间中的元素及其在解空间中的表示称为“对象”。简单来说，对象是某个类型的实例。比如狗是一个类型，哈士奇可以是狗的一个实例，也就是对象。 3，面向对象程序设计方式的特性： 3.1 万物皆为对象。
C语言 sizeof和strlen之间的那些事 C/C++软件开发求职面试题必备考点（一） aijuans C/C++求职面试必备考点
找工作在即，以后决定每天至少写一个知识点，主要是记录，逼迫自己动手、总结加深印象。当然如果能有一言半语让他人收益，后学幸运之至也。如有错误，还希望大家帮忙指出来。感激不尽。后学保证每个写出来的结果都是自己在电脑上亲自跑过的，咱人笨，以前学的也半吊子。很多时候只能靠运行出来的结果再反过来
程序员写代码时就不要管需求了吗？ asia007 程序员不能一味跟需求走
编程也有2年了，刚开始不懂的什么都跟需求走，需求是怎样就用代码实现就行，也不管这个需求是否合理，是否为较好的用户体验。当然刚开始编程都会这样，但是如果有了2年以上的工作经验的程序员只知道一味写代码，而不在写的过程中思考一下这个需求是否合理，那么，我想这个程序员就只能一辈写敲敲代码了。我的技术不是很好，但是就不代
Activity的四种启动模式百合不是茶 android 栈模式启动 Activity的标准模式启动栈顶模式启动单例模式启动
android界面的操作就是很多个activity之间的切换,启动模式决定启动的activity的生命周期 ; 启动模式xml中配置 <activity android:name=".MainActivity" android:launchMode="standard&quo
Spring中@Autowired标签与@Resource标签的区别 bijian1013 java spring @Resource @Autowired @Qualifier
Spring不但支持自己定义的@Autowired注解，还支持由JSR-250规范定义的几个注解，如：@Resource、 @PostConstruct及@PreDestroy。 1. @Autowired @Autowired是Spring 提供的，需导入 Package:org.springframewo
Changes Between SOAP 1.1 and SOAP 1.2 sunjing Changes Enable SOAP 1.1 SOAP 1.2
JAX-WS SOAP Version 1.2 Part 0: Primer (Second Edition) SOAP Version 1.2 Part 1: Messaging Framework (Second Edition) SOAP Version 1.2 Part 2: Adjuncts (Second Edition) Which style of WSDL
【Hadoop二】Hadoop常用命令 bit1129 hadoop
以Hadoop运行Hadoop自带的wordcount为例， hadoop脚本位于/home/hadoop/hadoop-2.5.2/bin/hadoop，需要说明的是，这些命令的使用必须在Hadoop已经运行的情况下才能执行 Hadoop HDFS相关命令 hadoop fs -ls 列出HDFS文件系统的第一级文件和第一级
java异常处理（初级）白糖_ java DAO spring 虚拟机 Ajax
从学习到现在从事java开发一年多了，个人觉得对java只了解皮毛，很多东西都是用到再去慢慢学习，编程真的是一项艺术，要完成一段好的代码，需要懂得很多。最近项目经理让我负责一个组件开发，框架都由自己搭建，最让我头疼的是异常处理，我看了一些网上的源码，发现他们对异常的处理不是很重视，研究了很久都没有找到很好的解决方案。后来有幸看到一个200W美元的项目部分源码，通过他们对异常处理的解决方案，我终
记录整理-工作问题 braveCS 工作
1）那位同学还是CSV文件默认Excel打开看不到全部结果。以为是没写进去。同学甲说文件应该不分大小。后来log一下原来是有写进去。只是Excel有行数限制。那位同学进步好快啊。 2）今天同学说写文件的时候提示jvm的内存溢出。我马上反应说那就改一下jvm的内存大小。同学说改用分批处理了。果然想问题还是有局限性。改jvm内存大小只能暂时地解决问题，以后要是写更大的文件还是得改内存。想问题要长远啊
org.apache.tools.zip实现文件的压缩和解压，支持中文 bylijinnan apache
刚开始用java.util.Zip，发现不支持中文（网上有修改的方法，但比较麻烦）后改用org.apache.tools.zip org.apache.tools.zip的使用网上有更简单的例子下面的程序根据实际需求，实现了压缩指定目录下指定文件的方法 import java.io.BufferedReader; import java.io.BufferedWrit
读书笔记-4 chengxuyuancsdn 读书笔记
1、JSTL 核心标签库标签 2、避免SQL注入 3、字符串逆转方法 4、字符串比较compareTo 5、字符串替换replace 6、分拆字符串 1、JSTL 核心标签库标签共有13个，学习资料：http://www.cnblogs.com/lihuiyy/archive/2012/02/24/2366806.html 功能上分为4类： (1)表达式控制标签：out
[物理与电子]半导体教材的一个小问题 comsci 问题
各种模拟电子和数字电子教材中都有这个词汇-空穴书中对这个词汇的解释是; 当电子脱离共价键的束缚成为自由电子之后,共价键中就留下一个空位,这个空位叫做空穴我现在回过头翻大学时候的教材,觉得这个
Flashback Database --闪回数据库 daizj oracle 闪回数据库
Flashback 技术是以Undo segment中的内容为基础的，因此受限于UNDO_RETENTON参数。要使用flashback 的特性，必须启用自动撤销管理表空间。在Oracle 10g中， Flash back家族分为以下成员： Flashback Database， Flashback Drop，Flashback Query(分Flashback Query,Flashbac
简单排序:插入排序 dieslrae 插入排序
public void insertSort(int[] array){ int temp; for(int i=1;i<array.length;i++){ temp = array[i]; for(int k=i-1;k>=0;k--)
C语言学习六指针小示例、一维数组名含义，定义一个函数输出数组的内容 dcj3sjt126com c
# include <stdio.h> int main(void) { int * p; //等价于 int *p 也等价于 int* p; int i = 5; char ch = 'A'; //p = 5; //error //p = &ch; //error //p = ch; //error p = &i; //
centos下php redis扩展的安装配置3种方法 dcj3sjt126com redis
方法一 1.下载php redis扩展包代码如下复制代码 #wget http://redis.googlecode.com/files/redis-2.4.4.tar.gz 2 tar -zxvf 解压压缩包，cd /扩展包（进入扩展包然后运行phpize 一下是我环境中phpize的目录，/usr/local/php/bin/phpize (一定要
线程池(Executors) shuizhaosi888 线程池
在java类库中，任务执行的主要抽象不是Thread，而是Executor，将任务的提交过程和执行过程解耦 public interface Executor { void execute(Runnable command); } public class RunMain implements Executor{ @Override pub
openstack 快速安装笔记 haoningabc openstack
前提是要配置好yum源版本icehouse，操作系统redhat6.5 最简化安装，不要cinder和swift 三个节点 172 control节点keystone glance horizon 173 compute节点nova 173 network节点neutron control /etc/sysctl.conf net.ipv4.ip_forward =
从c面向对象的实现理解c++的对象（二） jimmee C++面向对象虚函数
1. 类就可以看作一个struct，类的方法，可以理解为通过函数指针的方式实现的，类对象分配内存时，只分配成员变量的，函数指针并不需要分配额外的内存保存地址。 2. c++中类的构造函数，就是进行内存分配(malloc)，调用构造函数 3. c++中类的析构函数，就时回收内存(free) 4. c++是基于栈和全局数据分配内存的，如果是一个方法内创建的对象，就直接在栈上分配内存了。专门在
如何让那个一个div可以拖动 lingfeng520240 html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml
第10章高级事件（中） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
计算两个经纬度之间的距离 roadrunners 计算纬度 LBS 经度距离
要解决这个问题的时候，到网上查了很多方案，最后计算出来的都与百度计算出来的有出入。下面这个公式计算出来的距离和百度计算出来的距离是一致的。 /** * * @param longitudeA * 经度A点 * @param latitudeA * 纬度A点 * @param longitudeB *
最具争议的10个Java话题 tomcat_oracle java
1、Java8已经到来。什么！？ Java8 支持lambda。哇哦，RIP Scala！　　随着Java8 的发布，出现很多关于新发布的Java8是否有潜力干掉Scala的争论，最终的结论是远远没有那么简单。Java8可能已经在Scala的lambda的包围中突围，但Java并非是函数式编程王位的真正觊觎者。　　2、Java 9 即将到来　　 Oracle早在8月份就发布
zoj 3826 Hierarchical Notation(模拟) 阿尔萨斯 rar
题目链接：zoj 3826 Hierarchical Notation 题目大意：给定一些结构体，结构体有value值和key值，Q次询问，输出每个key值对应的value值。解题思路：思路很简单，写个类词法的递归函数，每次将key值映射成一个hash值，用map映射每个key的value起始终止位置，预处理完了查询就很简单了。这题是最后10分钟出的，因为没有考虑value为{}的情