山河罔顾

【数据结构与算法】-＞算法-＞字符串匹配基础（中）-＞BM算法-＞KMP 三倍性能的强大算法

字符串匹配基础（中）—— BM算法

- Ⅰ 前言
- Ⅱ BM 算法核心思想
- Ⅲ BM 算法原理分析
- - 1. 坏字符规则
  - 2. 好后缀规则
- Ⅳ BM 算法代码实现
- - 1. 坏字符规则
  - 2. 好后缀规则
  - 3. 代码完整实现
- Ⅴ BM 算法的性能分析及优化

Ⅰ 前言

文本编辑器的查找替换功能相信大家都不陌生，很多 IDE 像 Eclipse，IntelliJ，包括 Word，都有这个功能，把一个词统一替换成另一个。那这个功能是如何实现的呢？

如果用前一篇文章里的 BF 算法和 RK 算法，当然可以实现这个功能，但是在某些极端情况下，BF 算法性能会退化得比较严重，而 RK 算法需要用到哈希算法，但是设计出一个可以应对各种类型字符的哈希算法并不简单。

对于工业级的软件开发来说，我们希望算法尽可能的高效，并且在极端情况下，性能也不要退化得太严重。那么，对于查找功能是重要功能的软件来说，比如一些文本编辑器，它们的查找功能都是用哪种算法来实现的呢？有没有比 BF 算法和 RK 算法更加高效的字符串匹配算法呢？

这就引出了我们这篇文章要讲的一个算法，BM（Boyer-Moore） 算法。它是一种非常高效的字符串匹配算法，有实验统计，它的性能是著名的 KMP 算法的 3 到 4 倍。BM 算法的原理很复杂，比较难懂，我会在王争老师的课程的基础，再加上我的理解，希望能把这个算法讲得更清楚一点。

如果对 BF 算法和 RK 算法还不熟悉的同学，如果有兴趣，可以跳转到下面的链接去看看。

【数据结构与算法】-＞算法-＞字符串匹配基础（上）-＞BF 算法 & RK 算法

Ⅱ BM 算法核心思想

我们把模式串和主串的匹配过程，看作模式串在主串中不停地往后滑动。当遇到不匹配的字符时，BF 算法和 RK 算法的做法是，模式串往后滑动一位，然后从模式串的第一个字符开始重新匹配。如下面的这张图

在这个例子里，主串中的 c ，在模式串中是不存在的，所以，模式串向后滑动的时候，只要 c 与模式串有重合，肯定无法匹配。所以，我们可以一次性把模式串往后多滑动几位，把模式串移动到 c 的后面。

所以，当遇到不匹配的字符时，有什么固定的规律，可以将模式串往后多滑动几位呢？这样移动地越快，匹配的效率就更高了。

BM 算法本质上其实就是在寻找这种规律。借助这种规律，在模式串与主串匹配的过程中，当模式串和主串某个字符不匹配的时候，能够跳过一些肯定不会匹配的情况，将模式串往后多滑动几位。

Ⅲ BM 算法原理分析

BM 算法包括两部分，分别是 坏字符规则（bad character rule） 和 好后缀规则（good suffix shift）。我们分别来看一看。

1. 坏字符规则

前面讲的 BF 算法和 RK 算法，在匹配的过程中，都是按照模式串的下标从小到大的顺序，依次与主串中的字符进行匹配的。这种匹配顺序比较符合我们的思维习惯，但是 BM 算法的匹配顺序很特别，它是按照模式串下标从大到小，倒着匹配的。

BF 算法

BM 算法

我们从模式串的末尾倒着匹配，当我们发现某个字符没法匹配的时候，我们把这个字符叫作 坏字符（主串中的字符）。

我们拿坏字符 c 在模式串中查找，发现模式串中并不存在这个字符，也就是说，字符 c 与模式串中的任何字符都不可能匹配。这个时候，我们可以将模式串直接往后滑动三位，将模式串滑动到 c 后面的位置，再从模式串的末尾字符开始比较。

这个时候，我们发现，模式串中最后一个字符 d，还是无法和主串中的 a 匹配，这个时候，还能将模式串往后滑动三位吗？答案是不行的。因为这个时候，坏字符 a 在模式串中是存在的，模式串中下标是 0 的位置也是字符 a。这种情况下，我们可以将模式串往后滑动两位，让两个 a 上下对齐，然后再从模式串的末尾字符开始，重新匹配。

第一次匹配的时候，我们滑动了三位。第二次匹配的时候，我们滑动了两位。那具体滑动多少位，是不是可以总结出一个规律来？

当发生不匹配的时候，我们把坏字符对应的模式串中的字符下标记作 si。如果坏字符在模式串中存在，我们把这个坏字符在模式串中的下标记作 xi。如果不存在，我们把 xi 记作 -1。那么，模式串往后移动的位数就等于 si-xi。

这里还有一点需要注意，就是如果坏字符在模式串里多次出现，那我们在计算 xi 的时候，选择最靠后的那个，因为这样就不会让模式串滑动过多，导致本来可能匹配的情况被滑动略过。

利用坏字符规则，BM 算法在最好情况下的时间复杂度非常低，是 O(n/m) 。比如，主串是 aaabaaabaaabaaab，模式串是 aaaa。每次比对，模式串都可以直接后移四位，所以，匹配具有类似特点的模式串和主串的时候，BM 算法非常高效。

不过，单纯使用坏字符规则还不够，因为 si - xi 计算出来的移动位数，有可能是负数，比如主串是 aaaaaaaaaaaaaa，模式串是 baaa。第一次比对， si 也就是坏字符对应的模式串中的字符下标，所以就是 0（b 是坏字符）；xi 就是坏字符在模式串中的下标，也就是 3（字符多次出现，取靠后的）。因而 si - xi = -3 。

利用坏字符规则，BM 算法在最好情况下时间复杂度非常低，是 O(n/m)。比如，主串是 aaabaaabaaabaaab，模式串是 aaaa。每次比对，模式串都可以直接后移四位，所以，匹配具有类似特点的的模式串和主串的时候，BM 算法非常高效。

不过，单纯使用坏字符规则还是不够的。因为根据 si - xi 计算出来的移动次数，有可能是负数，不但不会向后滑动模式串，还有可能倒退，所以，BM 算法还需要用到 “好后缀规则”。

2. 好后缀规则

好后缀规则实际上跟坏字符规则的思路很类似，比如下面这张图。当模式串滑动到图中的位置的时候，模式串和主串有 2 个字符是匹配的，倒数第 3 个字符发生了不匹配的情况。

这个时候该如何滑动字符串呢？当然，我们还可以利用坏字符规则来计算模式串的滑动位数，但是坏字符规则正如我们上面所说不是时时刻刻都有效的，所以我们还需要使用好后缀规则，两个配合使用。

我们把已经匹配好的 b c 叫作好后缀，记作 {u}。我们拿它在模式串中查找，如果找到了另一个跟 {u} 相匹配的子串 {u*}，那我们就将模式串滑动到子串 {u*} 与主串中 {u} 对齐的位置。

如果在模式串中找不到另一个等于 {u} 的子串，我们就直接将模式串滑动到主串中 {u} 的后面，因为之前的任何一次往后滑动，都没有匹配主串中 {u} 的情况。

不过，当模式串中不存在等于 {u} 的子串的时候，我们直接将模式串滑动到主串 {u} 的后面，这样做会不会跳过头呢？我们看下面这种情况。这里面 b c 是好后缀，尽管在模式串中没有另外一个相匹配的子串 {u*}，但是如果我们将模式串移动到好后缀的后面，那就会错过模式串和主串可以匹配的情况。

如果好后缀在模式串中不存在可匹配的子串，那在我们一步一步往后滑动模式串的过程中，只要主串中 {u} 与模式串有重合，那就肯定无法完全匹配。但是当模式串滑动到前缀与主串中的 {u} 的后缀有部分重合的时候，并且重合的部分相等的时候，就有可能会存在完全匹配的情况。

这个说起来比较复杂，大家看图可能就明白了。

再进一步解释就是，在上一次配比的时候，已经发现了模式串中没有和主串好后缀可以匹配的子串，那模式串就要向后移动。这时候有个情况就是，模式串的中间的一部分和主串的好后缀重合了，那肯定是无法匹配的。因为模式串的头尾肯定和主串的子串不匹配，所以这种情况的重合就意义不大。

但什么情况下模式串的一部分和主串的后缀有重合才有意义呢？就是模式串的前缀子串和好后缀的后缀字串重合，这样如果后面也匹配的话，就是真的匹配了，就像我们上图举的合理滑动的例子。这个逻辑大家看看图仔细想想就可以想通了。

所以，针对这种情况，我们不仅要看好后缀在模式串中，是否有另一个匹配的子串，我们还要考察好后缀的后缀子串，是否存在跟模式串的前缀子串匹配的。

为了避免歧义，这里我再解释一下什么是前缀后缀子串。比如说有个字符串 s ，它的后缀子串就是最后一个字符和 s 对齐的子串。比如 abc 的后缀子串就是 c，bc。所谓前缀子串，就是起始字符和 s 对齐的子串，比如 abc 的前缀子串就是 a，ab。

我们要从好后缀的后缀子串中，找一个最长的并且能够跟模式串的前缀子串匹配的，假设是 {v}，然后将模式串滑动到如图所示的位置

这就是好后缀规则的基本原理。

那么模式串和主串中的某个字符不匹配的时候，如何选择用好后缀规则还是坏字符规则，来计算模式串往后滑动的位数呢？

我们前面说过，坏字符的移动位数可能会出现负数，除了这个情况意外，其他的移动都是安全的。这个安全就是指移动了以后，不会错过正确的字符串匹配。好后缀同样，也是安全的。所以在选择的时候，我们有一个处理原则，就是坏字符规则和好后缀规则的移动位数都进行一个计算，然后取两个数中最大的那个。因为按照我们最基本的思路，要使得每次出现不匹配字符时模式串移动的位数更大，这样查找起来就会更快。

因为好后缀规则不会出现移动位数是负数的情况，所以即使用坏字符规则算出来移动位数是负数，最后取得的移动位数也是正的，模式串会继续向后移动。

Ⅳ BM 算法代码实现

基础的思想和原理相信你看到这里已经明白了，现在我们就来实现 BM 算法。

我们一部分一部分来，先来实现坏字符规则。

1. 坏字符规则

坏字符规则本身并不难理解，当遇到坏字符时，要计算往后移动的位数 si - xi，其中 xi 的计算是重点。那我们如何求得 xi ，也就是坏字符在模式串中出现的位置呢？

如果我们拿坏字符，在模式串中顺序遍历查找，这样就会比较低效，势必影响这个算法的性能。为了追求更高的效率，我们可以用散列表。

对散列表有疑惑的同学可以跳转去看我的这篇文章

【数据结构与算法】-＞数据结构-＞散列表（上）-＞散列表的思想&散列冲突的解决

我们可以将模式串中的每个字符及其下标都存到散列表中，这样就可以快速找到坏字符在模式串的位置下标了。

关于这个散列表，我们只实现一种最简单的情况，假设字符串的字符集不是很大，每个字符长度是 1 字节，我们用大小为 256 的数组，来记录每个字符在模式串中出现的位置。数组的下标对应字符的 ASCII 码值，数组中存储这个字符在模式串中出现的位置。

如果将上面的过程写成代码，就是下面这个样子

	private static final int SIZE = 256; //ASCII码数
	
	/**
	 * 借助散列表，存储字符以及其在模式串中的位置
	 * 如果是同样的字符出现多次，就记录它在模式串中最后出现的位置
	 * @param patternString 模式串
	 * @param badChar 坏字符集
	 */
	private void generateBadChar(char[] patternString, int[] badChar) {
     
		for (int i = 0; i < SIZE; i++) {
     
			badChar[i] = -1;	//初始化badChar数组
		}
		for (int i = 0; i < patternString.length; i++) {
     
			int ascii = (int) patternString[i];
			badChar[ascii] = i;  //记录模式串中同一个字符最后出现的位置
		}
	}

badChar就是上面说的散列表，我们要借助它快速找到坏字符在模式串中的位置。

这里我再解释一下第二个 for 循环，我们遍历模式串，然后在badChar中记录字符出现在模式串中的下标，大家可以看到，如果是同样一个字符第二次出现，就会把上一次记录的位置覆盖掉，这样最后就记录的是这个字符在模式串中最后出现的位置。这也是为了安全性考虑，如果记录的是前面出现的位置，那移动的位数就会很大，就会有错过正确字符串匹配的风险。大家仔细想想应该可以想明白。

掌握了坏规则之后，我们先把 BM 算法的框架写好，只完成坏字符规则的部分，先不考虑好后缀规则和坏字符规则 si - xi 计算得到的移动位数可能为负数的情况。代码如下


	/**
	 * BM算法实现字符串匹配
	 * @param mainString 主串
	 * @param patternString 模式串
	 * @return 模式串在主串中的位置
	 */
	public static int boyerMoore(char[] mainString, char[] patternString) {
     
		int[] badChar = new int[SIZE];
		generateBadChar(patternString, badChar); //构建坏字符哈希表
		
		int mainLength = mainString.length;
		int patternLength = patternString.length;
		
		int i = 0;
		while (i <= mainLength - patternLength) {
     
			int j;
			for (j = mainLength-1; j >= 0; j--) {
      //模式串从后向前匹配
				if (mainString[i+j] != patternString[j]) {
      //坏字符对应模式串中的下标位置为 j
					break;
				}
			}
			if (j < 0) {
     
				return i; //匹配成功，返回下标i
			}
			//等同于将模式串往后滑动 si-xi 也就是 (j - badChar[(int) mainString[i+j]])位
			i = i + (j - badChar[(int) mainString[i+j]]);
		}
		return -1;
	}

坏字符规则理解起来是容易点的，大家可以对着注释看看代码，应该就可以明白了。我再给出一张图，方便大家理解。

至此，我们已经实现了包含坏字符规则的 BM 算法，现在只需要再将好后缀规则填充进这个框架里。

2. 好后缀规则

根据上面的讲述，我们知道好后缀的处理规则中有两个最核心的内容：

在模式串中，查找跟好后缀匹配的另一个子串；
在好后缀的后缀子串中，查找最长的、能跟模式串前缀子串匹配的后缀子串。

我再来对这两条做一个解释。

我们前面讲好后缀规则的时候，说的第一种情况，就是模式串中有和好后缀可以配对的子串，这个其实很容易绕进去。我们先明确一个事情，就是好后缀意味了什么。能有好后缀，一定代表了配对的时候模式串的后缀子串和主串的一个子串重合了。就是下图中模式串最后两位的 b c 。

所以我们要再在模式串中找的可以和后缀子串配对的子串，是除了现在模式串中已经和主串的一个字串配对的后缀子串以外，要再找一个相同的子串。我们要找的是模式串中圈起来的这个 b c。

这就是第一条核心的意思，配合之前的图，大家再做一个理解。

然后再来看第二条核心对应的另一种情况，就是我们要找前面的 b c ，但是模式串中已经没有了，那怎么办？这时候我们就找好后缀的后缀子串和模式串的前缀子串，有没有匹配的。找到的越长，能跳跃的就越多。

在不考虑效率的情况下，这两个操作可以用很“暴力”的匹配查找方式解决。但是，如果想要 BM 算法的效率很高，这部分就不能太低效。那我们要如何做呢？

因为好后缀也是模式串本身的后缀子串，所以，我们可以在模式串和主串正式匹配之前，通过预处理模式串，预先计算好模式串的每个后缀子串，对应的另一个可匹配子串的位置。这个预处理过程比较有技巧，很容易绕进去，是这篇文章中最难的一部分了。

我们先来看看，如何表示模式串中不同的后缀子串呢？因为后缀子串的最后一个字符的位置的固定的，下标为 m - 1，（m 为模式串的长度），所以我们只需要记录长度就可以了。通过长度，我们可以确定出唯一的后缀子串。

现在我们要引入最关键的变量 suffix 数组 。这个数组是用来存放后缀子串的。suffix 数组的下标 k 表示后缀子串的长度为 k，下标对应的数组值存储的是，在模式串中跟好后缀 {u} 相匹配的子串 {u*} 的起始下标值。

这就对应着我们前面说的第一个核心。我用一个例子来做个说明。

再强调一下，我们在模式串中找的是和后缀子串相配的子串，不是找模式串的后缀子串的位置。前面我们已经说过了，既然有后缀子串，就说明后几位已经配对上了，所以找的是其他位置的子串，因为我们是要通过这个位置来往后移动，使得模式串中的这个子串走到和好后缀相对应的地方。所以上图中的 suffix[4] 和 suffix[5] 都是 -1，因为除了已经和好后缀配对的后缀子串外，模式串里已经没有另一个可以配对的子串了。

那么，如果模式串中有多个（大于 1 个）子串跟后缀子串 {u} 匹配，那 suffix 数组中该存储哪个子串的起始位置呢？为了避免模式串往后滑动得过头了，我们肯定要存储模式串中最靠后的那个子串的起始位置，也就是下标最大的那个子串的起始位置。这和我们的坏字符的处理是一样的，还记得吗？都是为了防止滑动过大，所以出现了同样的字符或字符串，都取靠后的那个。

		for (int i = 0; i < patternString.length; i++) {
     
			int ascii = (int) patternString[i];
			badChar[ascii] = i;  //记录模式串中同一个字符最后出现的位置
		}

如果这么说还不够清晰的话，我再举个例子。比如我们有一个模式串如下

这个就比上面多了个 a b ，我还是和上面一样做个简单的分析

后缀子串	长度	Suffix
b	1	suffix[1] = 4
ab	2	suffix[2] = 3
cab	3	suffix[3] = 0

那我们这样处理就足够了吗？如果有多个子串和后缀子串 {u} 匹配的话。

实际上，仅仅是选最靠后的字串片段来存储是不够的。我们再次回忆一下好后缀规则。

我们不仅要在模式串中，查找跟好后缀匹配的另一个子串，还要在好后缀的后缀子串中，查找最长的能跟模式串前缀子串匹配的后缀子串。

其实对应的还是这张图。我们在前面说过，如果是模式串的一个子串和好后缀重合，那一定不是匹配的，只有当模式串的前缀子串和好后缀的后缀子串重合，才有可能匹配。

我们如果只记录刚刚定义的 suffix，实际上，只能处理规则的前半部分，也就是在模式串中，查找跟好后缀匹配的另一个子串。所以，除了 suffix 数组之外，我们还需要一个 boolean 类型的 prefix 数组，来记录模式串的后缀子串是否能匹配模式串的前缀子串。

看了前面的讲解，我相信你已经理解了为什么只有 prefix[3] = true，像后缀字符串是 ab，这时候 ab 虽然有可以配对的子串，就是下标为 1 开始的那个 ab，但是模式串的前缀子串是 ca，和 ab 不匹配，就为 false。因而只有 prefix[3] = true 。

现在，我们就来看看如何计算并填充这两个数组的值，这个计算过程也非常巧妙。

我们拿下标从 0 到 i 的子串（i 可以是 0 到 m-2）与整个模式串，求公共后缀子串。如果公共后缀子串的长度是 k，那我们就记录 suffix[k] = j（j 表示公共后缀子串的起始下标）。如果 j == 0，也就是说，公共后缀子串也是模式串的前缀子串，我们就记录 prefix[k] = true。

这个逻辑是什么意思呢？我再进一步地讲解一下。

我们现在的目的是要求能跟模式串后缀子串匹配的前缀子串，如果整个模式串的长度为 m，那么模式串的下标就是 [0, m-1]，这个我相信大家都理解。那么，模式串的最大前缀子串就是 [0, m-2]，所以 i 的取值范围就是 0 到 m-2 。

比如我们把 i = 2 时的子串拿出来，和整个模式串求公共后缀子串，这样求出来的就和上面我们的例子中一样，为了便于说明，我再用上面的例子画个图。

现在我们把 suffix 数组和 prefix 数组的计算过程，用代码实现，大家可以做一个对照。

	/**
	 * 初始化 suffix、prefix数组
	 * @param patternString 模式串
	 * @param suffix
	 * @param prefix
	 */
	private static void generateGoodSuffix(char[] patternString, 
											int[] suffix, boolean[] prefix) {
     
		int patternLength = patternString.length;
		
		for (int i = 0; i < patternLength; i++) {
      
			suffix[i] = -1;
			prefix[i] = false;
		}
		for (int i = 0; i < patternLength-1; i++) {
      //取出一个[0, i]的子串和模式串找公共后缀子串
			int j = i;
			int k = 0;
			while (j >= 0 && patternString[j] == patternString[patternLength-1-k]) {
     
				j--;
				k++;
				suffix[k] = j + 1;
			}
			if (j == -1) {
      //表示公共后缀子串也是模式串的前缀子串
				prefix[k] = true;
			}
		}
	}

同样的，如果大家对这段代码觉得有些混乱的话，可以对着代码做一遍变量跟踪，再结合着我的解析，相信应该还是可以理解的。

有了这两个数组之后，我们现在来看，模式串跟主串匹配的过程中，遇到不能匹配的字符时，如何根据好后缀规则，计算模式串往后滑动的位数。

假设好后缀的长度是 k 。我们先拿好后缀，在 suffix 数组中查找其匹配的子串。如果 suffix[k] 不等于 -1 （-1 表示不存在匹配的子串），那我们就将模式串往后移动 j - suffix[k] + 1 位（j 表示坏字符对应的模式串中的字符下标）。

如果 suffix[k] 等于 -1，表示模式串中不存在另一个跟好后缀匹配的子串片段。我们可以用下面这条规则来处理。

好后缀的后缀子串 b[r, m-1]（其中，r 取值从 j+2 到 m-1）的长度 k = m-r，如果 prefix[k] 等于 true，表示长度为 k 的后缀子串，有可匹配的前缀子串，这样我们可以把模式串后移 r 位。

关于 r 的取值，我这里要再多说一句。当时我学的时候觉得就很迷惑，这个取值是怎么来的，好半会都没反应过来。在前面我们说，j 是坏字符对应的模式串中的字符下标，也就是说，在 j 的下一个字符，就是好后缀了。那我们要求好后缀的后缀子串，就要再往后走一格，因为后缀子串是包含第一个字符的，不然就不是后缀了，所以 r 的取值是从 j+2 开始的。

这个情况就对应了我们前面讲的，需要找和好后缀的后缀子串配对的模式串中的最大前缀子串。我们需要将这个前缀子串后移到和好后缀的后缀子串对应的位置上。如下图所示

如果这两条规则都没有找到可以匹配好后缀或者其后缀子串的子串，就说明这是我们讲的好后缀的第一种情况，可以直接向后移动整个模式串的位数。

至此，好后缀规则的代码思路我们也理清了，可以直接把好后缀规则的代码加到前面我们写的 BM 算法的框架中去，这样就得到了 BM 算法的完整实现。

3. 代码完整实现

package com.tyz.string_matching.core;

/**
 * 用BM算法实现字符串匹配
 * @author Tong
 */
public class BoyerMoore {
     
	private static final int SIZE = 256; //ASCII码数

	public BoyerMoore() {
     }
	
	/**
	 * 借助散列表，存储字符以及其在模式串中的位置
	 * 如果是同样的字符出现多次，就记录它在模式串中最后出现的位置
	 * @param patternString 模式串
	 * @param badChar 坏字符集
	 */
	private static void generateBadChar(char[] patternString, int[] badChar) {
     
		for (int i = 0; i < SIZE; i++) {
     
			badChar[i] = -1;	//初始化badChar数组
		}
		for (int i = 0; i < patternString.length; i++) {
     
			int ascii = (int) patternString[i];
			badChar[ascii] = i;  //记录模式串中同一个字符最后出现的位置
		}
	}
	
	/**
	 * 初始化 suffix、prefix数组
	 * @param patternString 模式串
	 * @param suffix
	 * @param prefix
	 */
	private static void generateGoodSuffix(char[] patternString, 
											int[] suffix, boolean[] prefix) {
     
		int patternLength = patternString.length;
		
		for (int i = 0; i < patternLength; i++) {
      
			suffix[i] = -1;
			prefix[i] = false;
		}
		for (int i = 0; i < patternLength-1; i++) {
      //取出一个[0, i]的子串和模式串找公共后缀子串
			int j = i;
			int k = 0;
			while (j >= 0 && patternString[j] == patternString[patternLength-1-k]) {
     
				j--;
				k++;
				suffix[k] = j + 1;
			}
			if (j == -1) {
      //表示公共后缀子串也是模式串的前缀子串
				prefix[k] = true;
			}
		}
	}
	
	/**
	 * 用好后缀规则计算模式串移动位数
	 * @param j 坏字符对应的模式串中的字符下标
	 * @param patternLength 模式串长度
	 * @param suffix
	 * @param prefix
	 * @return 好后缀规则计算出的移动位数
	 */
	private static int moveByGoodString(int j, int patternLength, 
									int[] suffix, boolean[] prefix) {
     
		int k = patternLength - 1 - j; //好后缀长度
		if (suffix[k] != -1) {
     
			return j - suffix[k] + 1; //模式串里有和好后缀相配的子串
		}
		for (int r = j+2; r <= patternLength-1; r++) {
     
			if (prefix[patternLength-r] == true) {
     
				return r; //模式串有可以和好后缀的后缀子串相配的前缀子串
			}
		}
		return patternLength; //模式串里只有后缀子串和好后缀相配
	}
	
	/**
	 * BM算法实现字符串匹配
	 * @param mainString 主串
	 * @param patternString 模式串
	 * @return 模式串在主串中的位置
	 */
	public static int boyerMoore(char[] mainString, char[] patternString) {
     
		int[] badChar = new int[SIZE];
		generateBadChar(patternString, badChar); //构建坏字符哈希表
		
		int mainLength = mainString.length;
		int patternLength = patternString.length;
		
		int[] suffix = new int[patternLength];
		boolean[] prefix = new boolean[patternLength];
		generateGoodSuffix(patternString, suffix, prefix);
		
		int i = 0;
		while (i <= mainLength - patternLength) {
     
			int j;
			for (j = patternLength-1; j >= 0; j--) {
      //模式串从后向前匹配
				if (mainString[i+j] != patternString[j]) {
      //坏字符对应模式串中的下标位置为 j
					break;
				}
			}
			if (j < 0) {
     
				return i; //匹配成功，返回下标i
			}
			int x = j - badChar[(int) mainString[i+j]];
			int y = 0;
			if (j < patternLength-1) {
      //坏字符不在最后一位，说明存在好后缀
				y = moveByGoodString(j, patternLength, suffix, prefix);
			}
			//将模式串向后移动好后缀规则和坏字符规则计算出的移动位数最大的那个
			i = i + Math.max(x, y);
		}
		return -1;
	}

}

我觉得我的注释已经写得很详细了，大家可以结合我的注释以及前面的讲解，来理解这里的代码。

Ⅴ BM 算法的性能分析及优化

我们先来分析 BM 算法的内存消耗。整个算法用到了额外的三个数组，其中 badChar数组的大小跟字符集大小有关，suffix数组和 prefix数组的大小跟模式串长度 m 有关。

如果我们处理字符集很大的字符串匹配问题，badChar数组对内存的消耗会比较多。因为好后缀和坏字符规则是独立的，如果我们对运行的环境对内存要求严苛，可以只是用好后缀规则，不使用坏字符规则，这样就可以避免 badChar数组过多的内存消耗。不过，单纯地使用好后缀规则，BM 算法的效率就会下降一些了。

实际上，我们讲的这个 BM 算法是个初级版本，基于这个初级的版本，在极端情况下，预处理计算 suffix 数组、prefix 数组的性能会比较差。

比如模式串是 aaaaaaa 这种包含很多重复的字符的模式串，预处理的时间复杂度就是 O(m²)。当然，大部分情况下，时间复杂度不会这么差。

BM 算法的时间复杂度分析起来非常复杂，这篇论文 “A new proof of the linearity of the Boyer-Moore string searching algorithm” 证明了在最坏情况下，BM 算法的比较次数上限是 5n。这篇论文“Tight bounds on the complexity of the Boyer-Moore string matching algorithm” 证明了在最坏情况下，BM 算法的比较次数上限是 3n。

若对 KMP 算法有兴趣的同学，可以继续看我的下一篇文章
【数据结构与算法】-＞算法-＞字符串匹配基础（下）-＞KMP 算法

另，这篇文章的主要内容来源于极客时间王争的《数据结构与算法之美》

你可能感兴趣的:(数据结构与算法,字符串,算法,BM算法,字符串匹配算法,KMP算法)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
每日一题——第八十九题互联网打工人no1 C语言程序设计每日一练 c语言
题目：在字符串中找到提取数字，并统计一共找到多少整数，a123xxyu23&8889，那么找到的整数为123，23，8889//思想：#include#include#includeintmain(){charstr[]="a123xxyu23&8889";intcount=0;intnum=0;//用于临时存放当前正在构建的整数。boolinNum=false;//用于标记当前是否正在读取一个整
每日一题——第九十题互联网打工人no1 C语言程序设计每日一练 c语言
题目：判断子串是否与主串匹配#include#include#include//////判断子串是否在主串中匹配//////主串///子串///boolisSubstring(constchar*str,constchar*substr){intlenstr=strlen(str);//计算主串的长度intlenSub=strlen(substr);//计算子串的长度//遍历主字符串，对每个可能得
每日一题——第八十二题互联网打工人no1 C语言程序设计每日一练 c语言
题目：将一个控制台输入的字符串中的所有元音字母复制到另一字符串中#include#include#include#include#defineMAX_INPUT1024boolisVowel(charp);intmain(){charinput[MAX_INPUT];charoutput[MAX_INPUT];printf("请输入一串字符串：\n");fgets(input,sizeof(inp
C#中使用split分割字符串互联网打工人no1 c#
1、用字符串分隔：usingSystem.Text.RegularExpressions;stringstr="aaajsbbbjsccc";string[]sArray=Regex.Split(str,"js",RegexOptions.IgnoreCase);foreach(stringiinsArray)Response.Write(i.ToString()+"");输出结果：aaabbbc
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
Redis系列：Geo 类型赋能亿级地图位置计算 Ly768768 redis bootstrap 数据库
1前言我们在篇深刻理解高性能Redis的本质的时候就介绍过Redis的几种基本数据结构，它是基于不同业务场景而设计的：动态字符串(REDIS_STRING)：整数(REDIS_ENCODING_INT)、字符串(REDIS_ENCODING_RAW)双端列表(REDIS_ENCODING_LINKEDLIST)压缩列表(REDIS_ENCODING_ZIPLIST)跳跃表(REDIS_ENCODI
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
C语言判断回文数 Y雨何时停T c语言学习
一，回文数概念“回文”是指正读反读都能读通的句子，它是古今中外都有的一种修辞方式和文字游戏，如“我为人人，人人为我”等。在数学中也有这样一类数字有这样的特征，成为回文数。设n是一任意自然数。若将n的各位数字反向排列所得自然数n1与n相等，则称n为一回文数。例如，若n=1234321，则称n为一回文数；但若n=1234567，则n不是回文数。二，判断回文数实现思路一：数组与字符串将数字每一位按顺序放
Linux sh命令 fengyehongWorld Linux linux
目录一.基本语法二.选项2.1-c字符串中读取内容，并执行2.1.1基本用法2.1.2获取当前目录下失效的超链接2.2-x每个命令执行之前，将其打印出来2.3结合Here文档使用一.基本语法⏹Linux和Unix系统中用于执行shell脚本或运行命令的命令。sh[选项][脚本文件][参数...]⏹选项-c：从字符串中读取内容，并执行。-x：在每个命令执行之前，将其打印出来。-s：从标准流中读取内容
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
数据结构 | 栈和队列 TT-Kun 数据结构与算法数据结构栈队列 C语言
文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
2024.9.6 Python，华为笔试题总结，字符串格式化，字符串操作，广度优先搜索解决公司组织绩效互评问题，无向图 RaidenQ python 华为 leetcode 算法力扣广度优先无向图
1.字符串格式化name="Alice"age=30formatted_string="Name:{},Age:{}".format(name,age)print(formatted_string)或者name="Alice"age=30formatted_string=f"Name:{name},Age:{age}"print(formatted_string)2.网络健康检查第一行有两个整数m
2024.9.14 Python，差分法解决区间加法，消除游戏，压缩字符串 RaidenQ python 游戏开发语言算法力扣
1.区间加法假设你有一个长度为n的数组，初始情况下所有的数字均为0，你将会被给出k个更新的操作。其中，每个操作会被表示为一个三元组：[startIndex,endIndex,inc]，你需要将子数组A[startIndex…endIndex]（包括startIndex和endIndex）增加inc。请你返回k次操作后的数组。示例:输入:length=5,updates=[[1,3,2],[2,4,
[Python] 数据结构详解及代码 AIAdvocate 算法 python 数据结构链表
今日内容大纲介绍数据结构介绍列表链表1.数据结构和算法简介程序大白话翻译,程序=数据结构+算法数据结构指的是存储,组织数据的方式.算法指的是为了解决实际业务问题而思考思路和方法,就叫:算法.2.算法的5大特性介绍算法具有独立性算法是解决问题的思路和方式,最重要的是思维,而不是语言,其(算法)可以通过多种语言进行演绎.5大特性有输入,需要传入1或者多个参数有输出,需要返回1个或者多个结果有穷性,执行
Python算法L5：贪心算法小熊同学哦 Python算法算法 python 贪心算法
Python贪心算法简介目录Python贪心算法简介贪心算法的基本步骤贪心算法的适用场景经典贪心算法问题1.**零钱兑换问题**2.**区间调度问题**3.**背包问题**贪心算法的优缺点优点：缺点：结语贪心算法（GreedyAlgorithm）是一种在每一步选择中都采取当前最优或最优解的算法。它的核心思想是，在保证每一步局部最优的情况下，希望通过贪心选择达到全局最优解。虽然贪心算法并不总能得到全
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
非对称加密算法原理与应用2——RSA私钥加密文件私语茶馆云部署与开发架构及产品灵感记录 RSA2048 私钥加密
作者：私语茶馆1.相关章节（1）非对称加密算法原理与应用1——秘钥的生成-CSDN博客第一章节讲述的是创建秘钥对，并将公钥和私钥导出为文件格式存储。本章节继续讲如何利用私钥加密内容，包括从密钥库或文件中读取私钥，并用RSA算法加密文件和String。2.私钥加密的概述本文主要基于第一章节的RSA2048bit的非对称加密算法讲述如何利用私钥加密文件。这种加密后的文件，只能由该私钥对应的公钥来解密。
粒子群优化 (PSO) 在三维正弦波函数中的应用 subject625Ruben 机器学习人工智能 matlab 算法
在这篇博客中，我们将展示如何使用粒子群优化（PSO）算法求解三维正弦波函数，并通过增加正弦波扰动，使优化过程更加复杂和有趣。本文将介绍目标函数的定义、PSO参数设置以及算法执行的详细过程，并展示搜索空间中的动态过程和收敛曲线。1.目标函数定义我们使用的目标函数是一个三维正弦波函数，定义如下：objectiveFunc=@(x)sin(sqrt(x(1).^2+x(2).^2))+0.5*sin(5
非对称加密算法————RSA理论及详情 hu19930613
转自：https://www.kancloud.cn/kancloud/rsa_algorithm/48484一、一点历史1976年以前，所有的加密方法都是同一种模式：（1）甲方选择某一种加密规则，对信息进行加密；（2）乙方使用同一种规则，对信息进行解密。由于加密和解密使用同样规则（简称"密钥"），这被称为"对称加密算法"（Symmetric-keyalgorithm）。这种加密模式有一个最大弱点
继之前的线程循环加到窗口中运行 3213213333332132 java thread JFrame JPanel
之前写了有关java线程的循环执行和结束，因为想制作成exe文件，想把执行的效果加到窗口上，所以就结合了JFrame和JPanel写了这个程序，这里直接贴出代码，在窗口上运行的效果下面有附图。 package thread; import java.awt.Graphics; import java.text.SimpleDateFormat; import java.util
linux 常用命令 BlueSkator linux 命令
1.grep 相信这个命令可以说是大家最常用的命令之一了。尤其是查询生产环境的日志，这个命令绝对是必不可少的。但之前总是习惯于使用（grep -n 关键字文件名）查出关键字以及该关键字所在的行数，然后再用（sed -n '100,200p' 文件名），去查出该关键字之后的日志内容。但其实还有更简便的办法，就是用（grep -B n、-A n、-C n 关键
php heredoc原文档和nowdoc语法 dcj3sjt126com PHP heredoc nowdoc
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body> <?
overflow的属性周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
《我所了解的Java》——总体目录 g21121 java
准备用一年左右时间写一个系列的文章《我所了解的Java》，目录及内容会不断完善及调整。在编写相关内容时难免出现笔误、代码无法执行、名词理解错误等，请大家及时指出，我会第一时间更正。 &n
[简单]docx4j常用方法小结 53873039oycg docx
本代码基于docx4j-3.2.0，在office word 2007上测试通过。代码如下: import java.io.File; import java.io.FileInputStream; import ja
Spring配置学习云端月影 spring配置
首先来看一个标准的Spring配置文件 applicationContext.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&q
Java新手入门的30个基本概念三 aijuans java 新手 java 入门
17.Java中的每一个类都是从Object类扩展而来的。　　18.object类中的equal和toString方法。　　equal用于测试一个对象是否同另一个对象相等。　　toString返回一个代表该对象的字符串,几乎每一个类都会重载该方法,以便返回当前状态的正确表示.(toString 方法是一个很重要的方法)　　 19.通用编程:任何类类型的所有值都可以同object类性的变量来代替。　
《2008 IBM Rational 软件开发高峰论坛会议》小记 antonyup_2006 软件测试敏捷开发项目管理 IBM 活动
我一直想写些总结,用于交流和备忘,然都没提笔,今以一篇参加活动的感受小记开个头,呵呵! 其实参加《2008 IBM Rational 软件开发高峰论坛会议》是9月4号,那天刚好调休.但接着项目颇为忙,所以今天在中秋佳节的假期里整理了下. 参加这次活动是一个朋友给的一个邀请书,才知道有这样的一个活动,虽然现在项目暂时没用到IBM的解决方案,但觉的参与这样一个活动可以拓宽下视野和相关知识.
PL/SQL的过程编程,异常,声明变量,PL/SQL块百合不是茶 PL/SQL的过程编程异常 PL/SQL块声明变量
PL/SQL; 过程; 符号; 变量; PL/SQL块; 输出; 异常; PL/SQL 是过程语言(Procedural Language)与结构化查询语言(SQL)结合而成的编程语言PL/SQL 是对 SQL 的扩展,sql的执行时每次都要写操作
Mockito(三)--完整功能介绍 bijian1013 持续集成 mockito 单元测试
mockito官网：http://code.google.com/p/mockito/，打开documentation可以看到官方最新的文档资料。一.使用mockito验证行为 //首先要import Mockito import static org.mockito.Mockito.*; //mo
精通Oracle10编程SQL(8)使用复合数据类型 bijian1013 oracle 数据库 plsql
/* *使用复合数据类型 */ --PL/SQL记录 --定义PL/SQL记录 --自定义PL/SQL记录 DECLARE TYPE emp_record_type IS RECORD( name emp.ename%TYPE, salary emp.sal%TYPE, dno emp.deptno%TYPE ); emp_
【Linux常用命令一】grep命令 bit1129 Linux常用命令
grep命令格式 grep [option] pattern [file-list] grep命令用于在指定的文件(一个或者多个,file-list)中查找包含模式串(pattern)的行,[option]用于控制grep命令的查找方式。 pattern可以是普通字符串，也可以是正则表达式，当查找的字符串包含正则表达式字符或者特
mybatis3入门学习笔记白糖_ sql ibatis qq jdbc 配置管理
MyBatis 的前身就是iBatis，是一个数据持久层(ORM)框架。 MyBatis 是支持普通 SQL 查询，存储过程和高级映射的优秀持久层框架。MyBatis对JDBC进行了一次很浅的封装。以前也学过iBatis，因为MyBatis是iBatis的升级版本，最初以为改动应该不大，实际结果是MyBatis对配置文件进行了一些大的改动，使整个框架更加方便人性化。
Linux 命令神器：lsof 入门 ronin47 lsof
lsof是系统管理/安全的尤伯工具。我大多数时候用它来从系统获得与网络连接相关的信息，但那只是这个强大而又鲜为人知的应用的第一步。将这个工具称之为lsof真实名副其实，因为它是指“列出打开文件（lists openfiles）”。而有一点要切记，在Unix中一切（包括网络套接口）都是文件。有趣的是，lsof也是有着最多
java实现两个大数相加，可能存在溢出。 bylijinnan java实现
import java.math.BigInteger; import java.util.regex.Matcher; import java.util.regex.Pattern; public class BigIntegerAddition { /** * 题目：java实现两个大数相加，可能存在溢出。 * 如123456789 + 987654321
Kettle学习资料分享，附大神用Kettle的一套流程完成对整个数据库迁移方法 Kai_Ge Kettle
Kettle学习资料分享 Kettle 3.2 使用说明书目录概述..........................................................................................................................................7 1.Kettle 资源库管
[货币与金融]钢之炼金术士 comsci 金融
自古以来,都有一些人在从事炼金术的工作.........但是很少有成功的那么随着人类在理论物理和工程物理上面取得的一些突破性进展...... 炼金术这个古老
Toast原来也可以多样化 dai_lm android toast
Style 1：默认 Toast def = Toast.makeText(this, "default", Toast.LENGTH_SHORT); def.show(); Style 2：顶部显示 Toast top = Toast.makeText(this, "top", Toast.LENGTH_SHORT); t
java数据计算的几种解决方法3 datamachine java hadoop ibatis r-langue r
4、iBatis 简单敏捷因此强大的数据计算层。和Hibernate不同，它鼓励写SQL，所以学习成本最低。同时它用最小的代价实现了计算脚本和JAVA代码的解耦，只用20%的代价就实现了hibernate 80%的功能,没实现的20%是计算脚本和数据库的解耦。复杂计算环境是它的弱项，比如：分布式计算、复杂计算、非数据
向网页中插入透明Flash的方法和技巧 dcj3sjt126com html Web Flash
将 Flash 作品插入网页的时候，我们有时候会需要将它设为透明，有时候我们需要在Flash的背面插入一些漂亮的图片，搭配出漂亮的效果……下面我们介绍一些将Flash插入网页中的一些透明的设置技巧。　　一、Swf透明、无坐标控制　　首先教大家最简单的插入Flash的代码，透明，无坐标控制：　　注意wmode="transparent"是控制Flash是否透明
ios UICollectionView的使用 dcj3sjt126com
UICollectionView的使用有两种方法，一种是继承UICollectionViewController，这个Controller会自带一个UICollectionView；另外一种是作为一个视图放在普通的UIViewController里面。个人更喜欢第二种。下面采用第二种方式简单介绍一下UICollectionView的使用。 1.UIViewController实现委托，代码如
Eos平台java公共逻辑蕃薯耀 Eos平台java公共逻辑 Eos平台 java公共逻辑
Eos平台java公共逻辑 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:20:4
SpringMVC4零配置--Web上下文配置【MvcConfig】 hanqunfeng springmvc4
与SpringSecurity的配置类似，spring同样为我们提供了一个实现类WebMvcConfigurationSupport和一个注解@EnableWebMvc以帮助我们减少bean的声明。 applicationContext-MvcConfig.xml  <
解决ie和其他浏览器poi下载excel文件名乱码 jackyrong Excel
使用poi,做传统的excel导出，然后想在浏览器中，让用户选择另存为，保存用户下载的xls文件，这个时候，可能的是在ie下出现乱码（ie,9,10,11),但在firefox,chrome下没乱码，因此必须综合判断，编写一个工具类： /** * * @Title: pro
挥洒泪水的青春 lampcy 编程生活程序员
2015年2月28日，我辞职了，离开了相处一年的触控，转过身--挥洒掉泪水，毅然来到了兄弟连，背负着许多的不解、质疑——”你一个零基础、脑子又不聪明的人，还敢跨行业，选择Unity3D？“，”真是不自量力••••••“，”真是初生牛犊不怕虎•••••“，••••••我只是淡淡一笑，拎着行李----坐上了通向挥洒泪水的青春之地——兄弟连！这就是我青春的分割线，不后悔，只会去用泪水浇灌——已经来到
稳增长之中国股市两点意见-----严控做空，建立涨跌停版停牌重组机制 nannan408
对于股市，我们国家的监管还是有点拼的，但始终拼不过飞流直下的恐慌，为什么呢？笔者首先支持股市的监管。对于股市越管越荡的现象，笔者认为首先是做空力量超过了股市自身的升力，并且对于跌停停牌重组的快速反应还没建立好，上市公司对于股价下跌没有很好的利好支撑。我们来看美国和香港是怎么应对股灾的。美国是靠禁止重要股票做空，在
动态设置iframe高度(iframe高度自适应) Rainbow702 JavaScript iframe contentDocument 高度自适应局部刷新
如果需要对画面中的部分区域作局部刷新，大家可能都会想到使用ajax。但有些情况下，须使用在页面中嵌入一个iframe来作局部刷新。对于使用iframe的情况，发现有一个问题，就是iframe中的页面的高度可能会很高，但是外面页面并不会被iframe内部页面给撑开，如下面的结构： <div id="content"> <div id=&quo
用Rapael做图表 tntxia rap
function drawReport(paper,attr,data){ var width = attr.width; var height = attr.height; var max = 0; &nbs
HTML5 bootstrap2网页兼容（支持IE10以下） xiaoluode html5 bootstrap
<!DOCTYPE html> <html> <head lang="zh-CN"> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge">