banqinghe

《Java编程思想》读书笔记 —— 第13章字符串

对String的处理是工作时经常需要做的事情。这一章主要讲述的是String类本身的特性以及对字符串的可以进行的操作。主要的内容是String类中的方法介绍、格式化输出字符串以及正则表达式。和持有对象那一章很相似，这一章理论知识少，主要是要求读者掌握既有的方法，但是应用方法多且杂，所以初学不是很容易。

文章目录

- 1. 不可变String
- 2. 重载“+”与StringBuilder
- 3. 无意识地递归
- 4. String上的操作
- 5. 格式化输出
- - 5.1 System.out.format()方法
  - 5.2 Formatter类
- 6. 正则表达式
- - 6.1 基础
  - 6.2 String类中的正则表达式工具
  - 6.3 Pattern和Matcher
  - 6.4 基本使用
  - 6.5 Pattern标记
  - 6.6 split()
  - 6.7 替换操作
  - 6.8reset()
- 7. 扫描输入
- - 7.1 指定定界符
  - 7.2 使用正则表达式扫描
- 8. 关于StringTokenizer

1. 不可变String

在初学Java的时候曾接触过不可变对象的概念，而String类的对象就是不可变对象的一个典型例子。不可变对象的特点是：对象引用指向的对象实例不可改变，如果试图改变，就会开辟一片新的空间，对象引用指向这个新的对象。

下面给出一个很典型的例子：

public static void change(String b)
{
	b = "def";
}
public static void main(String[] args) {
    String a = new String("abc");
    String b = a;
    System.out.println(b);	// 输出abc 
    a = "def";
    System.out.println(b);
    // 输出abc，因为String为不可变对象，所以a指向"def"后,初始的"abc"并不会消失 b依然指向"abc"
    a=new String("abc");
    change(a);
    System.out.println(a); // 输出abc
}

2. 重载“+”与StringBuilder

Java并不允许用户自己运算符重载，只有两个特殊的运算符“+”和“+=”被重载用于字符串的操作。

Java支持下面的String初始化操作：

String mango = "mango";
String s = "abc"  + mango + " def" + 47;

上面的 String对象mango和数字47都被自动转化为了字符串，并成为了s的一部分。通过反汇编这串代码我们可以看到JVM是怎么在底层实现这一句代码的。我们观察到，编译器首先创建了一个StringBuilder对象，并使用这个对象完成了append字符串的操作，最后将这个StringBuilder对象转化为一个String对象，并将其赋给s。这是编译器主动做出的优化，使字符串的加法更为高效。

如果需要频繁多次地使用字符串的append方法，最好创建一个StringBuilder对象来完成这一操作。使用StringBuilder含参构造器可以指定该对象初始空间的大小，如果可以预估到最终的字符串大概有多长，就可以一开始就设置合适的大小，避免多次重新分配缓冲。

**注意：如果使用append(a + “:” + c)**这种形式，编译器就会掉入陷阱，以为这样会额外地创建StringBuilder对象进行括号内的字符串操作。

除了StringBuilder，StringBuffer也可以实现比String更高效的字符串拼接操作，且StringBuffer线程更安全，所以它所需的花销也会略大（速度慢于StringBuilder）。

3. 无意识地递归

试图使用this关键字打印出对象的地址会导致无意识的递归。

public class InfiniteRecursion {
    public String toString() {
    	return "infiniteRecursion address: " + this + "\n";
    }
}

toString()方法中，编译器试图将this转化为字符串，就会又调用本类的toString()方法，如此toString()不停反复调用自身，陷入了无限的递归，最终导致栈溢出异常。

打印本对象地址应该将this换成super.toString()。

4. String上的操作

这一节只是列出了一张表格，介绍了一些String方法。下面是我认为值得记录的方法：

方法	参数	应用
charAt()	int索引	索引位置上的字符
toCharArray()		生成一个char[]，包含String的所有字符
compareTo()	另一个String	比较两个字符串的大小，返回负数，零，或者正数
startsWith() / endWith()	可能起始/后缀的String startsWith()参数可包括偏移量	返回boolean
indexOf() / lastIndexOf()	char / char + 起始索引 / String / String + 起始索引	不包含返回-1，否则返回找到的起始索引
replace()	要替换的字符 / CharSequence 用来替换的字符 / CharSequence	返回替换操作后的String
trim()		返回删除字符串两端空格后的String
valueOf() （静态方法）	字符数组 (+偏移量) / 多种类型数据	返回一个表示参数内容的String
intern()		将字符串放入常量池，返回池中的String

这种字典式的表格在这一章中出现了很多次，主要执行的还是记住常用的，记不住的查表这种策略。

5. 格式化输出

5.1 System.out.format()方法

C语言中支持使用printf()函数进行输出，Java也支持使用**printf()**方法，且使用方法就我了解的来看，和C语言中的printf函数完全一致。但是这是一种较老的方法了，书中建议还是使用新一点的方法format()，其实使用方法还是没变，和C语言是基本相同的。

int x = 5;
double y = 5.332542;
System.out.format("x = %d\n", x);
System.out.format("y = %f\n", y);

值得注意的是，这里的**%d包括所有类型的整型数，%f**包括所有的浮点型数，甚至大数也可以使用这个输出。

5.2 Formatter类

和前面提到的format方法其实异曲同工，Formatter对象类似于一个翻译器，使用Formatter对象的format方法可以输出指定格式的字符串。

Formatter构造器中的参数是输出字符串的目的地，最常用的是PrintStream（包括System.out），OutputStream和File。

Formatter f = new Formatter(System.out);
f.format("x = %d\n", x);

使用format实现输出数据的对齐也很容易,和C语言printf函数和实现方式是相同的，对于字符串的示例：

f.format("%-15.15s", str);	// 负号表示右对齐，第一个小数点前的数字表示最小宽度，小数点后的数字表示最大宽度

Formatter转换

需要注意：

**%h：**散列码 **%e：浮点数（科学计数） **%b：布尔值 **%%：**表示字符‘%’

在format方法中

字符不可以转化成数字，整型数字可以转化成字符（ASCII码转化）
所有数据类型都可以转化成散列码和字符串
所有数据类型都可以转化成布尔值，除非原本就是布尔型，其他的一律转化成true

String.format()

当只需要使用format方法一次的时候，使用String.format方法是比使用Formatter类更加方便的，这是一个静态方法，返回格式化后的String对象，使用方式和Formatter.format类似：

System.out.println(String.format("x = %d\n", x));

6. 正则表达式

正则表达式的使用是这一章的重点所在，使用正则表达式，字符串的匹配操作达到了空前的灵活性。使用正则表达式主要依靠的是String类本身的一些方法，或者是Pattern和Matchcer这两个类配合使用。

6.1 基础

正则表达式的格式，根据书中所说，可以在Java文档的java.util.regex.Pattern部分找到。因为要列举出来都可以另写一篇博客了，而且全抄下来实际意义确实也不大，所以需要的时候动手查是更好的选择。

6.2 String类中的正则表达式工具

1. matches()方法

该方法返回一个布尔值，用来判定一个String是否和传入的正则表达式相匹配。

System.out.println("-1234".matches("-?\\d+"))	// true

2. split()方法

这个方法被用来将字符串按照正则表达式分割，返回一个字符串型的数组。

System.out.println(Arrays.toString(str.split("\\W+")));

3. replaceFirst()和replaceAll()方法

两个都是替换方法，且名称可以自解释其作用。第一个参数是正则表达式字符串，第二个参数是要替换的成的字符串。返回的结果是替换完成的String对象。

System.out.println(s.replaceAll("f\\w+", "located"));

如果正则表达式不是只使用一次的话，非String对象的正则表达式明显具备更佳的性能。

6.3 Pattern和Matcher

使用的一般步骤是：

使用**static Pattern.complie()**编译正则表达式，生成一个Pattern对象
调用Pattern对象的matcher()方法（该方法参数为需处理字符串），生成一个Matcher对象
使用Matcher对象的方法进行操作

6.4 基本使用

1. find() 类似于一个迭代器，返回一个Boolean值，并且准备指向下一个匹配子字符串，如果有整数参数，则从参数表示位置的开始向后搜索，否则默认从第0个位置开始搜索。

**ps：注意lookingAt()和matches()**方法也返回Boolean，lookingAt只有当正则表达式和字符串开头相匹配的时候为true，matches当正则表达式和整个字符串匹配时才返回true。

2.group() 正则表达式中，被一对括号括起来的一部分被称为一组，比如被第一对括号括起来的就是第一组，group()（无参）返回匹配整个正则表达式的字符串。

3. start()和end() 表示匹配正则表达式部分的起始位置和终止位置，依然是左闭右开的形式，比如对于"a123b"，使用"\\d+"去匹配，start()返回1，end()返回4。

下面给出一个典型应用：

for(String arg : args) {
    System.out.println("Regular expression: \"" + arg + "\"");
    Pattern p = Pattern.compile(arg);	// 创建Pattern对象编译正则表达式
    Matcher m = p.matcher(args[0]);	// 使用Pattern的matcher方法创建Matcher对象，并传入需要匹配操作的字符串
    while(m.find()) {
        System.out.println("Match \"" + m.group() + "\" at positions " + m.start() + "-" + (m.end()-1));
    }
}

6.5 Pattern标记

Pattern.complie的一种重载版本为：Pattern.complile(String ragex, int flag)，这里的flag就是需要传入的Pattern标记，可以指定一些额外操作，也可以在方法中不指定，在正则表达式开头放入指定的标志达到相同效果：

Pattern.Case_INSENSITIVE(?i) | Pattern.Case_UNICODE_CASE(?u) 这两个标记经常配合使用，这样可以实现基于Unicode的大小写不敏感的匹配。
Pattern.COMMENTS(?x) 空格符会被忽略，以#开头直到行末的注释也会被忽略
Pattern.DOTALL(?s) '.'可以匹配任何字符，包括行终结符
Pattern.MULTILINE(?m) 多行模式，^和$分别匹配每行的开始和结束

还有Pattern.CANON_EQ和Pattern.UNIX_LINE(?d)，但是我现在还不太理解，还不知道应该在什么场合用。

下面的例子是在忽略大小写的前提下进行的正则表达式匹配工作：

import java.util.regex.*;

public class ReFlags {
    public static void main(String[] args) {
        Pattern p = Pattern.compile("^java", Pattern.CASE_INSENSITIVE | Pattern.MULTILINE);
        Matcher m = p.matcher(
            "java has regex\nJava has regex\n" +
            "JAVA has pretty good regular expressions\n" +
            "Regular expressions are in Java"
        );
        while(m.find())
            System.out.println(m.group());
    }
}

java
Java
JAVA

6.6 split()

和String中的split()方法的使用方法类似，Pattern中的split()方法也返回分割后的的字符串数组。

这个split()有两种重载版本，第一中是只接受一个CharSequence，第二种是接受一个CharSequence和一个用来限制分割成字符串数量的整型数。

以下两句输出的结果是完全相同的：

System.out.println(Arrays.toString(Pattern.compile("!!").split(input, 3)));	// 使用Pattern对象的split()方法
System.out.println(Arrays.toString(input.split("!!", 3)));	// 使用String对象的split()方法

6.7 替换操作

replaceFirst()和replaceAll() 这两个方法的使用不用多说，这里主要介绍**appendReplacement()**方法，这个方法有两种重载版本：

appendReplacement(StringBuffer sb, String replacement)
appendReplacement(StringBuilder sb, String replacement)

它能允许我们实现渐进式的字符串替换，一般要和**appendTail()**方法一起使用，下面给出例子：

StringBuffer sbuf = new StringBuffer();
Pattern p = Pattern.compile("[aeiou]");
Matcher m = p.matcher(s);
while(m.find()) {
    System.out.print("m.group: " + m.group());
    m.appendReplacement(sbuf, m.group().toUpperCase());
}
m.appendTail(sbuf);
System.out.println(sbuf);

每次循环，sbuf中的就会追加上一次替换完成的字符串，最后使用appendTail()加上未加到sbuf中的字符串末尾部分。

6.8reset()

Matcher对象用来切换需要做匹配处理的字符串：

m.reset(anotherString);

7. 扫描输入

目前读取一个文件或者是标准输入的内容，处理方式还是每次读入一行（readLine()方法），然后逐行进行分析以分离出我们想要的数据，这种逐行读数据再处理的方式是相当麻烦的。Java SE5中新增的Scanner类可以让我们按照类型读数据而不是傻傻地逐行读入。

Scanner有多种构造器重载版本，可以传入File、InputStream、String、Readable、Path。

// public static BufferedReader input = new BufferedReader(
//    new StringReader("Sir Robin of Camelot\n22 1.61803"));  // String将String转化为可读的流对象

import java.util.*;

public class BetterReader {
    public static void main(String[] args) {
        Scanner stdin = new Scanner(SimpleRead.input);  // 一个BufferedReader作为构造器的参数
        System.out.println("What is your name");
        String name = stdin.nextLine();	// 读取一行
        System.out.println(name);
        System.out.println("How old are you? What is your favorite double?");
        System.out.println("(input:  )");
        int age = stdin.nextInt();	// 读取整型数
        double favorite = stdin.nextDouble();	// 读取浮点数
        System.out.println(age);
        System.out.println(favorite);
        System.out.format("Hi %s.\n", name);
        System.out.format("In 5 years you will be %d.\n", age+5);
        System.out.format("My favorite double is %f.", favorite/2);
    }
}

关于IO异常，文档中是这样写：

A scanner can read text from any object which implements the Readable interface. If an invocation of the underlying readable’s read() method throws an IOException then the scanner assumes that the end of the input has been reached. The most recent IOException thrown by the underlying readable can be retrieved via the ioException() method.

扫描程序可以从实现Readable接口的任何对象中读取文本。如果对底层可读对象的read()方法的调用引发IOException，则扫描程序将假定已到达输入的结尾。可以通过ioException()方法检索由底层可读内容引发的最新IOException。

即Scanner将IOException当做读取结束的标志，可以使用特定方法捕获最新的IOException。

7.1 指定定界符

Scanner默认使用空格作为分词标志，但是也可以使用**useDelimiter()**方法，利用正则表达式使用自定义的定界符。

import java.util.*;

public class ScannerDelimiter {
    public static void main(String[] args) {
        Scanner scanner = new Scanner("12, 42, 78, 99, 42");
        scanner.useDelimiter("\\s*,\\s*");	// 指定了定界符（分隔符）
        while(scanner.hasNextInt())
            System.out.println(scanner.nextInt());
    }
}

7.2 使用正则表达式扫描

Scanner使用正则表达式扫描的使用和迭代器的使用很像，主要使用的方法有：

hasNext() 参数为一个正则表达式，判断有没有下一个和正则表达式匹配的部分
next() 参数为正则表达式，如果已经hasNext()成功，那么就执行这一方法，使scanner指向匹配部分
match() 返回一个MatchResult对象，使用这个对象的方法（group(), start()…）对匹配到的部分进行操作

**注意：**因为匹配时只会关注每个分词，所以正则表达式中不能包括定界符，否则不可能匹配成功。

import java.util.Scanner;
import java.util.regex.MatchResult;

public class ScannerTest {
    public static void main(String[] args) {
        Scanner scanner = new Scanner("11211211211211");
        scanner.useDelimiter("2");
        String pattern = "121";
        while(scanner.hasNext(pattern)) {
            scanner.next(pattern);
            MatchResult match = scanner.match();
            System.out.println(match.group());
        }
    }
}

上面的代码没有任何输出，因为我们设定了定界符为"2"，所以在匹配正则表达式时，scanner看到的相当于是"11 11 11 11 11"，没有与"121"相匹配的部分，当然也就没有任何输出。

8. 关于StringTokenizer

在正则表达式和Scanner出现之前，StringTokenizer是分割字符串的唯一方法，这个方法不支持正则表达式，灵活性已经落后了。下面给出基本的使用方法：

        String s = "1, 2, 3, 4, 5";
        StringTokenizer stoke = new StringTokenizer(s, ", ");	// 默认空格为定界符，这里设置为", "
        while(stoke.hasMoreElements())
            System.out.println(stoke.nextElement());

你可能感兴趣的:(Think,in,java,java)

Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
【华为OD机试真题2023B卷 JAVA&JS】We Are A Team 若博豆 java 算法华为 javascript
华为OD2023（B卷）机试题库全覆盖，刷题指南点这里WeAreATeam时间限制：1秒|内存限制：32768K|语言限制：不限题目描述：总共有n个人在机房，每个人有一个标号（1<=标号<=n），他们分成了多个团队，需要你根据收到的m条消息判定指定的两个人是否在一个团队中，具体的：1、消息构成为：abc，整数a、b分别代
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
Java 重写(Override)与重载(Overload) 叨唧唧的
Java重写(Override)与重载(Overload)重写(Override)重写是子类对父类的允许访问的方法的实现过程进行重新编写,返回值和形参都不能改变。即外壳不变，核心重写！重写的好处在于子类可以根据需要，定义特定于自己的行为。也就是说子类能够根据需要实现父类的方法。重写方法不能抛出新的检查异常或者比被重写方法申明更加宽泛的异常。例如：父类的一个方法申明了一个检查异常IOExceptio
简单了解 JVM 记得开心一点啊 jvm
目录♫什么是JVM♫JVM的运行流程♫JVM运行时数据区♪虚拟机栈♪本地方法栈♪堆♪程序计数器♪方法区/元数据区♫类加载的过程♫双亲委派模型♫垃圾回收机制♫什么是JVMJVM是JavaVirtualMachine的简称，意为Java虚拟机。虚拟机是指通过软件模拟的具有完整硬件功能的、运行在一个完全隔离的环境中的完整计算机系统（如：JVM、VMwave、VirtualBox）。JVM和其他两个虚拟机
1分钟解决 -bash: mvn: command not found，在Centos 7中安装Maven Energet!c 开发语言
1分钟解决-bash:mvn:commandnotfound，在Centos7中安装Maven检查Java环境1下载Maven2解压Maven3配置环境变量4验证安装5常见问题与注意事项6总结检查Java环境Maven依赖Java环境，请确保系统已经安装了Java并配置了环境变量。可以通过以下命令检查：java-version如果未安装，请先安装Java。1下载Maven从官网下载：前往Apach
Java企业面试题3 马龙强_ java
1.break和continue的作用(智*图)break：用于完全退出一个循环（如for,while）或一个switch语句。当在循环体内遇到break语句时，程序会立即跳出当前循环体，继续执行循环之后的代码。continue：用于跳过当前循环体中剩余的部分，并开始下一次循环。如果是在for循环中使用continue，则会直接进行条件判断以决定是否执行下一轮循环。2.if分支语句和switch分
JVM、JRE和 JDK：理解Java开发的三大核心组件 Y雨何时停T Java java
Java是一门跨平台的编程语言，它的成功离不开背后强大的运行环境与开发工具的支持。在Java的生态中，JVM（Java虚拟机）、JRE（Java运行时环境）和JDK（Java开发工具包）是三个至关重要的核心组件。本文将探讨JVM、JDK和JRE的区别，帮助你更好地理解Java的运行机制。1.JVM：Java虚拟机（JavaVirtualMachine）什么是JVM？JVM，即Java虚拟机，是Ja
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
白骑士的Java教学基础篇 2.5 控制流语句白骑士所长 Java 教学 java 开发语言
欢迎继续学习Java编程的基础篇！在前面的章节中，我们了解了Java的变量、数据类型和运算符。接下来，我们将探讨Java中的控制流语句。控制流语句用于控制程序的执行顺序，使我们能够根据特定条件执行不同的代码块，或重复执行某段代码。这是编写复杂程序的基础。通过学习这一节内容，你将掌握如何使用条件语句和循环语句来编写更加灵活和高效的代码。条件语句条件语句用于根据条件的真假来执行不同的代码块。if语句‘
python语法——三目运算符 HappyRocking python python 三目运算符
在java中，有三目运算符，如：intc=(a>b)?a:b表示c取两者中的较大值。但是在python，不能直接这样使用，估计是因为冒号在python有分行的关键作用。那么在python中，如何实现类似功能呢？可以使用ifelse语句，也是一行可以完成，格式为：aifbelsec表示如果b为True，则表达式等于a，否则等于c。如：c=(aif(a>b)elseb)同样是完成了取最大值的功能。
ArrayList 源码解析程序猿进阶 Java基础 ArrayList List java 面试性能优化架构设计 idea
ArrayList是Java集合框架中的一个动态数组实现，提供了可变大小的数组功能。它继承自AbstractList并实现了List接口，是顺序容器，即元素存放的数据与放进去的顺序相同，允许放入null元素，底层通过数组实现。除该类未实现同步外，其余跟Vector大致相同。每个ArrayList都有一个容量capacity，表示底层数组的实际大小，容器内存储元素的个数不能多于当前容量。当向容器中添
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
Java：爬虫框架 dingcho Java java 爬虫
一、ApacheNutch2【参考地址】Nutch是一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。Nutch致力于让每个人能很容易,同时花费很少就可以配置世界一流的Web搜索引擎.为了完成这一宏伟的目标,Nutch必须能够做到:每个月取几十亿网页为这些网页维护一个索引对索引文件进行每秒上千次的搜索提供高质量的搜索结果简单来说Nutch支持分
python怎么将png转为tif_png转tif weixin_39977276
发国外的文章要求图片是tif，cmyk色彩空间的。大小尺寸还有要求。比如网上大神多，找到了一段代码，感谢！https://www.jianshu.com/p/ec2af4311f56https://github.com/KevinZc007/image2Tifimportjava.awt.image.BufferedImage;importjava.io.File;importjava.io.Fi
JavaScript 中，深拷贝（Deep Copy）和浅拷贝（Shallow Copy）跳房子的前端前端面试 javascript 开发语言 ecmascript
在JavaScript中，深拷贝（DeepCopy）和浅拷贝（ShallowCopy）是用于复制对象或数组的两种不同方法。了解它们的区别和应用场景对于避免潜在的bugs和高效地处理数据非常重要。以下是对深拷贝和浅拷贝的详细解释，包括它们的概念、用途、优缺点以及实现方式。1.浅拷贝（ShallowCopy）概念定义：浅拷贝是指创建一个新的对象或数组，其中包含了原对象或数组的基本数据类型的值和对引用数
JAVA·一个简单的登录窗口 MortalTom java 开发语言学习
文章目录概要整体架构流程技术名词解释技术细节资源概要JavaSwing是Java基础类库的一部分，主要用于开发图形用户界面（GUI）程序整体架构流程新建项目，导入sql.jar包（链接放在了文末），编译项目并运行技术名词解释一、特点丰富的组件提供了多种可视化组件，如按钮（JButton）、文本框（JTextField）、标签（JLabel）、下拉列表（JComboBox）等，可以满足不同的界面设计
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
00. 这里整理了最全的爬虫框架（Java + Python）有一只柴犬爬虫系列爬虫 java python
目录1、前言2、什么是网络爬虫3、常见的爬虫框架3.1、java框架3.1.1、WebMagic3.1.2、Jsoup3.1.3、HttpClient3.1.4、Crawler4j3.1.5、HtmlUnit3.1.6、Selenium3.2、Python框架3.2.1、Scrapy3.2.2、BeautifulSoup+Requests3.2.3、Selenium3.2.4、PyQuery3.2
JAVA学习笔记之23种设计模式学习 victorfreedom Java技术设计模式 android java 常用设计模式
博主最近买了《设计模式》这本书来学习，无奈这本书是以C++语言为基础进行说明，整个学习流程下来效率不是很高，虽然有的设计模式通俗易懂，但感觉还是没有充分的掌握了所有的设计模式。于是博主百度了一番，发现有大神写过了这方面的问题，于是博主迅速拿来学习。一、设计模式的分类总体来说设计模式分为三大类：创建型模式，共五种：工厂方法模式、抽象工厂模式、单例模式、建造者模式、原型模式。结构型模式，共七种：适配器
JavaScript `Map` 和 `WeakMap`详细解释跳房子的前端 JavaScript 原生方法 javascript 前端开发语言
在JavaScript中，Map和WeakMap都是用于存储键值对的数据结构，但它们有一些关键的不同之处。MapMap是一种可以存储任意类型的键值对的集合。它保持了键值对的插入顺序，并且可以通过键快速查找对应的值。Map提供了一些非常有用的方法和属性来操作这些数据对：set(key,value):将一个键值对添加到Map中。如果键已经存在，则更新其对应的值。get(key):获取指定键的值。如果键
一台适合普通办公使用的电脑推荐thinkpadE475 sam_1c14
图片发自App图片发自App缺点是内存只有4G。胜在便宜。14寸，很轻薄。给老婆买的。应该不能用来编程，会很慢的，真要用可以自己加根内存条，最大扩展到32G。图片发自App
切换淘宝最新npm镜像源是 hai40587 npm 前端 node.js
切换淘宝最新npm镜像源是一个相对简单的过程，但首先需要明确当前淘宝npm镜像源的状态和最新的镜像地址。由于网络环境和服务更新，镜像源的具体地址可能会发生变化，因此，我将基于当前可获取的信息，提供一个通用的切换步骤，并附上最新的镜像地址（截至回答时）。一、了解npm镜像源npm（NodePackageManager）是JavaScript的包管理器，用于安装、更新和管理项目依赖。由于npm官方仓库
【Java】已解决：java.util.concurrent.CompletionException 屿小夏 java 开发语言
文章目录一、分析问题背景出现问题的场景代码片段二、可能出错的原因三、错误代码示例四、正确代码示例五、注意事项已解决：java.util.concurrent.CompletionException一、分析问题背景在Java并发编程中，java.util.concurrent.CompletionException是一种常见的运行时异常，通常在使用CompletableFuture进行异步计算时出现
深入浅出Java Annotation(元注解和自定义注解） Josh_Persistence Java Annotation 元注解自定义注解
一、基本概述　　 Annontation是Java5开始引入的新特征。中文名称一般叫注解。它提供了一种安全的类似注释的机制，用来将任何的信息或元数据（metadata）与程序元素（类、方法、成员变量等）进行关联。　　更通俗的意思是为程序的元素（类、方法、成员变量）加上更直观更明了的说明，这些说明信息是与程序的业务逻辑无关，并且是供指定的工具或
mysql优化特定类型的查询 annan211 java 工作 mysql
本节所介绍的查询优化的技巧都是和特定版本相关的，所以对于未来mysql的版本未必适用。 1 优化count查询对于count这个函数的网上的大部分资料都是错误的或者是理解的都是一知半解的。在做优化之前我们先来看看真正的count()函数的作用到底是什么。 count()是一个特殊的函数，有两种非常不同的作用，他可以统计某个列值的数量，也可以统计行数。在统
MAC下安装多版本JDK和切换几种方式棋子chessman jdk
环境： MAC AIR,OS X 10.10,64位历史：过去 Mac 上的 Java 都是由 Apple 自己提供，只支持到 Java 6，并且OS X 10.7 开始系统并不自带（而是可选安装）（原自带的是1.6）。后来 Apple 加入 OpenJDK 继续支持 Java 6，而 Java 7 将由 Oracle 负责提供。在终端中输入jav
javaScript （1） Array_06 JavaScript java 浏览器
JavaScript 1、运算符　　运算符就是完成操作的一系列符号，它有七类：　　赋值运算符（=,+=,-=,*=,/=,%=,<<=,>>=,|=,&=）、算术运算符(+,-,*,/,++,--,%)、比较运算符(>,<,<=,>=,==,===,!=,!==)、逻辑运算符(||,&&,!)、条件运算(?:)、位
国内顶级代码分享网站袁潇含 java jdk oracle .net PHP
现在国内很多开源网站感觉都是为了利益而做的当然利益是肯定的,否则谁也不会免费的去做网站 &
Elasticsearch、MongoDB和Hadoop比较随意而生 mongodb hadoop 搜索引擎
IT界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性，避免落大部队太远，我们看到了不同技术之间的边际的模糊化。假如你有诸如Elasticsearch或者Solr这样的搜索引擎，它们存储着JSON文档，MongoDB存着JSON文档，或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配
mac os 系统科研软件总结张亚雄 mac os
1.1 Microsoft Office for Mac 2011 大客户版，自行搜索。 1.2 Latex （MacTex）: 系统环境：https://tug.org/mactex/ &nb
Maven实战（四）生命周期 AdyZhang maven
1. 三套生命周期 Maven拥有三套相互独立的生命周期，它们分别为clean，default和site。每个生命周期包含一些阶段，这些阶段是有顺序的，并且后面的阶段依赖于前面的阶段，用户和Maven最直接的交互方式就是调用这些生命周期阶段。以clean生命周期为例，它包含的阶段有pre-clean, clean 和 post
Linux下Jenkins迁移 aijuans Jenkins
1. 将Jenkins程序目录copy过去源程序在/export/data/tomcatRoot/ofctest-jenkins.jd.com下面 tar -cvzf jenkins.tar.gz ofctest-jenkins.jd.com &
request.getInputStream()只能获取一次的问题 ayaoxinchao request Inputstream
问题：在使用HTTP协议实现应用间接口通信时，服务端读取客户端请求过来的数据，会用到request.getInputStream()，第一次读取的时候可以读取到数据，但是接下来的读取操作都读取不到数据原因： 1. 一个InputStream对象在被读取完成后，将无法被再次读取，始终返回-1； 2. InputStream并没有实现reset方法（可以重
数据库SQL优化大总结之百万级数据库优化方案 BigBird2012 SQL优化
网上关于SQL优化的教程很多，但是比较杂乱。近日有空整理了一下，写出来跟大家分享一下，其中有错误和不足的地方，还请大家纠正补充。这篇文章我花费了大量的时间查找资料、修改、排版，希望大家阅读之后，感觉好的话推荐给更多的人，让更多的人看到、纠正以及补充。 1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where
jsonObject的使用 bijian1013 java json
在项目中难免会用java处理json格式的数据，因此封装了一个JSONUtil工具类。 JSONUtil.java package com.bijian.json.study; import java.util.ArrayList; import java.util.Date; import java.util.HashMap;
[Zookeeper学习笔记之六]Zookeeper源代码分析之Zookeeper.WatchRegistration bit1129 zookeeper
Zookeeper类是Zookeeper提供给用户访问Zookeeper service的主要API，它包含了如下几个内部类首先分析它的内部类，从WatchRegistration开始，为指定的znode path注册一个Watcher， /** * Register a watcher for a particular p
【Scala十三】Scala核心七：部分应用函数 bit1129 scala
何为部分应用函数？ Partially applied function: A function that’s used in an expression and that misses some of its arguments.For instance, if function f has type Int => Int => Int, then f and f(1) are p
Tomcat Error listenerStart 终极大法 ronin47 tomcat
Tomcat报的错太含糊了，什么错都没报出来，只提示了Error listenerStart。为了调试，我们要获得更详细的日志。可以在WEB-INF/classes目录下新建一个文件叫logging.properties，内容如下 Java代码 handlers = org.apache.juli.FileHandler, java.util.logging.ConsoleHa
不用加减符号实现加减法 BrokenDreams 实现
今天有群友发了一个问题，要求不用加减符号(包括负号)来实现加减法。分析一下，先看最简单的情况，假设1+1，按二进制算的话结果是10，可以看到从右往左的第一位变为0，第二位由于进位变为1。
读《研磨设计模式》-代码笔记-状态模式-State bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 当一个对象的内在状态改变时允许改变其行为，这个对象看起来像是改变了其类状态模式主要解决的是当控制一个对象状态的条件表达式过于复杂时的情况把状态的判断逻辑转移到表示不同状态的一系列类中，可以把复杂的判断逻辑简化如果在
CUDA程序block和thread超出硬件允许值时的异常 cherishLC CUDA
调用CUDA的核函数时指定block 和 thread大小，该大小可以是dim3类型的（三维数组），只用一维时可以是usigned int型的。以下程序验证了当block或thread大小超出硬件允许值时会产生异常！！！GPU根本不会执行运算！！！所以验证结果的正确性很重要！！！在VS中创建CUDA项目会有一个模板，里面有更详细的状态验证。以下程序在K5000GPU上跑的。
诡异的超长时间GC问题定位 chenchao051 jvm cms GC hbase swap
HBase的GC策略采用PawNew+CMS, 这是大众化的配置，ParNew经常会出现停顿时间特别长的情况，有时候甚至长到令人发指的地步，例如请看如下日志： 2012-10-17T05:54:54.293+0800: 739594.224: [GC 739606.508: [ParNew: 996800K->110720K(996800K), 178.8826900 secs] 3700
maven环境快速搭建 daizj 安装 mavne 环境配置
一下载maven 安装maven之前，要先安装jdk及配置JAVA_HOME环境变量。这个安装和配置java环境不用多说。 maven下载地址：http://maven.apache.org/download.html，目前最新的是这个apache-maven-3.2.5-bin.zip，然后解压在任意位置，最好地址中不要带中文字符，这个做java 的都知道，地址中出现中文会出现很多
PHP网站安全，避免PHP网站受到攻击的方法 dcj3sjt126com PHP
对于PHP网站安全主要存在这样几种攻击方式:1、命令注入(Command Injection)2、eval注入(Eval Injection)3、客户端脚本攻击(Script Insertion)4、跨网站脚本攻击(Cross Site Scripting, XSS)5、SQL注入攻击(SQL injection)6、跨网站请求伪造攻击(Cross Site Request Forgerie
yii中给CGridView设置默认的排序根据时间倒序的方法 dcj3sjt126com GridView
public function searchWithRelated() { $criteria = new CDbCriteria; $criteria->together = true; //without th
Java集合对象和数组对象的转换 dyy_gusi java集合
在开发中，我们经常需要将集合对象（List，Set）转换为数组对象，或者将数组对象转换为集合对象。Java提供了相互转换的工具，但是我们使用的时候需要注意，不能乱用滥用。 1、数组对象转换为集合对象最暴力的方式是new一个集合对象，然后遍历数组，依次将数组中的元素放入到新的集合中，但是这样做显然过
nginx同一主机部署多个应用 geeksun nginx
近日有一需求，需要在一台主机上用nginx部署2个php应用，分别是wordpress和wiki，探索了半天，终于部署好了，下面把过程记录下来。 1. 在nginx下创建vhosts目录，用以放置vhost文件。 mkdir vhosts 2. 修改nginx.conf的配置，在http节点增加下面内容设置，用来包含vhosts里的配置文件 #
ubuntu添加admin权限的用户账号 hongtoushizi ubuntu useradd
ubuntu创建账号的方式通常用到两种：useradd 和adduser . 本人尝试了useradd方法，步骤如下： 1:useradd 使用useradd时，如果后面不加任何参数的话，如：sudo useradd sysadm 创建出来的用户将是默认的三无用户：无home directory ,无密码,无系统shell。顾应该如下操作：
第五章常用Lua开发库2-JSON库、编码转换、字符串处理 jinnianshilongnian nginx lua
JSON库在进行数据传输时JSON格式目前应用广泛，因此从Lua对象与JSON字符串之间相互转换是一个非常常见的功能；目前Lua也有几个JSON库，本人用过cjson、dkjson。其中cjson的语法严格（比如unicode \u0020\u7eaf），要求符合规范否则会解析失败（如\u002），而dkjson相对宽松，当然也可以通过修改cjson的源码来完成
Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解 yaerfeng1989 timer quartz 定时器
原创整理不易，转载请注明出处：Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解代码下载地址：http://www.zuidaima.com/share/1772648445103104.htm 有两种流行Spring定时器配置：Java的Timer类和OpenSymphony的Quartz。 1.Java Timer定时首先继承jav
Linux下df与du两个命令的差别？ pda158 linux
　一、df显示文件系统的使用情况，与du比較，就是更全盘化。　　最经常使用的就是 df -T，显示文件系统的使用情况并显示文件系统的类型。　　举比例如以下：　　[root@localhost ~]# df -T 　　Filesystem Type &n
[转]SQLite的工具类 ---- 通过反射把Cursor封装到VO对象 ctfzh VO android sqlite 反射 Cursor
在写DAO层时，觉得从Cursor里一个一个的取出字段值再装到VO(值对象)里太麻烦了，就写了一个工具类，用到了反射，可以把查询记录的值装到对应的VO里，也可以生成该VO的List。使用时需要注意：考虑到Android的性能问题，VO没有使用Setter和Getter，而是直接用public的属性。表中的字段名需要和VO的属性名一样，要是不一样就得在查询的SQL中
该学习笔记用到的Employee表 vipbooks oracle sql 工作
这是我在学习Oracle是用到的Employee表，在该笔记中用到的就是这张表，大家可以用它来学习和练习。 drop table Employee; -- 员工信息表 create table Employee( -- 员工编号 EmpNo number(3) primary key, -- 姓

《Java编程思想》读书笔记 —— 第13章 字符串