CoreJava学习1――字符串处理(String和StringBuilder)&正则式

这里把以前学习Java的笔记整理了发布上来,分为多个系列,后续会发布。

本文分为:

1.Object

2.String和StringBuilder

3.Java中的正则式处理

4.Commons-lang

--------------------------------------------------------------

一、Object

在Java继承结构中,位于最顶端,是被子类默认继承,一切皆对象!

1、toString方法

表示返回对象的字符串,默认返回的格式为“类名@hashCode值”是对象的句柄,但一般是根据具体需要重写该方法,使其返回更有意义的信息。

2、equals方法

用于定义对象的比较规则(对象的相等逻辑)。public boolean equals(Object obj),通常用于引用类型的比较。重写的目的是比较两个对象“长得像不像”。

原形:

public boolean equals(Oject obj){return this==obj}

在比较逻辑中,在比较内容前一定要看两个对象是否是同一类型。

重写我们是看实际定义类的需求,并不是说在比较内时要求所有的属性都相等。


二、String和StringBuilder

1、String

java封装的字符系列,采用unicode编码在内存中存储字符串,任何一个字符都占用2个字符。

特点:字符串是一个不变的对象,对象一旦创建就不会改变。

是引用类型,但是java为使用方便,允许为该引用类型变量赋直接量(字面量)。

String特性(常量池):处于性能考虑,java会将所有出现的字符串缓存在常量池中。

常量池:是JVM用于管理字符串开辟的一段内存空间。这么做,目的是尽最大可能重用字符串。

注:/*** java在编译源程序时,发现运算两次的内容都是字面量时候,会进行优化,

* 直接在编译的过程中就计算了结果,这样避免每次运行是在进行计算减低了性能。

* String str5 = "wor"+"ld";//源程序的样子(.java)

* String str5 = "world";//字节码中的样子(.class)

*/


String重写了Object的equals(),String还提供了equalsIgnoreCase,另外一个比较方法,用于忽略大小写来比较。

equals书写习惯:字面量.equals(变量)。因为如果字面量写在前面即使变量为空也不会出现空指针异常,反之可能会出现异常。

String常用方法:

1)String toLowerCase():返回该字符串的小写形式。

2)String toUpperCase():返回该字符串的大写形式。

3)String trim():返回字符串为原始字符串去掉前导和后继的空白(空格\t\n\r...)。

4)boolean startsWith(String prefix):判断字符串时候否以参数字符串开头。

5)boolean endsWith(String suffix):判断字符串时候否以参数字符串结尾。

6)int length():返回字符串的长度。

7)indexOf方法

用于实现在字符串中检索另外一个字符串,提供了相关重载方法:

int indexOf(String str):在字符串中检索str,返回第一出现的位置,如果没有则返回-1。

int indexOf(String str,int fromIndex):和上一个方法类似,但是是从字符串的fromIndex位置处开始检索。

int lastIndexOf(String str,int from):和indexOf相似,只是在str字符串中多次出现时,返回最后一个出现的位置。

8)charAt方法

char charAt(int index):用于返回字符串指定位置的字符,参数index表示指定的位置。

这里可以运用这个方法来判断一字符串是否是回文,如:

String str = "山西落雁塔雁落西山";

for (int i = 0; i < str.length()/2; i++) {

   if (str.charAt(i)!=str.charAt(str.length()-1-i)) {

       System.out.println("不是回文");

       return;

   }

}

9)substring方法

返回字符串的字串。

String substring(int beginIndex,int endIndex):返回字符串从下标beginIndex(包含)开始到endIndex(不包括)结束的子串。

String substring(int beginIndex):返回字符串从下标beginIndex(包含)开始到结束的子串。

10)getBytes方法

用于获取字符串对应二进制序列。

byte[] getBytes(String charsetName):按照指定编码来获取

byte[] getBytes():按照系统默认编码来获取


补充:

常见编码集

GBK:国标码

GB2312:支持繁体字的国标码

ISO8859-1:欧洲标准

UTF-8:通用的国际编码集


补充:

正则表达式

描述:正则表达式是一串特定的字符,组成一个“规则字符串“,这个规则字符串是描述文本规则的工具,正则表达式就是记录文本规则的代码。

例如:正则式“[a-z]”表示a到z的任意一俄国字符,正则表达式“[a-z]+”表示有一个或多个字符串组成的字符串。

正则式既然是一种字符串组合的规则,那么我们就可以按着规则组合自己想要的正则式。


[]:代表可以出现一个字符

[abc]这个字符可以是a或b或c

[^abc]不能是a或b或c的其他字符

[a-z]这个字符只能是小写字母

[a-zA-Z0-9]可以是字母或数字

[a-z&&[^bc]]是小写字母但不能是b或c

. :任意一个字符

\d:任一一个数字,等同[0-9]

\D:任一一个非数字字符,

等同[^0-9]

\s:任一一个空白字符

\S:非空白字符

\w:单词字符 [0-9a-zA-Z_]

\W:非单词字符[^\w]


量词:

?:表示0-1次

[\w]?:表示0或1个单词字符

[\w][\w]?:表示1或2个单词字符


*:表示0-无穷次

[\d]*:任意次数字

[\d][\d]*:至少一次


+:表示1-无穷次

[\d]+:至少一个数字


{n}:n次.n只能是数字

[\d]{11}:11次数字


{n,}:n次以上

{n,m}:n到m次

[\d]{3,5}:3-5位的数字


():将内容看作一个整体

(abcd):要出现一个abcd

(abcd)+:至少一次abcd

()中可以使用或关系。在几个整体中选其一

(138|135|130):是138或135或130


下面列出常见的正则式:

[abc] a,b,c中任意一个字符

[^abc] 除了a,b,c任意一个字符

[a-z] a~z的任意一个字符

[a-zA-Z0-9] a~z,A~Z,0~9中任意一个字符

[a-z&&[^bc]] a~z中除了b,c以外任意一个字符,其中&&表示“与”的关系。


. 任意一个字符

\d 任意一个数字字符,相当于[0-9]

\D 任意一个非数字字符,相当于[^0-9]

\s 空白字符,相当于[\t\n\x0B\f\r]

\S 非空白字符,[^\s]

\w 任意一个单词字符,[a-zA-Z_0-9]

\W 任意一个非单词字符,[^\w]


X? 表示0个或1个X

X* 表示0个或任意多个X

X+ 表示0到任意多个X(大于等于1个X)

X[n] 表示n个X

X[n,] 表示n到任意多个X(大于等于n个X)

X[n,m] 表示n个到m个X(大于等于n个且小于m个X)


10)split方法

将字符串按照特定的分割符拆分成字符串数组。

String[] split(String regex):参数regex为正则式,以regex所表示的字符串为分割符,将字符串拆分成字符串数组。


11)replace方法

用于字符串的替换操作。

String replaceAll(String regex,String replacement):将字符串中匹配正则表达式regex的字符串替换成replacement。


2、Commons-lang

Commons-lang是Apache Commons项目中的一个组件,针对JDK官方的java.lang包中的类提供了一些使用的补充,运用很广。

StringUtils是commons-lang包中提供的,针对对字符串操作的工具类,该类提供了一系列静态实用方法:

1)String repeat(String str,int repeat):重复字符串若干次。

2)String join(Object[] array,String separator):将一个数组中的元素连接成字符串。

3)String leftPad(String str, int size, char padChar):向左边填充指定字符以达到指定长度。

4)String rightPad(String str, int size, char padChar):向右边填充指定字符以达到指定长度。

实用的方法很多,可以使用的时候去查看相关API。


3、StringBuilder

与String最大的不同就是它封装可变的字符串,而String是不可变的。对象创建后可以通调用方法来改变字符串序列。

它具有的构造方法如下:

public StringBuilder();

public StringBuilder(String str);

StringBuilder提供了append、insert、delete、replace等方法,用于对其封装的字符序列进行追加、插入、删除、替换等操作。


StringBuilder的很多方法返回都是StringBuilder,return this。

在改变之后又返回了该对象的引用。


String, StringBuffer StringBuilder的区别。

String的长度是不可变的字符串。

StringBuffer的长度是可变的字符串,如果你对字符串中的内容经常进行操作,特别是内容要修改时,那么使用StringBuffer,如果最后需要String,那么使用StringBuffer的toString()方法。它是线程安全的。

StringBuilder是从 JDK 5 开始,为StringBuffer该类补充了一个单个线程使用的等价类,通常应该优先使用 StringBuilder 类,因为它支持所有相同的操作,但由于它不执行同步,所以速度更快。


你可能感兴趣的:(java,String,object,lang,StringBuilder)