Java String.split()函数的用法和正则表达式

在java.lang包中有String.split()方法的原型是:
public String[] split(String regex, int limit)
split函数是用于使用特定的切割符(regex)来分隔字符串成一个字符串数组,函数返回是一个数组。在其中每个出现regex的位置都要进行分解。
需要注意是有以下几点:
(1)regex是可选项。字符串或正则表达式对象,它标识了分隔字符串时使用的是一个还是多个字符。如果忽略该选项,返回包含整个字符串的单一元素数组。
(2)limit也是可选项。该值用来限制返回数组中的元素个数。
(3)要注意转义字符:“.”和“|”都是转义字符,必须得加”\”。同理:*和+也是如此的。
如果用“.”作为分隔的话,必须是如下写法:
String.split(“\.”),这样才能正确的分隔开,不能用String.split(“.”);
如果用“|”作为分隔的话,必须是如下写法:
String.split(“\|”),这样才能正确的分隔开,不能用String.split(“|”);
(4)如果在一个字符串中有多个分隔符,可以用“|”作为连字符,比如:“acountId=? and act_id =? or extra=?”,把三个都分隔出来,可以用
String.split(“and|or”);
(5)split函数结果与regex密切相关,常见的几种情况如下所示:

public class SplitTest {
    public static void main(String[] args) {
        String str1 = "a-b";        
        String str2 = "a-b-";
        String str3 = "-a-b";
        String str4 = "-a-b-";
        String str5 = "a";
        String str6 = "-";
        String str7 = "--";
        String str8 = "";

        split(str1);
        split(str2);
        split(str3);
        split(str4);
        split(str5);
        split(str6);
        split(str7);
        split(str8);
    }
    public static void split(String demo){
        String[] array = demo.split("-");
        int len = array.length;
        System.out.print("\"" + demo + "\" 分割后的长度为:" + len);
        if(len >= 0)
        {
            System.out.print(",分割后的结果为:");
            for(int i=0; i<len; i++)
            {
                System.out.print(" \""+array[i]+"\"");
            }           
        }
        System.out.println();
    }
}

运行结果为:
“a-b” 分割后的长度为:2,分割后的结果为: “a” “b”
“a-b-” 分割后的长度为:2,分割后的结果为: “a” “b”
“-a-b” 分割后的长度为:3,分割后的结果为: “” “a” “b”
“-a-b-” 分割后的长度为:3,分割后的结果为: “” “a” “b”
“a” 分割后的长度为:1,分割后的结果为: “a”
“-” 分割后的长度为:0,分割后的结果为:
“–” 分割后的长度为:0,分割后的结果为:
“” 分割后的长度为:1,分割后的结果为: “”
由此可以得出来:
当字符串只包含分隔符时,返回数组没有元素;
当字符串不包含分隔符时,返回数组只包含一个元素(该字符串本身);
字符串最尾部出现的分隔符可以看成不存在,不影响字符串的分隔;
字符串最前端出现的分隔符将分隔出一个空字符串以及剩下的部分的正常分隔。

下面是一些正则表达式:

1。^\d $  //匹配非负整数(正整数 0) 
2。^[0-9]*[1-9][0-9]*$  //匹配正整数 
3。^((-\d )|(0 ))$  //匹配非正整数(负整数 0) 
4。^-[0-9]*[1-9][0-9]*$  //匹配负整数 
5。^-?\d $    //匹配整数 
6。^\d (\.\d )?$  //匹配非负浮点数(正浮点数 0) 
7。^(([0-9] \.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9] )|([0-9]*[1-9][0-9]*))$  //匹配正浮点数 
8。^((-\d (\.\d )?)|(0 (\.0 )?))$  //匹配非正浮点数(负浮点数 0) 
9。^(-(([0-9] \.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9] )|([0-9]*[1-9][0-9]*)))$  //匹配负浮点数 
10。^(-?\d )(\.\d )?$  //匹配浮点数 
11。^[A-Za-z] $  //匹配由26个英文字母组成的字符串 
12。^[A-Z] $  //匹配由26个英文字母的大写组成的字符串 
13。^[a-z] $  //匹配由26个英文字母的小写组成的字符串 
14。^[A-Za-z0-9] $  //匹配由数字和26个英文字母组成的字符串 
15。^\w $  //匹配由数字、26个英文字母或者下划线组成的字符串 
16。^[\w-] (\.[\w-] )*@[\w-] (\.[\w-] ) $    //匹配email地址 
17。^[a-zA-z] ://匹配(\w (-\w )*)(\.(\w (-\w )*))*(\?\S*)?$ //匹配url 
18。匹配中文字符的正则表达式: [\u4e00-\u9fa5] 
19。匹配双字节字符(包括汉字在内):[^\x00-\xff]
20。应用:计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)
String.prototype.len=function(){return this.replace([^\x00-\xff]/g,"aa").length;} 
21。匹配空行的正则表达式:\n[\s| ]*\r 
22。匹配HTML标记的正则表达式:/<(.*)>.*<\/\1>|<(.*) \/>/ 
23。匹配首尾空格的正则表达式:(^\s*)|(\s*$)


----------
1、^\S [a-z A-Z]$ 不能为空 不能有空格 只能是英文字母 
2、\S{6,} 不能为空 六位以上
3、^\d $ 不能有空格 不能非数字
4、(.*)(\.jpg|\.bmp)$ 只能是jpg和bmp格式 
6、^0$ 至少选一项 
7、^0{2,}$ 至少选两项 
8、^[\s|\S]{20,}$ 不能为空 二十字以上 
9、^\ ?[a-z0-9](([- .]|[_] )?[a-z0-9] )*@([a-z0-9] (\.|\-)) [a-z]{2,6}$邮件 
10、\w ([- .]\w )*@\w ([-.]\w )*\.\w ([-.]\w )*([,;]\s*\w ([- .]\w )*@\w ([-.]\w )*\.\w ([-.]\w )*)*
输入多个地址用逗号或空格分隔邮件 
11、^(\([0-9] \))?[0-9]{7,8}$电话号码7位或8位或前面有区号例如(022)87341628 
12、^[a-z A-Z 0-9 _] @[a-z A-Z 0-9 _] (\.[a-z A-Z 0-9 _] ) (\,[a-z A-Z 0-9 _] @[a-z A-Z 0-9 _] (\.[a-z A-Z 0-9 _] ) )*$ * 只能是字母、数字、下划线,必须有@和.同时格式规范邮件 
13、 ^\w @\w (\.\w ) (\,\w @\w (\.\w ) )*$上面表达式也可以写成这样子,更精练。 
14 、^\w ((-\w )|(\.\w ))*\@\w ((\.|-)\w )*\.\w $

你可能感兴趣的:(Java-List,java基础)